五月里不断发生一些的事件和出版的书籍将对数据、人工智能和分析世界产生深远的影响。这些事件和书籍涵括了应该(和不应该)做决定的方式以及领导者应如何塑造一个可持续的数据驱动文化等等各方面。下面我们快速回顾一下在过去一个月可能错过了的东西。
分析是数字转型的关键
如果读者从事技术工作,那么Gartner峰会应该是你不希望错过的活动,Gartner峰会通常充满了新的研究和惊喜。今年的数据与分析峰会定不会让雄心勃勃的首席数据官(CDO)失望。
根据研究公司Gartner的数据,拥有面向业务的关键绩效指标的CDO可以:
这对于那些认为数据应该成为其组织转型中心的人来说是个好消息。在过去的一年半里,CDO有机会塑造和推动他们公司的议程。其中72%的人表示,他们正在领导或大量参与数字化转型计划。
然而,那些知道如何将数据作为一种资产进行管理并利用它来推动创新的组织只是例外,而不是常规。
根据《哈佛商业评论》特别提到的一项调查,近七成的组织中仍在挣扎:
也许更令人担扰的是,“数据驱动能力”据说在下降;同一调查表明,受访者认为他们的组织是数据驱动型组织从37.8%降到24%,下降超过13个百分点。
那现在怎么办呢?
也许过去的战略已经无效了。也许,快速的技术颠覆对许多人来说挑战性太大了以至于无法应付,因为需要不可思议的转变,数据库管理就是一个很好的例子。这种不可思议的转变在今年的峰会上表示:
如果你的公司在未来24个月内存储和使用数据的方式将发生巨大变化,你需要建立什么能力来利用这一新的发展呢?
我笔者曾有机会与一些通过数据获得突破的企业领导人和数字原生代合作过并研究过他们的成功。我其实也没有什么神奇的公式,但我观察到“数据领导者”所表现出的至少3个特征,在这里分享一下。
3个特征为:
数据即才能
你会发现围绕“数据文化”和合理决策科学存在很多资源。关于这个主题的书实际上是上个月出版的,是我最近最喜欢的书:《Framers》和《Noise》,《Framers》的作者是Francis de Véricourt、Kenneth Cukier和Viktor Mayer-Schönberger,《Noise》的作者是Daniel Kahneman、Olivier Sibony和Cass R. Sunstein。这两本书都是雄心勃勃的数据管理人员必读之作。
这些书中的知识与诸如分析培训及“数据导师”等最佳实践结合起来就可以帮助企业建立“数据文化”的基础。不过,要评估维持这种文化的机会可以用到的一个好方法,那就是计算你的组织雇用“数据人”的百分比。
考虑一下这样的场景:领导者经常说,他们的竞争优势的来源是他们手下的人,而不仅仅是他们的产品或服务。如果这是真的,那么判断你公司的核心竞争力的最好方法就是看看你的员工和他们的职能。
上个星期的报道指星展银行首席执行官Piyush Gupta曾就这个话题发表过看法,他是这样说的,“我们现在越来越觉得自己是一家提供金融服务的技术公司,而不是一家传统银行”。我们的工程师人数是银行家人数两倍”,这一事实也许证明了我们公司质的转变。
我在月初就相关话题发布了一项LinkedIn问卷调查,问的问题是“你应当雇用占你公司总员工人数多少百分比的数据员工”。该问卷调查受到广泛关注,浏览次数接近80,000,投票次数为625。
你应该雇用占总雇员人数多少百分比的“数据雇员”?(Bruno Aziza on LinkedIN)
接受问卷访问之一的是受人尊敬的数据科学家、加州理工学院的Kirk Borne博士,他就“数据雇员”一词提供了有用的指导。他表示:
读者公司目前的比例是多少呢?建立“数据文化 ”需要书籍、培训、不间断的强化和墙上的各种海报。但数据文化是由你公司的组织结构图来维持的。所以要务必确保你的各种数字与你的雄心壮志相匹配。
数据即生态系统及相互连接的“数据网络”威力
建立“数据文化”时另一个重要的考虑因素是你的员工所接触到的数据类型。领导者们长久以来一直都在抱怨员工难于接触到他们公司的生产数据。不幸的是,这只是问题一个小小的部分。
伦敦劳埃德银行的数据产品主管Nick Blewden上个星期在网上的分享指,“数据近视”这个问题可能比你想象的还要严重。他发布的图片(下图)说出了全部情况:红点是你公司的数据(同样,你的团队可能很少看到今天这些数据),灰色区域是你可以看到的数据。
所有这些都指向一个值得关注的趋势:数据交换的崛起。我有机会在过去的一周里在DM电台播客里分享我对这个话题的看法,DM电台播客由Bloor集团的首席执行官Eric Kavanagh主持,可以在网上收听。而在宏观层面上,我们应该知道,最前卫的公司将数据视为一个“生态系统”机会,洞察力则来自于相互连接的“数据网络”所产生的数据组合。看看如下的数据
然而……目前只有5%的数据共享项目能正确识别可信数据和定位可信数据源。这也导出了我的第三个话题:数据结构。
数据即结构
“数据结构”这个词不是个新词。据维基百科介绍,这个词已经存在至少20年了,它的含义也在也被修改了多次。今年Gartner发布2021年十大数据和分析趋势时,这个词获得了巨大的关注。研究公司Gartner预测,数据结构大可:
值得注意的是,数据结构(Data Fabric)一词目前处于研究公司的数据管理炒作周期顶端,在这一阶段,客户的期望和解决方案的现实之间存在着最大差距。这些预测的内容很多,要进一步了解什么是数据结构什么不是,请参考Gartner的研究。
各个企业寻求部署数据结构,业界对其根本原因已有了很好的了解:由于数据越来越趋向于分布式(跨越数据湖、数据集市和数据仓库),类型(结构化、非结构化)和位置(在企业内部及跨云)高度多样化,数据和分析领导者面临着在不做重大取舍的前提下管理数据访问和治理的挑战。
在IT部门不能有效地管理数据及用户不能及时访问他们需要的信息时,创新就会受到影响。根据最近的维度数据(Dimensional Data)研究调查结果,68%的数据分析师有推动利润的想法但没有时间去实施。
该领域里越来越多的分析师指导可以有助于你形成自己的观点:一个很好的资源是IDC公司一个文档,关乎IDC称之为“数据控制平面”概念。
前文提到的书的作者Chandana Gopal、Stewart Bond和Dan Vesset很好地解释了这种跨整合、跨访问、跨治理和保护的新架构,解释提出了其中三层的作用,即:
好文章,需要你的鼓励
数字孪生技术正在改变网络安全防御模式,从被动响应转向主动预测。这种实时学习演进的虚拟副本让安全团队能够在威胁发生前预见攻击。组织可以在数字孪生环境中预演明日的攻击,将防御从事后反应转变为事前排演。通过动态更新的IT生态系统副本,团队可在真实条件下压力测试防御体系,模拟零日漏洞攻击并制定应对策略,从根本上重塑网络安全实践方式。
香港中文大学联合上海AI实验室推出Dispider系统,首次实现AI视频"边看边聊"能力。通过创新的三分式架构设计,将感知、决策、反应功能独立分离,让AI能像人类一样在观看视频过程中进行实时交流,在StreamingBench测试中显著超越现有系统,为教育、娱乐、医疗、安防等领域的视频AI应用开启新可能。
Linux内核开发面临动荡时期,Rust语言引入引发摩擦,多名核心开发者相继离职。文章介绍了三个有趣的替代方案:Managarm是基于微内核的操作系统,支持运行Linux软件;Asterinas采用Rust语言开发,使用新型framekernel架构实现内核隔离;Xous同样基于Rust和微内核设计,已有实际硬件产品Precursor发布。这些项目证明了除Linux之外,还有许多令人兴奋的操作系统研发工作正在进行。
Atla公司发布Selene Mini,这是一个仅有80亿参数的AI评估模型,却在11个基准测试中全面超越GPT-4o-mini。通过精心的数据筛选和创新训练策略,该模型不仅能准确评判文本质量,还能在医疗、金融等专业领域表现出色。研究团队将模型完全开源,为AI评估技术的普及和发展做出贡献。