麻省理工学院首席数据官及信息质量研讨会于上周正式举行——受疫情影响,此次会议照例采取线上形式。虚拟会议效果良好,甚至吸引到全球更多受众的广泛参与。实际上,我还没见过哪场技术会议能够像Netflix一样吸引到观众整整一个周末的热情参与,其中也出现了不少有趣且值得关注的重要问题。虽然大家还是希望能亲赴麻省理工参会,不过虚拟形式也不错,至少比停办好得多。
来自台湾的数字化领袖
虚拟会议的一大核心优势,在于吸纳全球各地的主讲人带来精彩内容。我自以为已经对麻省理工研讨会相当了解,过去14年间也已经多次亲身参与。但此次来自台湾的开幕式主讲人Audrey Tang确实触及了我的认知盲区。根据资料,Tang曾是一位编程语言开发者,专门从事过黑客工作,后来又担任苹果公司顾问。尤其让人意味不到的,是她是一位变性者,主动选择成为女性。在此次演讲中,她谈到台湾地区如何采用一系列创新手段以跟踪人群接触、活动定位以及口罩分配,同时努力避免外来游客受到感染。面对这样一位典型的非传统技术领导者,我们不禁要为台湾方面的创新魄力点赞。
德勤专家组描述如何将实用主义与“AI优先”相结合
从某种程度上讲,德勤可以算是此次会议的赞助商。德勤方面组织了一支主题演讲小组,其中几位来自创新企业客户的代表介绍了不少数据管理创新案例。虽然这些议题从表面上看关注数据统一,但实际上还涉及众多更为广泛的主题。两位客户发言人分别来自戴尔(公司供应链数据分析与自动化主管Aditya Ramachandran)以及健康保险巨头Anthem首席分析与数据官Ashok Chennuru。德勤咨询公司首席数据官Juan Tello也探讨了德勤在与客户合作方面抱持的几项基本观点。
这里要特别聊聊来自戴尔的Ramachandran,我对他提到的务实派数据架构方法特别感兴趣。他强调称,戴尔原本可以将所有供应链数据一股脑放进同一套新的数据湖内,或者分别针对各个用例进行处理。但最终,戴尔选择了一种二者相权的方法,即为所有供应链数据资产建立一套“数据规范模型”;而随着高优先级用例的出现,戴尔开始将部分数据引入数据湖内。他还提到了戴尔对于AI与分析类应用程序部署工作的关注,我相信这也代表着疫情时代下企业运营中的一种重要趋势。
Chennuru的观点同样值得关注,他将Anthem公司采用的方法总结为“数字化优先、AI驱动”。受演讲时长所限,他无法一一评述Anthem的相关计划,只是简要介绍了几个与COVID-19相关的项目。例如,Anthem正努力帮助医护人员得以访问患者的纵向健康记录,使用远程医疗服务提高抗疫工作的智能化水平。他们还使用AI技术帮助患者识别COVID-19病患。Chennuru也提到了构建工作流平台的重要性,该平台能够将分析与AI功能嵌入员工或医护人员的日常任务流程当中。他强调道,“这些技术元素必须一事一议、因地制宜,想用一套方案横跨多种应用场景完全就是痴人说梦。”
使用AI技术协助数据管理的话题也由此浮出水面。来自德勤的Tello谈到了我之前曾经见过、而且给我留下深刻印象的德勤“CogniSteward”解决方案。在后续介绍中,Tello将该解决方案描述为一款自动化机器人,能够使用分析、语义模型以及认知技术等帮助组织加快洞见的收集过程,并全面将以往只能通过手动方式完成的高成本数据管理活动转为自动化形式。该解决方案还能够帮助企业快速对数据内的关系蚝可视化,同时提高数据的准备水平与质量。Aditya Ramachandran也提到,戴尔公司正在使用机器学习模型对供应链生态系统中的各组件进行分类并添加属性,并在总体上将AI技术视为数据协调工作的优先选项。
德意志银行与主动出击的五步走战略
当天下午晚些时候,Shivaji Dasgupta从慕尼黑为会议带来“银行业的数据战略与人工智能”,特别是他担任首席数据官兼AI/分析主管的德意志银行的具体举措。之前,我曾与Dasgupta合作撰写过一篇文章,探讨如何建立AI卓越中心。在此次演讲中,他谈到多个主题,包括如何转型为面向平台的商业模式,以及如何将数据从面向防御的方法转化为主动出击的方法。他介绍了德意志银行在这项战略中将数据策略分为五个具体步骤——从第一步中的遵循监管合规要求,到第四步中的广泛应用AI技术,再到第五步中由银行向客户提供数据与基于AI的产品等。他充分证明了,德意志银行已经为第四步战略建立起良好的基础,并在第五步范畴之内建立起试点应用。我个人强烈建议各位首席数据官认真了解这种简单明了的进度表示方法。
CDO职能角色中的分歧
最后,NewVantage Partners的Randy Bean带领一支由大企业首席数据官及分析师组成的小组,探讨了关于CDO这一职务本身的话题。小组成员们谈到了组织之内,乃至全球CDO职务的复杂性因素。Mastercard的JoAnn Stonier介绍了她作为CDO在数据伦理问题方面的独特关注重点。美国运通新任首席数据官Danielle Crop介绍了他们在构建高效数据平台方面的进展。CSV/Aetna的Bob Darin描述了他自己的职能角色组合:CSV Health与Aetna合并业务的首席数据官,以及CVS Pharmacy首席分析官。Bristol Myers Squibb公司首席数据官Krishna Cheriath带来一个有趣的案例,即如何将数据与分析拆分开来并分别向首席信息官报告。最后,来自中国银行的首席数据官Richard Goldberg提醒我们,在中国的数字原生企业当中,大型传统企业所占的比例其实非常有限。美国的老牌企业在这方面也曾落后,但我坚信,这些传统组织将很快意识到问题的严重性、并持续加快对数字化转型的关注程度。
总体而言,本届会议汇聚起丰富的观点与意见,同时提醒我们首席数据官的职能虽在不断变化、但已经建立起广泛的认同度。全世界的企业与组织都意识到,数据将成为其发展战略与商业模式的命脉,因此必须对这方面事务指定专门的高层主管。这就是客观现实,即使是肆虐的疫情也无法阻挡。
好文章,需要你的鼓励
谷歌DeepMind发布AlphaEarth Foundations AI模型,能处理每日数TB卫星数据追踪地表变化。该模型如"虚拟卫星"般将全球陆地和沿海水域映射为数字表示,帮助科学家监测食品安全、森林砍伐、城市扩张等关键问题。模型整合光学卫星图像、雷达、激光测绘等数据源,以10×10米精度追踪变化,错误率比其他模型低24%。
阿联酋穆罕默德·本·扎耶德人工智能大学研究团队开发出轻量级语音合成系统LLMVoX,仅用3000万参数就能让任何大语言模型获得流式语音输出能力。该系统实现475毫秒超低延迟,词错误率仅3.7%,支持多语言扩展,可与视觉语言模型集成,为AI语音交互提供了"即插即用"的革命性解决方案。
ChatGPT虽然是目前最受欢迎的AI聊天机器人,但它并非万能。文章指出11个不应该使用ChatGPT的场景:诊断健康问题、处理心理健康、紧急安全决策、个人财务税务规划、处理机密数据、违法行为、学术作弊、监控实时信息、赌博预测、起草法律文件以及创作艺术。AI可能产生错误信息、缺乏实时数据更新,在高风险场景下可能造成严重后果。用户应了解其局限性,在关键决策时寻求专业帮助。
清华大学团队开发出革命性人形机器人系统Being-0,具备类人思维能力。该系统采用创新的"三层大脑"架构:顶层基础模型负责理解指令和制定策略,中间层连接器模块负责将计划转化为具体动作,底层技能库负责执行各种操作。机器人能够理解自然语言,自主规划复杂任务如制作咖啡,并在动态环境中灵活调整策略,在长期任务中达到84.4%的成功率。