数据无处不在,但没有一兆字节可以视为理所当然。首席数据官(CDO)是负责从企业数据中获取最大价值的高管。CDO通常监督数据管理功能并制定组织的数据战略,包括数据治理、数据质量、数据分析和数据安全。
Liberty Mutual保险公司首席企业数据和数据科学官Emily Lyons表示,要成为有效的CDO,需要构建多种能力。在一次在线采访中,她指出需要深入了解所服务的业务,以及数据如何帮助该业务保持竞争力并推动成功。"这是制定强有力数据战略的关键。"
AI和数据服务公司Indicium的联合创始人兼CDO Daniel Avancini表示,CDO必须了解业务的每个部分,包括其挑战和机遇,以及数据和AI如何帮助高效解决这些挑战。在电子邮件采访中,他说,解决挑战通常意味着投资新的数据平台、聘请顶级数据工程师或举办如何更好使用现有工具的培训课程。"关键是首先关注业务目标,数据排在第二位。"
**拥抱变化**
当今的IT世界正在快速变化,影响着CDO的前进道路。Lyons说:"看看最近两年技术的进步,特别是生成式AI。理解新兴技术对路线图的影响并确定如何利用这些进步是成功的关键。"
Avancini对此表示赞同:"在过去20年中,我们从云计算发展到大数据,再到云数据仓库,现在是AI。跟上步伐很困难,但区分什么是炒作、什么是真实的更加困难。"
Lyons认为,成为成功的CDO需要一定的毅力。她解释说:"数据很有挑战性,永远不会完美。每个人都希望获得质量更高、格式更易用的更多数据。"然而,"好数据"实际上是什么样子的参数在不断变化。"将这一事实转化为你和团队的动力源泉,对于建立韧性至关重要。"
**内部支持**
Lyons强调建立牢固关系的必要性。"有效的数据管理需要跨多个团队的协作,包括技术、业务运营、法务和财务。"让所有这些团队朝着共同目标努力,特别是在产生和运营化强大数据和洞察方面,是关键所在。
打印机和复印机公司Konica Minolta的CIO Cathleen Lilli建议,CDO应与关键企业部门的同行合作寻找数据管理员和业务专家。在电子邮件采访中,她说:"这些人形成了推动成功并为数据添加背景的卓越中心。领导层优先级委员会将确保与业务优先级保持一致。"
Lyons说,每个人都在改善数据方面发挥作用,CDO最好让企业各团队成员持续审查和挑战他们的战略、方法和进展。她指出:"这些人将对数据如何帮助公司成功提供重要观点。CDO可以从具有不同背景的人那里获得宝贵见解。"
Avancini说,CDO需要C级高管支持来推动组织使用数据方式的任何有意义变化。他指出:"变化总是痛苦的,成为数据驱动型需要重新调整人员和流程,这往往会遇到阻力。"当AI进入画面时,这项任务变得更加具有挑战性,因为大规模变化可能威胁现有角色和职业道路。"高管支持不容商量。"
Avancini说,CDO还应努力赢得非高管员工的心智,向他们展示学习数据和AI技能并将其应用到日常工作中的重要性。他补充说:"虽然这种内部倡导很重要,但如果没有高层的支持,这还不够。"
**结语**
Lyons建议,CDO应始终明白他们为公司及其客户服务。她说:"总是存在过度关注达到完美的数据技术或治理而非数据进展的风险。"记住,进展是为客户提供真正价值的驱动力。"随着我们继续经历快速变化,拥抱成长心态并将变化视为机遇而非成功障碍至关重要。"
Lilli说,CDO应与高管同行合作创建数据驱动型组织,同时理解同事可能无法完全理解数据固有的复杂性。此外,CDO应避免采用过于僵化的数据管理方法,假设他们拥有所有解决方案。
好文章,需要你的鼓励
微软近年来频繁出现技术故障和服务中断,从Windows更新删除用户文件到Azure云服务因配置错误而崩溃,质量控制问题愈发突出。2014年公司大幅裁减测试团队后,采用敏捷开发模式替代传统测试方法,但结果并不理想。虽然Windows生态系统庞大复杂,某些问题在所难免,但Azure作为微软核心云服务,反复因配置变更导致客户服务中断,已不仅仅是质量控制问题,更是对公司技术能力的质疑。
Meta研究团队发现仅仅改变AI示例间的分隔符号就能导致模型性能产生高达45%的巨大差异,甚至可以操纵AI排行榜排名。这个看似微不足道的格式选择问题普遍存在于所有主流AI模型中,包括最先进的GPT-4o,揭示了当前AI评测体系的根本性缺陷。研究提出通过明确说明分隔符类型等方法可以部分缓解这一问题。
当团队准备部署大语言模型时,面临开源与闭源的选择。专家讨论显示,美国在开源AI领域相对落后,而中国有更多开源模型。开源系统建立在信任基础上,需要开放数据、模型架构和参数。然而,即使是被称为"开源"的DeepSeek也并非完全开源。企业客户往往倾向于闭源系统,但开源权重模型仍能提供基础设施选择自由。AI主权成为国家安全考量,各国希望控制本地化AI发展命运。
香港中文大学研究团队开发出CALM训练框架和STORM模型,通过轻量化干预方式让40亿参数小模型在优化建模任务上达到6710亿参数大模型的性能。该方法保护模型原生推理能力,仅修改2.6%内容就实现显著提升,为AI优化建模应用大幅降低了技术门槛和成本。