Samsara是一家于2021年上市的车队管理SaaS提供商,该公司首席执行官认为,优化AI策略(或任何新兴的技术策略)的唯一方法就是采用自下而上的方法。Franchetti表示:“一年前,当生成式AI爆发时,Samsara一开始采取了相当严格的方法,因为我们不了解这项技术,当时我们的重点是设置护栏以保护隐私和安全。”
但在团队花了更多时间研究这项技术后,他们取消了这些限制。他说:“既然我们已经认识到生成式AI可以带来什么,今年我们的政策就会发生巨大的变化。我们希望这项技术尽可能地接近我们的知识工作者和领域专家,希望赋予他们这些能力,让他们进行实验和创造。”
Franchetti承认,KPI和结果驱动的方法仍然适合许多技术的部署,但“有机的方法更适合AI,因此我们的资深软件开发领域专家可以在没有目标业务成果的情况下展开创新,当然,这些技术必须重新集成到更大的架构中,IT团队可以帮助他们做到这一点。”
在调动员工资源来尝试生成式AI之后,Franchetti开始看到这么做带来的影响。他说:“我们已经看到很多有前途的试点项目正在生产环境中不断迭代。”
他还看到了AI在IT帮助台、客户支持、销售和营销的专用工具中进行概念验证带来的积极成果。他说:“我们也在尝试通用型的copilot,我们发布了几种可供员工尝试的选项,一种是商用大型语言模型服务,另一种是开源服务。”Samsara公司的员工将这些通用助手应用于各种用例,例如编写文档和工作描述、调试代码或编写API端点。
例如,通过使用大型语言模型功能生成代码,这样Samsara的工程师就可以更高效地生成样板代码以及代码文档和注释,这对公司来说是一项关键的实践。Franchetti补充说:“我们有一些工程师的第一语言不是英语,因此把AI引入评论和文档对他们的工作是有帮助的。”
Franchetti花了一年时间研究这种自下而上的AI创新方法,并提出了一些建议:
不要将“全民创造”仅限于工程师的范畴:Franchetti估计,在Samsara公司,工程师只使用了50%的AI,但另一半则用于法律、销售、营销、财务和客户支持。
不要让当前的架构阻碍你:Franchetti承认,像Samsara这样诞生于云端的公司,在AI方面比那些运行在遗留基础设施上的老企业来说有巨大的飞跃,但这并不意味着后者就不能从自下而上的方法中受益。“我相信无论你的架构是怎样的,你的员工都可以进行实验。他们可以通过使用AI生成营销物料甚至是财务对账来提高生产力。他们可以在任何环境中执行此类操作,因为这些特定工具不依赖于与更广泛架构的集成。”
清理企业数据:如果没有清理数据,AI生成的结果就是有局限性的。Franchetti表示:“AI和生成式AI的力量来自于与模型共享上下文的能力,因此模型可以理解你的环境并进行微调,为你提供更好的答案,AI一开始并不了解业务,但当它接受数据训练的时候,就会变成专家。”当数据来自不同的系统以及事实来源相互冲突的时候,AI不具备所需背景以变得更加聪明。
对规模进行选择:随着如此多的全民创造正在进行中,CIO们需要制定一个流程来选择把哪些试点发展成为企业解决方案。为了确保你把时间和金钱花在最有潜力的解决方案上,Franchetti建议要关注结果。他说:“当一个工具做到了我们想要做的事情,我们会问实现了哪些可衡量的业务成果,它会提高客户满意度吗?它会提高生产力吗?提高多少?”
例如,Samsara公司的技术团队在过去几个月中一直在内部IT服务台尝试使用AI。“我们部署了一项由大型语言模型支持的技术,使我们能够在Slack内部署机器人以解决服务台支持的问题。如今,我们有35%的IT支持是完全自动化的。这是一个可衡量的改进结果,使我们的支持工程师能够专注于更高阶的工作上。”取得这些成果后,团队开始尝试类似的客户服务大型语言模型,他们预测,这将使客户支持代理的工作效率提高20%。“现在我们正在扩展和部署这个模型,因为我们已经能够对其进行衡量了。”
好文章,需要你的鼓励
在我们的日常生活中,睡眠的重要性不言而喻。一个晚上没睡好,第二天的工作效率就会大打折扣,而充足的睡眠不仅能让我们恢复精力,还能帮助大脑整理和巩固当天学到的知识。有趣的是,AI模型竟然也表现出了类似的“睡眠需求”。
DeepSeek-AI团队通过创新的软硬件协同设计,仅用2048张GPU训练出性能卓越的DeepSeek-V3大语言模型,挑战了AI训练需要海量资源的传统观念。该研究采用多头潜在注意力、专家混合架构、FP8低精度训练等技术,大幅提升内存效率和计算性能,为AI技术的民主化和可持续发展提供了新思路。
尽管模型上下文协议(MCP)自11月推出以来用户数量快速增长,但金融机构等监管行业仍保持谨慎态度。银行等金融服务公司虽然在机器学习和算法方面是先驱,但对于MCP和Agent2Agent(A2A)系统的采用较为保守。监管企业通常只使用内部代理,因为其API集成需要经过多年审查以确保合规性和安全性。专家指出,MCP缺乏基本构建块,特别是在互操作性、通信标准、身份验证和审计跟踪方面。金融机构需要确保代理能够进行"了解您的客户"验证,并具备可验证的身份识别能力。
加拿大女王大学研究团队首次系统评估了大型视频语言模型的因果推理能力,发现即使最先进的AI在理解视频中事件因果关系方面表现极差,大多数模型准确率甚至低于随机猜测。研究创建了全球首个视频因果推理基准VCRBench,并提出了识别-推理分解法(RRD),通过任务分解显著提升了AI性能,最高改善幅度达25.2%。