Samsara是一家于2021年上市的车队管理SaaS提供商,该公司首席执行官认为,优化AI策略(或任何新兴的技术策略)的唯一方法就是采用自下而上的方法。Franchetti表示:“一年前,当生成式AI爆发时,Samsara一开始采取了相当严格的方法,因为我们不了解这项技术,当时我们的重点是设置护栏以保护隐私和安全。”
但在团队花了更多时间研究这项技术后,他们取消了这些限制。他说:“既然我们已经认识到生成式AI可以带来什么,今年我们的政策就会发生巨大的变化。我们希望这项技术尽可能地接近我们的知识工作者和领域专家,希望赋予他们这些能力,让他们进行实验和创造。”
Franchetti承认,KPI和结果驱动的方法仍然适合许多技术的部署,但“有机的方法更适合AI,因此我们的资深软件开发领域专家可以在没有目标业务成果的情况下展开创新,当然,这些技术必须重新集成到更大的架构中,IT团队可以帮助他们做到这一点。”
在调动员工资源来尝试生成式AI之后,Franchetti开始看到这么做带来的影响。他说:“我们已经看到很多有前途的试点项目正在生产环境中不断迭代。”
他还看到了AI在IT帮助台、客户支持、销售和营销的专用工具中进行概念验证带来的积极成果。他说:“我们也在尝试通用型的copilot,我们发布了几种可供员工尝试的选项,一种是商用大型语言模型服务,另一种是开源服务。”Samsara公司的员工将这些通用助手应用于各种用例,例如编写文档和工作描述、调试代码或编写API端点。
例如,通过使用大型语言模型功能生成代码,这样Samsara的工程师就可以更高效地生成样板代码以及代码文档和注释,这对公司来说是一项关键的实践。Franchetti补充说:“我们有一些工程师的第一语言不是英语,因此把AI引入评论和文档对他们的工作是有帮助的。”
Franchetti花了一年时间研究这种自下而上的AI创新方法,并提出了一些建议:
不要将“全民创造”仅限于工程师的范畴:Franchetti估计,在Samsara公司,工程师只使用了50%的AI,但另一半则用于法律、销售、营销、财务和客户支持。
不要让当前的架构阻碍你:Franchetti承认,像Samsara这样诞生于云端的公司,在AI方面比那些运行在遗留基础设施上的老企业来说有巨大的飞跃,但这并不意味着后者就不能从自下而上的方法中受益。“我相信无论你的架构是怎样的,你的员工都可以进行实验。他们可以通过使用AI生成营销物料甚至是财务对账来提高生产力。他们可以在任何环境中执行此类操作,因为这些特定工具不依赖于与更广泛架构的集成。”
清理企业数据:如果没有清理数据,AI生成的结果就是有局限性的。Franchetti表示:“AI和生成式AI的力量来自于与模型共享上下文的能力,因此模型可以理解你的环境并进行微调,为你提供更好的答案,AI一开始并不了解业务,但当它接受数据训练的时候,就会变成专家。”当数据来自不同的系统以及事实来源相互冲突的时候,AI不具备所需背景以变得更加聪明。
对规模进行选择:随着如此多的全民创造正在进行中,CIO们需要制定一个流程来选择把哪些试点发展成为企业解决方案。为了确保你把时间和金钱花在最有潜力的解决方案上,Franchetti建议要关注结果。他说:“当一个工具做到了我们想要做的事情,我们会问实现了哪些可衡量的业务成果,它会提高客户满意度吗?它会提高生产力吗?提高多少?”
例如,Samsara公司的技术团队在过去几个月中一直在内部IT服务台尝试使用AI。“我们部署了一项由大型语言模型支持的技术,使我们能够在Slack内部署机器人以解决服务台支持的问题。如今,我们有35%的IT支持是完全自动化的。这是一个可衡量的改进结果,使我们的支持工程师能够专注于更高阶的工作上。”取得这些成果后,团队开始尝试类似的客户服务大型语言模型,他们预测,这将使客户支持代理的工作效率提高20%。“现在我们正在扩展和部署这个模型,因为我们已经能够对其进行衡量了。”
好文章,需要你的鼓励
很多人担心被AI取代,陷入无意义感。按照杨元庆的思路,其实无论是模型的打造者,还是模型的使用者,都不该把AI放在人的对立面。
MIT研究团队提出递归语言模型(RLM),通过将长文本存储在外部编程环境中,让AI能够编写代码来探索和分解文本,并递归调用自身处理子任务。该方法成功处理了比传统模型大两个数量级的文本长度,在多项长文本任务上显著优于现有方法,同时保持了相当的成本效率,为AI处理超长文本提供了全新解决方案。
谷歌宣布对Gmail进行重大升级,全面集成Gemini AI功能,将其转变为"个人主动式收件箱助手"。新功能包括AI收件箱视图,可按优先级自动分组邮件;"帮我快速了解"功能提供邮件活动摘要;扩展"帮我写邮件"工具至所有用户;支持复杂问题查询如"我的航班何时降落"。部分功能免费提供,高级功能需付费订阅。谷歌强调用户数据安全,邮件内容不会用于训练公共AI模型。
华为研究团队推出SWE-Lego框架,通过混合数据集、改进监督学习和测试时扩展三大创新,让8B参数AI模型在代码自动修复任务上击败32B对手。该系统在SWE-bench Verified测试中达到42.2%成功率,加上扩展技术后提升至49.6%,证明了精巧方法设计胜过简单规模扩展的技术理念。