Gartner今日发布了影响数据科学与机器学习(DSML)未来方向的重要趋势。随着DSML行业的快速发展和演变,数据对于人工智能(AI)开发与运用的重要性日益提高,尤其是投资重点也正转向生成式人工智能领域。
Gartner研究总监Peter Krensky表示:“随着机器学习在各个行业的应用持续快速扩大,DSML也正从单纯侧重于预测模型转向更加普及化、动态化和以数据为中心的技术领域,而且生成式人工智能(AI)的热潮也助推了这一趋势。尽管潜在风险不断出现,但面向数据科学家及其组织的新功能和用例也层出不穷。”
Gartner研究显示,影响DSML行业未来方向的重要趋势包括:
趋势1:云数据生态系统
数据生态系统正在从独立软件或混合式部署模式过渡到彻底的云原生解决方案。Gartner 预计,到 2024 年50%的新增云端部署系统将基于一致的云数据生态系统,而非手动集成的单点解决方案。
Gartner建议企业机构对数据生态系统的两种能力进行评估:一是解决数据分散化问题;二是访问自身环境之外的数据并与之集成。
趋势2:边缘AI
企业机构越来越需要通过边缘AI在边缘位置创建和处理数据,这将帮助企业机构获得实时洞察力,发掘新业务模式并满足严格的数据隐私要求。边缘AI还能帮助企业机构提高AI的开发、编排、集成和部署能力。
Gartner 预测,到 2025 年超过55%的深度神经网络数据分析将发生在边缘系统的数据捕获点,而 2021 年这一比例还不到 10%。企业机构应确定,需要将哪些应用、AI训练和推理能力转移至物联网终端附近的边缘环境。
趋势3:负责任的AI
负责任的AI使AI成为一种积极力量,而不是对社会和AI自身的威胁。当企业机构需采用AI做出商业逻辑和道德伦理的正确选择时,会遇到许多问题,例如商业和社会价值、风险、信誉、透明度和问责制等。负责任的AI有助于解决这些问题。Gartner 预测,到 2025 年1% 的AI服务提供商将大规模使用预训练的AI模型,使负责任的AI成为社会关注的焦点。
Gartner 建议企业机构在挖掘AI的价值时应考虑风险系数,并且在运用AI解决方案和模型时保持谨慎。应当让供应商做出管理好自身风险与合规义务的保证,以防止给企业机构造成潜在的经济损失、法律诉讼和声誉损害。
趋势4:以数据为中心的AI
这一方法不再以模型和代码为中心,而是以数据为中心打造更强大的AI系。企业机构将采用AI专用数据管理、合成数据以及数据标记技术等解决方案来应对许多数据难题,例如数据的可访问性、数量、隐私性、安全性、复杂性和范围。
使用生成式AI创建合成数据是一个正在快速发展的领域,这项技术减轻获取真实世界数据的负担,可更有效地训练机器学习模型。Gartner 预测,到 2024 年60%的AI数据将是合成数据,被用于模拟现实、未来场景和降低AI风险,而 2021 年的这一比例仅为 1%。
趋势5:加快AI投资
进入解决方案实施阶段的企业机构,以及希望通过AI技术和相关业务实现增长的行业,将继续加快对AI的投资。 Gartner 预测,到 2026 年底依靠基础模型(通过海量数据训练过的大型模型)的AI初创企业将获得超过 100 亿美元的投资。
在Gartner近来针对2500多位企业高层的一项调研中,45%的受访者表示,最近的 ChatGPT热潮促使其增加了对AI的投资。70%的受访者表示其企业正处于研究和探索生成式AI的阶段,还有19%的人表示其企业已进入试点或生产阶段。
好文章,需要你的鼓励
穆拉蒂时隔18个月首次接受重大媒体采访,介绍其创立的Thinking Machines Lab正在开发的"交互模型"。该模型能以200毫秒间隔处理音频、文本和视频流,捕捉人类交流中的中断、修正和停顿。她还谈及OpenAI"政变周"经历,强调行业决策权过于集中的担忧,并回应了公司近期研究人员离职问题,表示这是初创实验室的正常波动。
STATE16研究院这篇综述发现,物理AI系统存在"静默失效"风险——AI以高度自信执行基于错误世界信息的动作,却不触发任何报警,并提出在AI输出与物理执行之间建立独立授权层的框架。
本期《Quick Charge》播客涵盖多个热点话题:特斯拉疑似试图删除FSD欺诈相关证据以规避巨额赔付;卡特彼勒持续推进建筑领域电气化布局;住宅太阳能30%税收抵免即将到期。此外,嘉宾Tom Pacheco就高压系统与电池技术培训展开探讨,强调电动车技术人才培养的紧迫性。节目同时提醒有意安装太阳能的用户尽快行动,可通过EnergySage平台比较多家安装商报价。
UIUC与微软联合研发的OpenWebRL框架让4B小模型仅凭400条初始数据,通过在真实网站上边做边学的强化学习方式,在网页智能体基准上超越了用27万条数据训练的竞争对手。