端侧大模型有可能是最先引爆这一轮生成式AI的领域。
为什么这么说,与云侧大模型相比,端侧大模型可以更好地学习用户个人数据在本地实现智能化,而且数据不出端、不上云,隐私信息更安全。
IDC也预测,终端的AI化会成为AI发展与落地的重要支持方向。到2026年,中国市场中近50%的终端设备的处理器将带有AI引擎技术。
8月4日,华为开发者大会2023上,不仅HarmonyOS 4将受益于“盘古大模型”,华为还将大模型深度整合进手机系统,实现更高层次的融合,智慧助手小艺接入AI大模型能力,可以进行自然对话、会议纪要和辅助文案生成、图片二次创作等。
8月14日,小米年度发布会上,小米宣布自研13亿参数端侧大模型,在部分场景上可以媲美行业60亿参数的云端大模型,同时小米也将小爱同学升级大模型。
vivo预告了11月1日vivo开发者大会将发布全新手机操作系统OriginOS 4,首发搭载vivo自研AI大模型vivoLM。自研AI大模型矩阵包括十亿、百亿、千亿三个不同参数量级的5个自研大模型。
OPPO安第斯智能云团队打造了基于混合云架构的生成式大语言模型OAndesGPT。10月11日,OPPO宣布基于AndesGPT大模型打造的新版AI助手——新小布1.0开启了第一轮公测。
2023高通骁龙峰会期间,荣耀宣布荣耀Magic6系列将搭载第三代骁龙8移动平台,支持70亿参数的端侧AI大模型。灵动胶囊Magic Capsule可以基于眼神跟踪的多模态交互技术。YOYO助手提供简短提示来创建主题视频,甚至可以通过与YOYO助理对话更改背景音乐或模板。
几个月来,vivo、OPPO、小米的大模型也在两大中文大模型评测榜单C-Eval和CMMLU上“刷榜”了一波。
很多人会问,端侧芯片可以支持大模型的训练吗?一方面高通、联发科等芯片巨头也在探索将AI大模型植入端侧,一方面模型也在小型化,降低所需的资源和能耗,当然我们也看到未来大模型还是会向着云侧和端侧相结合发展。
本期《数字化转型方略》也将看看端侧代表们,在把大模型装进端侧上都做了哪些工作。我们也希望进一步看到未来随着端侧大模型对用户个人数据和习惯的学习成长,带来更深入的意图理解和更加个性化的复杂场景服务。
《数字化转型方略》2023年第10期:http://www.zhiding.cn/dxinsight/2310
好文章,需要你的鼓励
很多人担心被AI取代,陷入无意义感。按照杨元庆的思路,其实无论是模型的打造者,还是模型的使用者,都不该把AI放在人的对立面。
MIT研究团队提出递归语言模型(RLM),通过将长文本存储在外部编程环境中,让AI能够编写代码来探索和分解文本,并递归调用自身处理子任务。该方法成功处理了比传统模型大两个数量级的文本长度,在多项长文本任务上显著优于现有方法,同时保持了相当的成本效率,为AI处理超长文本提供了全新解决方案。
谷歌宣布对Gmail进行重大升级,全面集成Gemini AI功能,将其转变为"个人主动式收件箱助手"。新功能包括AI收件箱视图,可按优先级自动分组邮件;"帮我快速了解"功能提供邮件活动摘要;扩展"帮我写邮件"工具至所有用户;支持复杂问题查询如"我的航班何时降落"。部分功能免费提供,高级功能需付费订阅。谷歌强调用户数据安全,邮件内容不会用于训练公共AI模型。
华为研究团队推出SWE-Lego框架,通过混合数据集、改进监督学习和测试时扩展三大创新,让8B参数AI模型在代码自动修复任务上击败32B对手。该系统在SWE-bench Verified测试中达到42.2%成功率,加上扩展技术后提升至49.6%,证明了精巧方法设计胜过简单规模扩展的技术理念。