端侧大模型有可能是最先引爆这一轮生成式AI的领域。
为什么这么说,与云侧大模型相比,端侧大模型可以更好地学习用户个人数据在本地实现智能化,而且数据不出端、不上云,隐私信息更安全。
IDC也预测,终端的AI化会成为AI发展与落地的重要支持方向。到2026年,中国市场中近50%的终端设备的处理器将带有AI引擎技术。
8月4日,华为开发者大会2023上,不仅HarmonyOS 4将受益于“盘古大模型”,华为还将大模型深度整合进手机系统,实现更高层次的融合,智慧助手小艺接入AI大模型能力,可以进行自然对话、会议纪要和辅助文案生成、图片二次创作等。
8月14日,小米年度发布会上,小米宣布自研13亿参数端侧大模型,在部分场景上可以媲美行业60亿参数的云端大模型,同时小米也将小爱同学升级大模型。
vivo预告了11月1日vivo开发者大会将发布全新手机操作系统OriginOS 4,首发搭载vivo自研AI大模型vivoLM。自研AI大模型矩阵包括十亿、百亿、千亿三个不同参数量级的5个自研大模型。
OPPO安第斯智能云团队打造了基于混合云架构的生成式大语言模型OAndesGPT。10月11日,OPPO宣布基于AndesGPT大模型打造的新版AI助手——新小布1.0开启了第一轮公测。
2023高通骁龙峰会期间,荣耀宣布荣耀Magic6系列将搭载第三代骁龙8移动平台,支持70亿参数的端侧AI大模型。灵动胶囊Magic Capsule可以基于眼神跟踪的多模态交互技术。YOYO助手提供简短提示来创建主题视频,甚至可以通过与YOYO助理对话更改背景音乐或模板。
几个月来,vivo、OPPO、小米的大模型也在两大中文大模型评测榜单C-Eval和CMMLU上“刷榜”了一波。
很多人会问,端侧芯片可以支持大模型的训练吗?一方面高通、联发科等芯片巨头也在探索将AI大模型植入端侧,一方面模型也在小型化,降低所需的资源和能耗,当然我们也看到未来大模型还是会向着云侧和端侧相结合发展。
本期《数字化转型方略》也将看看端侧代表们,在把大模型装进端侧上都做了哪些工作。我们也希望进一步看到未来随着端侧大模型对用户个人数据和习惯的学习成长,带来更深入的意图理解和更加个性化的复杂场景服务。
《数字化转型方略》2023年第10期:http://www.zhiding.cn/dxinsight/2310
好文章,需要你的鼓励
新加坡人工智能机构与阿里云发布全新大语言模型Qwen-Sea-Lion-v4,专门针对东南亚语言和文化特色进行优化。该模型结合阿里云Qwen3-32B基础模型和大量东南亚地区数据集,在东南亚语言模型评估榜单中位居开源模型首位。模型支持119种语言,能在32GB内存的消费级笔记本上运行,采用字节对编码技术更好处理非拉丁文字,并具备3.2万词元上下文长度,可执行文档级推理和摘要任务。
中科大联合快手等机构推出VR-Thinker技术,首次实现AI视频评判员的"边看边想"能力。该系统通过主动选择关键画面、智能记忆管理和三阶段训练,在视频质量评估准确率上达到75%-82%,特别擅长处理长视频场景,为AI视频生成的质量控制提供了突破性解决方案。
AI智能体是下一代业务自动化工具,不仅能对话交流,还能执行复杂任务。与ChatGPT聊天机器人不同,它们可在最少人工干预下规划并完成工作。文章介绍了五个高影响力应用:自动化客户服务解决方案、销售CRM管理、合规自动化、招聘筛选与排程、市场情报报告。这些应用都具有重复性工作流程、依赖结构化数据、遵循可预测规则等特点,能够释放员工宝贵时间用于更有价值的工作。
微软研究院发布BitDistill技术,通过三阶段优化将大型语言模型压缩至1.58位精度,在保持性能的同时实现10倍内存节省和2.65倍速度提升。该技术包括模型结构稳定化、持续预训练适应和知识蒸馏传承三个关键步骤,解决了模型量化中的性能衰减和规模化问题,为AI模型在资源受限设备上的高效部署提供了新方案。