端侧大模型有可能是最先引爆这一轮生成式AI的领域。
为什么这么说,与云侧大模型相比,端侧大模型可以更好地学习用户个人数据在本地实现智能化,而且数据不出端、不上云,隐私信息更安全。
IDC也预测,终端的AI化会成为AI发展与落地的重要支持方向。到2026年,中国市场中近50%的终端设备的处理器将带有AI引擎技术。
8月4日,华为开发者大会2023上,不仅HarmonyOS 4将受益于“盘古大模型”,华为还将大模型深度整合进手机系统,实现更高层次的融合,智慧助手小艺接入AI大模型能力,可以进行自然对话、会议纪要和辅助文案生成、图片二次创作等。
8月14日,小米年度发布会上,小米宣布自研13亿参数端侧大模型,在部分场景上可以媲美行业60亿参数的云端大模型,同时小米也将小爱同学升级大模型。
vivo预告了11月1日vivo开发者大会将发布全新手机操作系统OriginOS 4,首发搭载vivo自研AI大模型vivoLM。自研AI大模型矩阵包括十亿、百亿、千亿三个不同参数量级的5个自研大模型。
OPPO安第斯智能云团队打造了基于混合云架构的生成式大语言模型OAndesGPT。10月11日,OPPO宣布基于AndesGPT大模型打造的新版AI助手——新小布1.0开启了第一轮公测。
2023高通骁龙峰会期间,荣耀宣布荣耀Magic6系列将搭载第三代骁龙8移动平台,支持70亿参数的端侧AI大模型。灵动胶囊Magic Capsule可以基于眼神跟踪的多模态交互技术。YOYO助手提供简短提示来创建主题视频,甚至可以通过与YOYO助理对话更改背景音乐或模板。
几个月来,vivo、OPPO、小米的大模型也在两大中文大模型评测榜单C-Eval和CMMLU上“刷榜”了一波。
很多人会问,端侧芯片可以支持大模型的训练吗?一方面高通、联发科等芯片巨头也在探索将AI大模型植入端侧,一方面模型也在小型化,降低所需的资源和能耗,当然我们也看到未来大模型还是会向着云侧和端侧相结合发展。
本期《数字化转型方略》也将看看端侧代表们,在把大模型装进端侧上都做了哪些工作。我们也希望进一步看到未来随着端侧大模型对用户个人数据和习惯的学习成长,带来更深入的意图理解和更加个性化的复杂场景服务。
《数字化转型方略》2023年第10期:http://www.zhiding.cn/dxinsight/2310
好文章,需要你的鼓励
新加坡国立大学研究团队开发了名为IEAP的图像编辑框架,它通过将复杂编辑指令分解为简单原子操作序列解决了当前AI图像编辑的核心难题。研究发现当前模型在处理不改变图像布局的简单编辑时表现出色,但在需要改变图像结构时效果差。IEAP框架定义了五种基本操作,并利用思维链推理技术智能分解用户指令,实验证明其性能显著超越现有方法,尤其在处理复杂多步骤编辑时。
Character AI的研究者开发出TalkingMachines系统,通过自回归扩散模型实现实时音频驱动视频生成。研究将预训练视频模型转变为能进行FaceTime风格对话的虚拟形象系统。核心创新包括:将18B参数的图像到视频DiT模型改造为音频驱动系统、通过蒸馏实现无错误累积的无限长视频生成、优化工程设计降低延迟。系统可让多种风格的虚拟角色与人进行自然对话,嘴型与语音同步,为实时数字人交互技术开辟了新可能。
这项由中国人民大学高瓴人工智能学院研究团队发表的研究解决了大语言模型评判中的自我偏好问题。研究提出了DBG分数,通过比较模型给自身回答的分数与黄金判断的差异来测量偏好度,有效分离了回答质量与自我偏好偏差。实验发现,预训练和后训练模型都存在自我偏好,但大模型比小模型偏好度更低;调整回答风格和使用相同数据训练不同模型可减轻偏好。研究还从注意力分析角度揭示了自我偏好的潜在机制,为提高AI评判客观性提供了重要指导。
这篇研究提出了DenseDPO,一种改进视频生成模型的新方法,通过三大创新解决了传统方法中的"静态偏好"问题:使用结构相似的视频对进行比较,采集细粒度的时序偏好标注,并利用现有视觉语言模型自动标注。实验表明,DenseDPO不仅保留了视频的动态性,还在视觉质量方面与传统方法相当,同时大大提高了数据效率。这项技术有望推动AI生成更加自然、动态的视频内容。