“你好,我是张雨霏,很高兴与你交流!”
在如火如荼的巴黎奥运会,AI“张雨霏”和AI“邹敬园”现身法国巴黎所罗门罗斯柴尔德公馆的“中国之家”。
这是两位1:1高拟真度还原的运动员虚拟数字人,它们既可以回答奥林匹克运动的起源问题,还可以切换中文、英文、法语,与来自世界各地的运动员和观众交流互动。
结合语音合成、识别、语义理解、唇形预测、图像处理等多语种智能语音和大模型技术,让它们实现了信息处理能力、知识理解能力、跨语言自由对话能力。
虚拟数字人的兴起,最早源于虚拟偶像。在元宇宙火爆之后,虚拟数字人又有了新的应用场景,到了现在又有了像虚拟主播、数字员工等用途。尤其是最近几年,在生成式AI技术的带动下,虚拟数字人的交互能力、内容生成能力及智能化水平得到了极大的提升。
中国传媒大学文化产业管理学院执行院长张洪生曾表示,数字人的发展经历了从真人驱动到程序驱动,再到如今AI驱动三种主要形式。
随着虚拟数字人的不断发展,市场体量也在逐渐增大,iiMedia Research(艾媒咨询)发布的《2023年中国AI数字人产业研究报告》显示,2022年中国AI数字人核心市场规模为120.8亿元,同比增长94.2%,预计2025年将达480.6亿元。
中国传媒大学发布的《中国虚拟数字人影响力指数报告》显示,2023年度“数字人、虚拟人”相关企业达99.3万余家,其中,2023年1月-12月新增相关企业41.7万余家,与2022年同比上涨超四成。
生成式AI一方面可以赋能虚拟数字人的制作和生成,一方面可以让虚拟数字人实现一些功能进行场景落地。
一位业内人士称,生成式AI确实提升了整体的生产效率,但是这种效率提升并不是线性的,而是点状在某些环节实现效率提升,另外模型还需进行训练,嫁接专有知识库才能让虚拟数字人提供更具个性化的情绪价值。
在生成式AI加持下的虚拟数字人,现已在传媒、文旅、教育、金融、医疗、体育等领域广泛应用。像虚拟主播可以实现全年无休,大幅降低直播成本,简化运营流程;虚拟数字人员工能够担任客服、导游、助手等角色,不仅提高了整体工作效率,更实现了智能化的服务体验。
生成式AI已经为虚拟数字人带来了一些变化,虽未达到颠覆行业的程度,但其广泛应用已展现出可见的潜力,未来虚拟数字人也将成为连接AI和现实世界的一座重要桥梁。
《数字化转型方略》2024年第7期:http://www.zhiding.cn/dxinsight/2407
好文章,需要你的鼓励
铠侠正在测试最新的UFS v4.1嵌入式闪存芯片,专为智能手机和平板电脑设计,可提供更快的下载速度和更流畅的设备端AI应用性能。该芯片采用218层TLC 3D NAND技术,提供256GB、512GB和1TB容量选择。相比v4.0产品,随机写入性能提升约30%,随机读取性能提升35-45%,同时功耗效率改善15-20%。新标准还增加了主机发起碎片整理、增强异常处理等功能特性。
上海AI实验室团队提出创新的异步拍摄方案,仅用普通相机就能实现高速4D重建。该方法通过错开相机启动时间将有效帧率从25FPS提升至100-200FPS,并结合视频扩散模型修复稀疏视角导致的重建伪影。实验结果显示,新方法在处理快速运动场景时显著优于现有技术,为低成本高质量4D内容创作开辟新路径。
谷歌在伦敦云峰会上发布Firebase Studio更新,新增Gemini命令行界面集成、模型上下文协议支持和"代理模式"。代理模式提供三种AI协作层次:对话式"询问"模式用于头脑风暴,人机协作代理需开发者确认代码变更,以及几乎完全自主的代理模式。尽管谷歌声称已有数百万应用使用该平台,但目前仍需精心设计提示词,非工程师用户还无法直接创建成熟应用。
上海AI实验室联手复旦大学提出了POLAR方法,这是一种革命性的奖励模型训练技术。通过让AI学会识别不同策略间的差异而非死记评分标准,POLAR在多项任务上实现了显著提升,7B参数模型超越72B现有最强基线,为AI对齐问题提供了全新解决思路。