“你好,我是张雨霏,很高兴与你交流!”
在如火如荼的巴黎奥运会,AI“张雨霏”和AI“邹敬园”现身法国巴黎所罗门罗斯柴尔德公馆的“中国之家”。
这是两位1:1高拟真度还原的运动员虚拟数字人,它们既可以回答奥林匹克运动的起源问题,还可以切换中文、英文、法语,与来自世界各地的运动员和观众交流互动。
结合语音合成、识别、语义理解、唇形预测、图像处理等多语种智能语音和大模型技术,让它们实现了信息处理能力、知识理解能力、跨语言自由对话能力。
虚拟数字人的兴起,最早源于虚拟偶像。在元宇宙火爆之后,虚拟数字人又有了新的应用场景,到了现在又有了像虚拟主播、数字员工等用途。尤其是最近几年,在生成式AI技术的带动下,虚拟数字人的交互能力、内容生成能力及智能化水平得到了极大的提升。
中国传媒大学文化产业管理学院执行院长张洪生曾表示,数字人的发展经历了从真人驱动到程序驱动,再到如今AI驱动三种主要形式。
随着虚拟数字人的不断发展,市场体量也在逐渐增大,iiMedia Research(艾媒咨询)发布的《2023年中国AI数字人产业研究报告》显示,2022年中国AI数字人核心市场规模为120.8亿元,同比增长94.2%,预计2025年将达480.6亿元。
中国传媒大学发布的《中国虚拟数字人影响力指数报告》显示,2023年度“数字人、虚拟人”相关企业达99.3万余家,其中,2023年1月-12月新增相关企业41.7万余家,与2022年同比上涨超四成。
生成式AI一方面可以赋能虚拟数字人的制作和生成,一方面可以让虚拟数字人实现一些功能进行场景落地。
一位业内人士称,生成式AI确实提升了整体的生产效率,但是这种效率提升并不是线性的,而是点状在某些环节实现效率提升,另外模型还需进行训练,嫁接专有知识库才能让虚拟数字人提供更具个性化的情绪价值。
在生成式AI加持下的虚拟数字人,现已在传媒、文旅、教育、金融、医疗、体育等领域广泛应用。像虚拟主播可以实现全年无休,大幅降低直播成本,简化运营流程;虚拟数字人员工能够担任客服、导游、助手等角色,不仅提高了整体工作效率,更实现了智能化的服务体验。
生成式AI已经为虚拟数字人带来了一些变化,虽未达到颠覆行业的程度,但其广泛应用已展现出可见的潜力,未来虚拟数字人也将成为连接AI和现实世界的一座重要桥梁。
《数字化转型方略》2024年第7期:http://www.zhiding.cn/dxinsight/2407
好文章,需要你的鼓励
Docker公司通过增强的compose框架和新基础设施工具,将自己定位为AI智能体开发的核心编排平台。该平台在compose规范中新增"models"元素,允许开发者在同一YAML文件中定义AI智能体、大语言模型和工具。支持LangGraph、CrewAI等多个AI框架,提供Docker Offload服务访问NVIDIA L4 GPU,并与谷歌云、微软Azure建立合作。通过MCP网关提供企业级安全隔离,解决了企业AI项目从概念验证到生产部署的断层问题。
中科院联合字节跳动开发全新AI评测基准TreeBench,揭示当前最先进模型在复杂视觉推理上的重大缺陷。即使OpenAI o3也仅获得54.87%分数。研究团队同时提出TreeVGR训练方法,通过要求AI同时给出答案和精确定位,实现真正可追溯的视觉推理,为构建更透明可信的AI系统开辟新路径。
马斯克的AI女友"Ani"引爆全球,腾讯RLVER框架突破情感理解边界:AI下半场竞争核心已转向对人性的精准把握。当技术学会共情,虚拟陪伴不再停留于脚本应答,而是通过"心与心的循环"真正理解人类孤独——这背后是强化学习算法与思考模式的化学反应,让AI从解决问题转向拥抱情感。
PyVision是上海AI实验室开发的革命性视觉推理框架,让AI系统能够根据具体问题动态创造Python工具,而非依赖预设工具集。通过多轮交互机制,PyVision在多项基准测试中实现显著性能提升,其中在符号视觉任务上提升达31.1%。该框架展现了从"工具使用者"到"工具创造者"的AI能力跃迁,为通用人工智能的发展开辟了新路径。