至顶网CIO与应用频道 12月05日 北京消息:12月4日,第四届世界互联网大会在乌镇持续火热进行,在题为“人工智能:让生活更美好”的专题论坛上,腾讯高级执行副总裁汤道生、华为消费者业务CEO余承东、搜狗CEO王小川、欧洲科学院院士汉斯·乌思克尔特、PrivacyShell & TodaCorp首席执行官托菲·萨利巴、海尔集团副总裁赵峰、百度副总裁王海峰等行业大咖,针对人工智能技术与产业为核心的话题,从AI发展所带来的机遇和风险等方面展开了深度讨论。
人工智能技术与产业圆桌议题讨论
腾讯高级执行副总裁汤道生在专题讨论上表示,人工智能既是机会机遇,也有一定的挑战。人工智能并不是一个新的事物,AI是一种技术手段,其发展最终还是要回到“服务用户需求”的本质。作为腾讯,我们的想法更多是怎么利用好这个技术来服务好我们的用户和客户,以及怎么更好地打磨AI能力来推动各行各业的效率提升。
近年来,随着布局的逐渐深入,腾讯在人工智能领域取得的成绩备受关注。在专题讨论上,汤道生从多方面阐述了腾讯AI发展过程中的应用案例。
腾讯高级执行副总裁汤道生
用AI打磨产品,提升用户体验
汤道生谈到:对于腾讯的一系列的产品,人工智能能够帮助我们提升用户的体验。比如说在微信里面的语音转文字,天天P图、QQ空间直播挂件通过机器视觉技术达到增强现实的效果;音乐类产品QQ音乐、全民K歌基于腾讯智能语音识别等技术,实现听歌识曲、人声与背景音分离;内容类产品例如QQ看点基于AI有很多个性化推荐应用。可以说在腾讯一系列的产品中,几乎每一款都在使用人工智能作为一个非常强大的工具来提升用户的体验。
打造AI矩阵,腾讯云整合能力输出解决方案
同时,腾讯已形成了AI布局矩阵。基于腾讯AI Lab(腾讯人工智能实验室)、腾讯优图实验室、微信智能语音团队等团队技术积累,围绕计算机视觉、智能语音识别、自然语言处理三大板块,腾讯云已提供25种AI服务,包括应用服务8种,平台服务15种,框架服务2种。
在人工智能的具体落地中,场景化解决方案更是核心竞争力。为了将人工智能技术更好地实现产品化落地,腾讯云将诸多实验室的技术实力整合封装,结合相应的场景,形成了不同的解决方案,赋能各行各业。
汤道生表示:腾讯云通过像小微、云识别的场景跟很多的一线厂商合作,例如让车载系统用更智能的交互方式,同时通过摄像头,我们在提供一些OCR的能力来帮助很多的传统企业自动化,也用人脸识别等去做人脸的身份的确认。在今天的AI时代,我们所有的产品都在拥抱AI这样的能力。
连接智慧未来,推动产业实现“智能+”升级
腾讯通过提供云服务做“智能+”,跟很多的传统行业有合作,腾讯非常开放的跟传统行业、企业、集成商等各类合作伙伴进行良好的合作,通过腾讯的底层技术的开放,和我们合作伙伴在有一个非常好的结合。这既是机遇也是挑战。
在智慧城市方面,腾讯云与福建省公安厅共同打造了防走失平台“牵挂你”项目,借助腾讯优图实验室研发的海量人脸检索技术,上线短短半年已帮助了124名走失人员与家人重聚。
在智慧物流方面,顺丰应用腾讯优图OCR技术,可快速识别手写体的快递单,3小时可识别2000万张。大大提升了快递单的识别效率,以及企业的工作效率。
在智慧金融领域,包括移动支付、财富管理和小额贷款,腾讯利用AI来更精确预测用户在金融业务中的行为,这将有助于为最合适的用户提供最合适的产品,并进行风险管理。
在智慧医疗领域,2017年科技部公布了首批国家人工智能开放创新平台名单,明确依托腾讯公司建设医疗影像国家人工智能开放创新平台。作为腾讯首款AI+医疗产品,“腾讯觅影”把图像识别、大数据处理、深度学习等领先的技术与医学跨界融合研发而成。通过赋能医疗机构和医生,帮助疾病早筛、早诊和早治。
此外,在智慧交通、智慧零售、安全等方面,腾讯人工智能也都已取得了重要的突破。
最后,汤道生总结了腾讯的AI战略,他表示“作为一个AI驱动的企业,未来腾讯还将积极使用AI提升产品体验,改善运营效率,积累各个行业的专业知识,开放一系列的智能服务来帮助不同的行业,协同各行业一起利用好AI这个先进的工具服务于人,服务于社会。”
正如马化腾在世界互联网大会全体会议上演讲所说:“腾讯成为新技术的驱动者和贡献者,并通过腾讯云将最新技术开放给合作伙伴,赋能各行各业实现数字化转型升级。”
好文章,需要你的鼓励
腾讯今日开源混元MT系列语言模型,专门针对翻译任务进行优化。该系列包含四个模型,其中两个旗舰模型均拥有70亿参数。腾讯使用四个不同数据集进行初始训练,并采用强化学习进行优化。在WMT25基准测试中,混元MT在31个语言对中的30个表现优于谷歌翻译,某些情况下得分高出65%,同时也超越了GPT-4.1和Claude 4 Sonnet等模型。
腾讯ARC实验室推出AudioStory系统,首次实现AI根据复杂指令创作完整长篇音频故事。该系统结合大语言模型的叙事推理能力与音频生成技术,通过交错式推理生成、解耦桥接机制和渐进式训练,能够将复杂指令分解为连续音频场景并保持整体连贯性。在AudioStory-10K基准测试中表现优异,为AI音频创作开辟新方向。
今年是Frontiers Health十周年。在pharmaphorum播客的Frontiers Health限定系列中,网络编辑Nicole Raleigh采访了Startup Health总裁兼联合创始人Unity Stoakes。Stoakes在科技、科学和设计交汇领域深耕30多年,致力于变革全球健康。他认为,Frontiers Health通过精心选择的空间促进有意义的网络建设,利用网络效应推进创新力量,让企业家共同构建并带来改变,从而有益地影响全球人类福祉。
Meta与特拉维夫大学联合研发的VideoJAM技术,通过让AI同时学习外观和运动信息,显著解决了当前视频生成模型中动作不连贯、违反物理定律的核心问题。该技术仅需添加两个线性层就能大幅提升运动质量,在多项测试中超越包括Sora在内的商业模型,为AI视频生成的实用化应用奠定了重要基础。