至顶网CIO与应用频道 03月20日 编译:2018年3月19日,以“云聚融合、智创未来”为主题的腾讯云广电融合大会在北京召开,大会上,来自4K全景视听产业的内容、芯片、平台、终端、运营、高校代表共同启动了4K全景(中国)实验室,通过产学研用协同,致力推进4K全景这一新视听产业的发展。
腾讯云联手未来媒体,首家4K全景实验室成立
4K全景(中国)实验室由腾讯云计算(北京)有限责任公司与北京未来媒体科技股份有限公司发起,成员单位包括新疆广电网络股份有限公司、重庆广播电视信息网络有限公司、广州珠江在线多媒体信息有限公司、广东弘视数字传媒有限公司、电广传媒影业(北京)有限公司、中广电传媒有限公司、重庆视讯传媒有限公司、上海帕科软件科技股份有限公司、深圳市酷开网络科技有限公司、深圳市海思半导体有限公司、中国传媒大学媒介音视频教育部重点实验室、四川传媒学院。
“4K全景”是继4K、VR之后的又一视听新形态。基于大屏,“4K全景”不仅拥有4K画质,而且打破了传统视频“你播我看,我看你播”单向参与模式,让用户可通过遥控器的上下左右键获得360°观看视角,近距离接触每一个细节,获得堪比VR的沉浸互动体验。
据了解,针对4K全景这一新视听体验,4K全景(中国)实验室各成员单位之间已经进行了诸多的探索和尝试。未来媒体推出了全国首个大屏4K全景视频应用——“4K全景”,其作为4K全景内容集成、分发、运营平台,依托腾讯云在视频云领域专业、安全、强大的服务已经实现了全网全终端的变现运营,覆盖用户超1000万。
此外,新疆广电网络已经率先上线“4K全景”平台,重庆有线、广州珠江数码、酷开电视等也正在逐步落地中。内容层面,广东弘视数字传媒有限公司、电广传媒影业(北京)有限公司、中广电传媒有限公司、重庆视讯传媒有限公司已经开始4K全景内容的拍摄与制作。硬件层面,以海思为代表的芯片厂商已有多款芯片支持4K及全景播放。
同时,“4K全景”这一新视听技术和形态也得到了高校的广泛关注,中国传媒大学媒介音视频教育部重点实验室已经与未来媒体进行了多次技术和业务交流;四川传媒学院也同未来媒体4K全景团队进行了多次联合拍摄录制。
腾讯云助力,视频产业全新形态诞生
作为4K全景实验室的发起方之一,腾讯云基于自身的生态联动实力,针对4K超高清内容的存储、分发都具有极大优势,能够有效提升4K全景相关产品的成熟度和稳定度,带动我国4K电视产业的良性发展。
在视频技术方面,基于腾讯领先的音视频AI技术,配合腾讯云直播、点播、互动直播等云产品,腾讯云打造了全新的技术解决方案。据腾讯云媒体及运营商业务部总经理李郁韬介绍,腾讯云智能分类编码技术,可智能判断视频场景类型,对不同类型的视频优化处理,以更低的带宽给用户提供更高清的观看体验;超分辨率转码技术,利用深度学习对低分辨率视频源到高分辨率重建应用。既能够满足消费者对视频质量的需求,又可以降低企业所面临的带宽成本问题;腾讯云新一代P2P技术,能更好的节约带宽,低延迟还能做到较高的分享率,带给用户低延时低成本流畅播放体验。
腾讯云拥有完善的视频解决方案,覆盖金融、直播、视频等各行业众多场景。在游戏直播、视频门户、在线教育、垂直社交等方面都有专属的、全线产品解决方案。目前,中国TOP100的直播平台里面,已经有80%的直播平台都已接入腾讯云,斗鱼直播、映客直播、一直播、虎牙直播、熊猫直播等主流直播平台都已与腾讯云内容生态达成合作,并与腾讯云保持长线友好而深度的商务关系。
另外,强大底层技术和基础设施,也是腾讯云视频技术能力的保证。截至目前,腾讯云在全球拥有1000+CDN自建节点,覆盖36个可用区。能够为国内不同地域、不同运营商的用户提供稳定的CDN服务。良好的性能指标,遍布全球的服务节点以及海量的带宽存储,使得腾讯云具备足够能力为用户提供更加优质的内容分发服务。
本次,腾讯云牵手众多行业巨头发布的全国首个4K全景实验室,标志着我国视频传播历史迎来新变革。腾讯云以及各企业将通过技术输出,共同推进4K技术的发展,为人们带来更加极致的视觉体验,为行业不断输出发展的源动力。
好文章,需要你的鼓励
新加坡国立大学研究团队开发了名为IEAP的图像编辑框架,它通过将复杂编辑指令分解为简单原子操作序列解决了当前AI图像编辑的核心难题。研究发现当前模型在处理不改变图像布局的简单编辑时表现出色,但在需要改变图像结构时效果差。IEAP框架定义了五种基本操作,并利用思维链推理技术智能分解用户指令,实验证明其性能显著超越现有方法,尤其在处理复杂多步骤编辑时。
Character AI的研究者开发出TalkingMachines系统,通过自回归扩散模型实现实时音频驱动视频生成。研究将预训练视频模型转变为能进行FaceTime风格对话的虚拟形象系统。核心创新包括:将18B参数的图像到视频DiT模型改造为音频驱动系统、通过蒸馏实现无错误累积的无限长视频生成、优化工程设计降低延迟。系统可让多种风格的虚拟角色与人进行自然对话,嘴型与语音同步,为实时数字人交互技术开辟了新可能。
这项由中国人民大学高瓴人工智能学院研究团队发表的研究解决了大语言模型评判中的自我偏好问题。研究提出了DBG分数,通过比较模型给自身回答的分数与黄金判断的差异来测量偏好度,有效分离了回答质量与自我偏好偏差。实验发现,预训练和后训练模型都存在自我偏好,但大模型比小模型偏好度更低;调整回答风格和使用相同数据训练不同模型可减轻偏好。研究还从注意力分析角度揭示了自我偏好的潜在机制,为提高AI评判客观性提供了重要指导。
这篇研究提出了DenseDPO,一种改进视频生成模型的新方法,通过三大创新解决了传统方法中的"静态偏好"问题:使用结构相似的视频对进行比较,采集细粒度的时序偏好标注,并利用现有视觉语言模型自动标注。实验表明,DenseDPO不仅保留了视频的动态性,还在视觉质量方面与传统方法相当,同时大大提高了数据效率。这项技术有望推动AI生成更加自然、动态的视频内容。