百度智能云视频云 全生命周期实现“质”与“智”的变革 原创

在日益增高的流量下,视频行业也迎来带来了一定的挑战,因为视频平台依旧要提供和之前一样优质、无卡顿的用户体验,而且随着视频向行业的应用渗透,企业也提出了越来越多的需求,提供一站式的视频云服务,降低视频的生产制作门槛才能带来视频时代的真正繁荣。

至顶网CIO与CTO频道 04月30日 北京消息(文/王聪彬):一场突如其来的疫情瞬间点燃了用户的线上需求,导致线上流量正在成指数级爆发,几个月内视频行业已经成为一个高速增长的行业。报告显示,疫情期间,在线视频行业用户规模较平日上涨17.4%,日人均使用时长超过1.5小时。

视频行业从2014年左右开始爆发,到现在的直播、短视频,早期更多聚焦在互联网娱乐行业。疫情的到来也给视频行业带来了两大变化,第一、互联网流量普涨,几乎所有的视频类的业务都增长了将近30%—50%,有的甚至是几倍;第二、在线教育、在线办公、直播电商等需求大量爆发。

“疫情就像一个催化剂,让某一些需求提前爆发,其实这些需求在之前就已经有出现或者发展的迹象。”百度智能云视频云产品负责人孙丽表示,如果没有疫情,这些业务在未来也会出现暴涨,但是时间可能需要继续推迟,而且疫情期间互联网在连接的本质上承担了更大的作用。

在日益增高的流量下,视频行业也迎来带来了一定的挑战,因为视频平台依旧要提供和之前一样优质、无卡顿的用户体验,而且随着视频向行业的应用渗透,企业也提出了越来越多的需求,提供一站式的视频云服务,降低视频的生产制作门槛才能带来视频时代的真正繁荣。

云帮助视频体验一步到位

为用户提供一个更加稳定无卡顿,秒开的体验一直是视频行业的目标。对于视频行业而言,用户体验可以分为三个维度:

网络性能层面:视频观看的性能体验,包括视频是否流畅、卡顿,画面是否清晰,是否稳定,直播能否做到更低的延迟,在线上课能否不卡顿不花屏等。

内容交互层面:在视频内容爆发的今天,视频内容决定了用户的去留,要考虑视频内容质量是否高,内容是否有趣。虽然当前是人人皆媒的时代,但是内容生产还是具有一定的难度,尤其是专业的内容制作。

连接效率层面:互联网已经从搜索模式转为feed模式,数以万亿的视频内容如何更好的推荐给感兴趣的人,是当前视频APP体验重要的一环。例如抖音每天有308万个亲子视频,这些内容如何找到对他们感兴趣的人,让连接更有效率也是目前的一个难题。

在用户体验上,很多问题都可以通过技术进行提升和解决,尤其是云带来的性能体验的全方位提升。孙丽表示,百度智能云基于百度的CDN、存储能力、直播能力、音视频能力、视频编解码能力、结合视频AI技术构建出整套的应对方案,可以帮助企业解决视频的性能体验、内容生产及视频推荐的难题,让企业的视频体验一步到位。

视频全生命周期的能力覆盖

目前视频技术的整体挑战还是比较大,AR特效、人脸识别、分发、编解码、通信等,百度智能云将能力进行打包通过一站式的视频云解决方案降低企业进入视频行业的门槛。

百度智能云立足于百度全面的ABC底层技术,在AI方面:百度大脑开放228项AI能力,覆盖语音技术、视觉技术、自然语言处理、知识图谱、视频分析各类能力;在大数据方面:拥有世界最大的深度神经网络(DNN)(万亿级别参数,千亿样本,千亿特征训练);在云计算方面:拥有亚洲单体最强大的算力平台,300万颗CPU核、6EB级存储容量,为视频处理提供了强大的算力基础。

百度智能云视频云由三个层面构成,第一、技术层面;第二、视频平台层面;第三、应用场景层面。孙丽指出,我们的目标是实现视频全生命周期的覆盖,从视频的生成、存储、计算、分发、播放、变现,同时让场景构建极度简单化。

百度智能云视频云包含了十几款产品,其中主要的产品包括:CDN、视频直播、视频转码、短视频SDK、视频分析、音视频通信等。

CDNCDN一直是各家企业的IT支出大头,百度智能云视频云具备海量的资源,在国内有1000+节点,在全球有200+节点,有100T+的储备带宽;具备极致性能,卡顿比<5%,失败率<0.01%,有专线支持,实现分钟级别的故障切换,目前日均处理7000亿次请求;在能力上支持IPV6、动态加速、QUIC、内容审核、HTTP2、大数据可视化报表;在自服务产品属性上可编程CDN、实时日志与数据系统,专业的售后团队;在边缘计算的创新实现从内容分发到计算分发。

视频直播:直播作为一种互动性非常强的视频形态未来会持续加强行业渗透,当前可能是在娱乐、电商、在线教育、未来直播会往更多的行业和场景渗透。同时直播技术本身也朝着更低延迟的方向发展,百度智能云音视频直播LSS服务基于1000+CDN节点搭建,节点遍布全球24个国家和地区,通过链路智能优化,最优节点选择,多线BGP解决跨运营商时延及稳定性问题。通过首屏秒开技术,实现毫秒级出现直播画面。通过追帧播放技术,将端到端的直播时延降到最低。基于场景优化的高质量实时转码算法,相同画质相比友商节省10%~30%流量带宽。同智能视频SDK打通,提供视觉特效和实时美颜能力。

视频转码:智感超清转码集合了多种视觉AI与编码技术,通过AI模型对画面内容进行深度感知学习,根据视频场景及复杂度,智能调节编码参数,并优化主观视觉体验,以更小的码率获得更好的编码质量。在智能编码层面,内容自适应动态分配码率,基于内容自适应动态分配码率等编码参数,以更小的传输带宽,获得更高的编码质量及更优的视觉体验。图像超分辨率技术是基于深度学习的图像超分辨率技术,可以将低分辨率图像重建成高分辨率图像(SD → SD or HD → 4K),并且重建图像细节。画质修复和色彩增强支持画质修复将马赛克、伪影、毛刺等这些人眼主观厌恶的内容细节去除,同时进行色彩增强,自适应调整色彩饱和度、对比度,让色彩更鲜艳,让暗部细节更突出,大大提升画面整体观感。

视频拍摄SDK:特效可以强化视频拍摄的趣味性,在特效层面可以支持,5种手势识别、2种屏幕交互、150个人脸识别点、SLAM(在空间平面放置IP形象)、空间粒子(下雪、下雨、飘花瓣)、触屏手势粒子、天空顶、AI抠图等。可以实现人脸特效、手势特效、肢体特效、微整形、美体、轻美妆、环境特效等能力,让内容可以突破次元壁达到现实和虚拟的融合。在生态上,联合太合音乐推出正版音乐曲库,具备原创版权音乐能力。而且即将推出智能编辑能力和贴纸生产能力。

视频分析:百度智能云提出了视频AI概念,百度在视频理解领域大赛ActivityNet,人脸检测和对比FDDB FLW大赛上都获得过世界冠军。在场景识别上能够支持5000种分类,在物体识别上支持40000种,并能提取多大4000多种特征。使用这种能力相对人去分析,能够有上万倍的效率提升。在视频审核方面通过对图像、语音、文本等多模数据分析,能够对涉政、涉黄、暴恐、违禁、广告等多方面进行审核。借助视频DNA和黑库技术,支持去重和侵权的检测、促进视频内容健康分发。

音视频通信:未来视频领域实时音视频通信将会成为非常关键的技术,因为视频一定是往互动性更强的方向发展的。百度智能云RTC产品包括四大优势:1、极致的通话体验:超低延迟和超高稳定性,端到端延迟达到200ms~300ms,99.99%的服务可用性。自研抗弱网算法,弱网环境下保证高质量通信,抗丢包率30%。语音智能降噪技术让通话更加清晰;2、更高清的视频体验,支持4K的视频通话能力;3、更智能的玩法,集成的智能视频SDK的AR拍摄玩法,让互动更有意思。提供人脸识别、语音识别等能力用于身份核验、学生状态监测等更多场景;4、便捷的功能:旁路直播、云端录制、IM即时通信、屏幕分享等能力让客户使用更加简单易用。

视频场景还有更多想象空间

百度智能云视频云通过一站式的服务大幅降低了企业进入视频的门槛,在行业中也得到了广泛的应用。

好看视频就是基于百度智能云视频云一站式的搭建,除了拥有优质的观看体验外,在视频推荐方面进行了用户体验增强。目前好看视频拥有数百亿的媒资数,日处理超过百万新视频,帮助用户实现快速稳定的视频内容观看。同时好看视频支撑了2019 春晚的流量洪峰,体现了百度智能云视频云的弹性,以及AI层面的整体能力。

在4G时代视频已经迎来了爆发,5G、边缘计算的新兴技术,则将赋予视频更多新的使命。孙丽表示,作为新基建技术的5G又引起大家的讨论热潮,作为下一代通信技术,5G将带来的底层技术的变革以及上层应用的创新。

而且视频已经在从信息传播的一种媒介或载体,升级到了新的应用形态。这种变化主要表现在三个层面:

第一、视频将无处不在:除了视频内容的爆发,视频的生产也更加多元化,从4G时代的人人皆媒,5G时代物联网兴起,物设备也成为视频生产的重要来源,而生产和消费的边界也将模糊化;

第二、视频的体验更加多样,朝着超高清4K、8K方向发展,低延迟和沉浸感三个方向发展,同时也为视频技术带来了新的挑战;

第三、视频+行业成为趋势,视频从只应用于互联网娱乐,逐渐向如在线教育、远程医疗、安防监控、工业、智能城市、智慧家庭等行业渗透,成为这些行业重要的信息媒介与决策依据。

总结而言,在视频形态多样化、受众群体扩大、行业不断渗透的同时,也带来形式创新、视觉体验、流畅极速、智能化理解等各方面的需求挑战。百度智能云基于ABC的核心技术能力,通过服务化、智能化和场景化来提供综合的视频云平台,从服务更多的流量和计算走向服务更好的效率和理解,在视频的生产、管理、分析、分发、变现的全生命周期帮助客户实现从“质”到“智”的变革。

来源:至顶网CIO与CTO频道

0赞

好文章,需要你的鼓励

2020

04/30

14:46

分享

点赞

邮件订阅
白皮书