ZD至顶网CIO与应用频道 04月13日 北京消息:2017年4月12-13日,2017亚太CDN峰会在北京隆重召开,大会由亚太CDN领袖峰会、国际CDN论坛、电视新媒体CDN论坛、视频云论坛、未来网络论坛、C未来视频峰会、亚太CDN展览会等7大部分组成。在亚太CDN电视新媒体CDN论坛上,UCloud研发总监曾凯源先生发表了题为《云+CDN 开发融合全方位蓄势新媒体》的主题报告。
图为:UCloud研发总监曾凯源
在移动互联网的迅速普及和发展下及移动视频场景日新月异的催化下,云和CDN如何演变才能适应现在及未来的发展趋势。对于这个问题,UCloud研发总监曾凯源给出了答案。
移动互联网视频的趋势
第一个趋势,制作视频不再是原来的专业摄像师的专利,特别是短视频及直播这两种形态出现以后,视频的制作门槛得到极大的降低,互联网上的视频内容已经不可抑制的变的越来越多,内容上也趋于多样化而不再是电影,包括个人的生活、产业、户外旅游、购物体验、游戏分享、二次元等等。第二个趋势,回归到视频的主要功能或者本质,视频是丰富的内容及信息的载体,在海量的视频当中内容的质量、内容的价值决定了这个视频是被千万人所传阅,还是只是最终冷冰冰的存储在磁盘中。
在这个新的趋势、新的状况下会面临一些新的挑战,用户每天产生如此海量的视频怎么来存储是一个很大的问题。如何在千万次/天的视频当中能够快速通过用户的行为来发现一些有价值的内容?如何保障高质量内容的版权? CDN可能解决的问题就是如何应对大并发量的用户访问,传统的视频云服务更多是围绕着CDN展开设计。基于以上的特点及一些问题,现阶段的视频云其实除了带宽以外还要解决存储以及海量计算量的问题。
UCloud对于视频云服务的思考及其产品
首先存储方面,对象存储(UFile)具备了云的特点弹性扩容、海量存储和高分发能力,不会因为过高并发请求影响访问性能。
其次视频处理方面,UCloud依托于强大的云产品资源,借助于Docker技术,用户可以部署自定义视频处理应用、对视频进行不同格式、分辨率的转换,也可以上传自己提供一些专用视频处理程序,UCloud通用计算平台(UGC)会根据视频实时上传的量以及每个镜像处理单个视频的平均延时,实时调度十万个CPU核处理用户的视频任务。
最后UCloud CDN方面,UCDN的原理及所采用的一些技术包括分片上传、下载调度、运营资源及一些直播的秒拍、缓存等技术都已经非常成熟,UCloud于2015年左右开始着手自建CDN,通过近两年的布局,2016年已经完成了全国所有CDN节点的自建,并且在资源总量、带宽总量、质量上已经达到非常先进的水平,赢得不少客户的青睐。
在上月TIC大会上UCloud发布了吸睛无数的软件定义CDN产品,,此次大会上曾凯源先生再次讲到软件定义CDN,主要体现在三个方面:
1、用户可以定义CDN末端节点的服务逻辑,传统CDN一直以来服务只能监控、只能发现、只能做线路的调整,UCloud可以让客户自主定义自己的节点,依赖Docker技术,是目前非常完善的进项技术;
2、可以定义各个CDN节点之间的通信协议;
3、可以定义各个CDN节点之间的访问路由。借助于之前提及的Docker技术,只要把视频内容及要处理视频的线上要求,比如从CPU到网络到磁盘等等提交上来以后形成一个实例,这个实例可以装载用户的整个服务及视频。当把服务及视频提供到SD-CDN平台之后,SD-CDN会将用户的服务部署到UCloud全国的CDN节点。
从整个架构设计来看,UCloud自研软件提供了更多是边缘计算的能力,使得原来需要集中化的公有云计算的方式变成在边缘也能获得一个弹性的计算能力,以前比较重度的视频处理业务逻辑必须进行长距离的传输到集中公有云上处理,但是经过SD-CDN之后并不需要了,可以在边缘就把这个处理好,及时返回给用户的末端。软件定义视频提供的更多是另外一种架构设计的思考的方式,可以把一些高频或者重度的逻辑,或者是需要更快响应的逻辑放到离用户最近的地方,把一些低频不可避免的需要访问的逻辑放到大IDC或者公有云上,通过这些以后移动互联网用户必然会得到更好的服务体验。
好文章,需要你的鼓励
这项由加州大学圣地亚哥分校和微软研究院合作开发的REAL框架,通过程序分析反馈训练大型语言模型生成高质量代码。与传统方法不同,REAL采用强化学习将代码安全性和可维护性作为奖励信号,不依赖人工标注或特定规则。研究在多个数据集上的实验表明,REAL在保证功能正确性的同时显著提高了代码质量,有效解决了"即兴编程"中的安全漏洞和维护性问题,为AI辅助编程提供了新的范式。
加州大学伯克利分校与Meta FAIR研究团队开发了"Self-Challenging"框架,让大语言模型通过自己创建和解决任务来提升能力。该方法引入创新的"Code-as-Task"格式,包含指令、验证函数、示例解决方案和失败案例,确保生成的任务既可行又有挑战性。在工具计算、网页浏览、零售服务和航班预订四种环境测试中,仅使用自生成训练数据,Llama-3.1-8B模型性能提升了两倍多,证明AI可以通过自我挑战实现有效学习,减少对人类标注的依赖。
南洋理工大学与SenseTime Research合作提出了PoseFuse3D-KI,一种创新的人体中心关键帧插值框架。该方法将3D人体模型信息融入扩散过程,解决了现有技术在处理复杂人体动作时产生扭曲结果的问题。研究团队开发了专门的SMPL-X编码器直接从3D空间提取几何信息,并设计了融合网络将3D线索与2D姿态无缝整合。他们还构建了CHKI-Video数据集,包含2,614个视频片段及完整的人体标注。实验结果显示,PoseFuse3D-KI在PSNR上提升9%,LPIPS减少38%,显著超越现有方法。
这项研究提出了LongGuide算法,解决了大型语言模型在长文本生成任务中的局限性。研究团队发现,仅依靠上下文学习无法使模型充分掌握文本的语言和格式特性。LongGuide通过自动生成两种指导原则:度量指导原则和输出约束指导原则,显著提升了模型性能。在七种长文本生成任务中,该方法使开源和闭源模型的ROUGE-L评分平均提高约6%。LongGuide具有通用性强、易于学习、成本效益高等优点,为提升AI长文本生成能力提供了新方向。