ZD至顶网CIO与应用频道 03月14日 北京消息:公有云服务商推新品是一个常态,前几年争抢最厉害的市场莫过CDN,腾讯云也于去年开年发布CDN后服务,今年开年的新方向是存储领域,发布了腾讯云COS服务。
腾讯云COS融合了全球400+加速节点的优势、突出的图片鉴黄能力、以及优图人脸识别能力,针对现代企业在存储中面对的数据及网络安全、访问效率、存储容量、以及运维成本等痛点提供更好的解决方案,让任何量级的企业均可以抛弃硬盘,轻松上云。
并非存储那么简单
作为云计算基础设施里不可或缺的部分,云存储正被越来越多的企业及个人所需要。腾讯云COSV3.0对于目前的云存储市场而言既是“新兵”也是“老将”,自2015年正式开放以来,腾讯云COS的商用时间仅两年不到,却已经经历了从1.0到3.0的两次升级。在此次推出的最新版本中,腾讯云COS 在存储之上更是配备了多种数据处理插件:其中图片处理可以提供包括缩放,旋转,水印,裁剪,webp等在内的PS级图片处理能力;图片识别插件可以进行人脸识别,智能裁剪,自动分类,以及无损压缩;音视频插件提供了视频水印,视频封面以及持久化的音视频转码功能;文档插件则可以实现封面生成和转码。在众多插件中,鉴黄插件当属COS的独门必杀技,腾讯拥有国内首屈一指的社交平台,每天要接收数亿张图片,而这些图片作为庞大的资源库支撑着鉴黄插件高达99.9%的精准度,为用户最大程度地降低了工作的复杂度并确保安全。
腾讯云移动云总经理答治茜
可靠、安全值得信赖
在存储层面, COSV3.0可以保证用户端上传和下载的成功率稳定在99.9%以上,各个纬度优化的手段十分丰富:涵盖CDN加速、DNS解析优化、上传就近接入、网络协议优化等等方法;而在图片、视频处理等方面,更是使用了FPGA硬件加速手段,将处理性能大幅度提升近20倍;同时,COS高达99.999999%的安全性能有效预防DDOS攻击,同时采取多副本、回收站机制、机房容灾、异地容灾等来方法来进一步巩固安全;当存储规模变大的时候,COS能够通过优化机器配置结合虚拟化等方法最大化的利用硬件,对冷热数据采用不同存储技术、使用webp/hevc/h265等图片视频格式、同时使用CDN加速把带宽成本降低等手段,将TCO成本降低超过50%。
腾讯云COS产品总监王琰
十年时间试炼、无微不至
腾讯云COS的强大能力并非短日之功,早在2007年,QQ相册和QQ邮箱的大范围应用就对腾讯的存储提出了严苛要求,COS的雏形TFS应运而生,而后经过BTFS、CTFS等一系列平台的逐渐演进,腾讯用十年的时间不断钻研和打磨,最终推出了COS平台。
腾讯云COS技术总监黎文彦
近年来,云计算的逐渐发展给企业打开了一扇“云中”大门,云存储也相应地成为企业大数据的最佳去处,腾讯云COS获得了越来越多企业客户的信赖,宝宝树、大众点评、芒果TV、微信等用户均以腾讯云COS为自身的业务发展的得力助手。以微信为例,朋友圈发布的所有图片和小视频均存储在腾讯云COS中,并通过CDN节点进行加速,使得全球任意位置的用户都能快速地访问想要获取的内容;此外,COS为微信提供了能以文件的形式保存朋友圈收藏夹中的文件而非网站的url的功能,尽可能地避免了微信收藏夹内容失效的情况;同时,COS更具有排重功能,相同的文件通常只会储存一个副本(一份文件的容灾还是有3份备份),从而大大减少了存储量,节省了成本。
腾讯云COS V3.0的鉴黄能力对微信这样特殊平台更是举足轻重。数以万计的用户每天通过微信传递图片和视频,在COS的监管下,这些图片和视频会在上传时经过至少一次的“清洗”,疑似违规的内容则会进行进一步的鉴别,确保内容合法和合规。为了在海量用户和数据的压力下给用户提供更快速和清晰的图片服务,COS的webp无损压缩功能会将微信朋友圈的上传后的照片压缩成4个不同大小的尺寸,分别适用在4种不同的场景下。前期爆红的红包照片采用的其实就是COS的私有鉴权——根据用户是否具备清晰图片的访问权限,返回不同的图片结果。
一站式服务的云存储
腾讯云COS提供的云存储加上CDN加速以及图片处理、音视频处理、文件处理,鉴黄,人脸识别等功能,覆盖了从迁移、上传到存储到内容处理一直到下载、分发的一条完整生命流程。对企业/开发者来说,COS为客户提供的不仅仅是安全、稳定、可靠的存储,更加是省时、省力(利)、省心专注于业务的存储。
除了传统行业的动静态数据分离,海量文件存储,冷数据备份等应用场景,腾讯云COS还能根据用户的需求应承载更多的业务形态,包括头像、图片、文件、视频,涵盖UGC、电商、搜索、O2O、金融等领域。此次COS3.0版本的推出将作为腾讯云的又一拳头产品为其加注云存储市场领跑者的竞争砝码。
好文章,需要你的鼓励
这项来自苹果公司的研究揭示了视频大语言模型评测的两大关键问题:许多测试问题不看视频就能回答正确,且打乱视频帧顺序后模型表现几乎不变。研究提出VBenchComp框架,将视频问题分为四类:语言模型可回答型、语义型、时序型和其他类型,发现在主流评测中高达70%的问题实际上未测试真正的视频理解能力。通过重新评估现有模型,研究团队证明单一总分可能掩盖关键能力差距,并提出了更高效的评测方法,为未来视频AI评测提供了新方向。
这篇来自KAIST AI研究团队的论文提出了"差分信息分布"(DID)这一创新概念,为理解直接偏好优化(DPO)提供全新视角。研究证明,当偏好数据编码了从参考策略到目标策略所需的差分信息时,DPO中的对数比率奖励形式是唯一最优的。通过分析DID熵,研究解释了对数似然位移现象,并发现高熵DID有利于通用指令跟随,而低熵DID适合知识密集型问答。这一框架统一了对DPO目标、偏好数据结构和策略行为的理解,为语言模型对齐提供理论支持。
VidText是一个全新的视频文本理解基准,解决了现有评估体系的关键缺口。它涵盖多种现实场景和多语言内容,提出三层评估框架(视频级、片段级、实例级),并配对感知与推理任务。对18个先进多模态模型的测试显示,即使最佳表现的Gemini 1.5 Pro也仅达46.8%平均分,远低于人类水平。研究揭示输入分辨率、OCR能力等内在因素和辅助信息、思维链推理等外部因素对性能有显著影响,为未来视频文本理解研究提供了方向。
ZeroGUI是一项突破性研究,实现了零人工成本下的GUI代理自动化在线学习。由上海人工智能实验室和清华大学等机构联合开发,这一框架利用视觉-语言模型自动生成训练任务并提供奖励反馈,使AI助手能够自主学习操作各种图形界面。通过两阶段强化学习策略,ZeroGUI显著提升了代理性能,在OSWorld环境中使UI-TARS和Aguvis模型分别获得14%和63%的相对改进。该研究彻底消除了传统方法对昂贵人工标注的依赖,为GUI代理技术的大规模应用铺平了道路。