至顶网CIO与CTO频道 05月07日 北京消息:5月7日,腾讯云AI视觉团队正式发布全新的人像分割产品,该产品基于腾讯优图领先的人体分析算法,能够精准识别图像中的人体轮廓边界,与背景进行分离,实现像素级人像分割,有效满足图片、短视频、影视剧等不同场景下的对于人像分割的复杂需求。
以往,图片、视频中要实现人像分割,需要运用PS软件每张、每帧抠图,不仅耗时耗力,抠图效果也主要依赖于个人技术,难以掌控。腾讯云神图·人像分割通过领先的AI技术,可以迅速识别人像、全自动抠图,秒速抠像。同时,像素级分割技术能很好的处理人的发丝部分,整个画面看起来自然不生硬。抠图过程省时省心,且质量有保证。
人像分割技术使用场景广泛,除了可以进行单纯的图片处理,还可应用于相机、视频类应用,以及帮助影视剧进行后期抠像、换背景等特效处理。
具体来说,通过将人像分割技术,在拍摄、直播、线上教学、视频会议过程中,可以帮助用户实时、精准将人物和背景精准识别,实现更精细化的人物美颜、背景虚化或替换,进一步升级了相机、视频应用视觉体验。目前,这项技术已成功在腾讯会议中应用。
在影视剧制作过程中,传统的拍摄因为道具和场地的限制,使得许多特效需要耗费不少时间和精力进行绿幕拍摄和后期制作,导致拍摄成本高。使用腾讯云神图·人像分割技术,能够精准的识别视频中人像区域,进行一键抠像、背景替换、人像虚化等后期处理,无需绿幕拍摄和后期制作,极大地节省时间和人工成本。
除单独使用,人像分割技术还可结合其他AI技术带来更多创新性应用场景。
例如人像分割与人像变换技术结合,使用人像分割进行抠像处理,对人脸进行编辑和生成算法,可做到人脸年龄变化。用户可以用2张照片,人像分割后进行年龄变化,让年轻的自己和现在的自己穿着同样的衣服出现在同一张照片中,形成一种跨时空对话,极大地丰富了社交娱乐新玩法。
人像分割与背景特效结合也是典型应用场景,通过识别图像中的人体轮廓,可以为人像添加各种设定的背景特效,也可对背景进行虚化处理,实现大光圈浅景深的专业相机效果。
据了解,此前腾讯云神图已经发布了人脸识别、人脸融合、人体识别、跨年龄识别等多项实用功能,并在政务、商业、娱乐等多行业落地,具有识别精准、算法领先、稳定可靠、简单易用等特点。
在AI视觉研究和应用创新方面,腾讯云拥有毋庸置疑的优势,腾讯内部众多AI实验室也代表业界最高水准。以腾讯优图实验室来说,目前团队拥有超过700项全球专利,在ICCV、CVPR等顶级会议上有160多篇论文被收录,研究成果更多次在计算机视觉国际权威比赛包括Megaface、LFW、ICDAR、MIREX中刷新世界纪录。
值得一提的是,在今年三月份国际权威研究机构Gartner首次发布的云AI开发者服务魔力象限,腾讯云成为中国唯一入选云厂商。
好文章,需要你的鼓励
IBM Spyre加速器将于本月晚些时候正式推出,为z17大型机、LinuxONE 5和Power11系统等企业级硬件的AI能力提供显著提升。该加速器基于定制芯片的PCIe卡,配备32个独立加速器核心,专为处理AI工作负载需求而设计。系统最多可配置48张Spyre卡,支持多模型AI处理,包括生成式AI和大语言模型,主要应用于金融交易欺诈检测等关键业务场景。
加拿大女王大学研究团队首次对开源AI生态系统进行端到端许可证合规审计,发现35.5%的AI模型在集成到应用时存在许可证违规。他们开发的LicenseRec系统能自动检测冲突并修复86.4%的违规问题,揭示了AI供应链中系统性的"许可证漂移"现象及其法律风险。
意大利初创公司Ganiga开发了AI驱动的智能垃圾分拣机器人Hoooly,能自动识别并分类垃圾和可回收物。该公司产品包括机器人垃圾桶、智能盖子和废物追踪软件,旨在解决全球塑料回收率不足10%的问题。2024年公司收入50万美元,已向谷歌和多个机场销售超120台设备,计划融资300万美元并拓展美国市场。
这项由剑桥大学、清华大学和伊利诺伊大学合作的研究首次将扩散大语言模型引入语音识别领域,开发出Whisper-LLaDA系统。该系统具备双向理解能力,能够同时考虑语音的前后文信息,在LibriSpeech数据集上实现了12.3%的错误率相对改进,同时在大多数配置下提供了更快的推理速度,为语音识别技术开辟了新的发展方向。