8月1日,百度对外宣布版权图片开放合作平台正式上线,包括视觉中国、全景等国内知名机构均加入了该平台,共同为更多用户提供高质量、有版权的精彩图片内容。与此同时,百度版权图片开放平台也正式开放了机构入驻申请通道,希望将图片内容提供方与需求方进行连接,满足多方需求。
百度版权图片开放平台正式上线
作为用户搜索图片的最重要渠道,百度图片搜索每天为数以亿计的用户提供图片检索服务。但当前的图片内容领域依旧面临正版图库搜索难、推广资源稀缺、版权意识薄弱、图片被盗维权难等问题。百度版权图片开放平台上线的初衷,就是希望通过百度图片的流量、技术优势,为用户提供高质、高效的图片检索体验,并且更好地帮助版权机构保护正版图片的品牌价值,保障图片内容提供方与需求方的权益。
在百度图片里搜索“香港”,来自版权方的图片会有明显的标识
据了解,图片机构在入驻百度版权图片开放平台后,将会获得百度图片搜索、百度像素等多款百度产品的流量支持,帮助他们更多地对品牌、内容进行曝光;此外,用户在图片搜索中搜索图片资源时,来自于版权机构的图片会有明显的版权标识,用户可以直接通过跳转的方式,来到版权图片机构的页面进行购买等操作,为版权方提供更多的商业机会;最后,百度还应用图片技术对全网图片进行检测、对比,帮助机构识别、打击侵权行为。
图片详情的版权标识,点击网址可直接进入购买页面
近年来,网络上内容创作的价值不断凸显,文字内容、视频内容都已经形成了比较稳定健康的生态,相比之下,图片内容的价值尚未完全被释放。此前,百度图片曾经针对摄影师这一图片内容创作者群体推出“源”计划,为他们提供版权标识、品牌曝光、流量等支持;而百度此次推出的版权图片开放平台,瞄准的则是图片机构方。通过与摄影师群体、图片机构的多方合作,百度希望能够围绕图片内容建立一个大的平台,不但丰富百度自身的内容生态,同时也为用户、合作方提供更好的体验、更大的价值。
百度图片相关负责人表示:“我们希望打造一个最大最全的版权图片共享平台,通过汇聚内容提供方的海量优质图片,依托百度自身技术与平台精准触达用户,再以用户需求与意识的变化反哺内容创作者与机构,这样形成一个有效的生态闭环,共同丰富与平衡版权图片生态。”
好文章,需要你的鼓励
这篇研究提出了OThink-R1,一种创新的大型推理模型,能够像人类一样在快速直觉思维和慢速深度推理之间自动切换。研究者发现,现有推理模型即使面对简单问题也会生成冗长的推理过程,导致计算资源浪费。通过分析推理轨迹并使用LLM评判员区分冗余和必要推理,OThink-R1能根据问题复杂度动态调整思考深度。实验表明,该方法平均减少了23.4%的生成文本量,同时保持或提高了准确率,代表了向更高效、更人性化AI推理系统迈出的重要一步。
这项研究提出了SHARE,一种新型文本到SQL修正框架,它利用三个小型语言模型(SLM)协同工作,实现高效精准的SQL错误修正。SHARE首先通过基础行动模型将SQL转换为行动轨迹,再经过模式增强模型和逻辑优化模型的层次化精细化修正。研究团队还创新性地提出了层次化自演化训练策略,大大提高了训练数据效率。实验结果表明,SHARE在多个基准测试上显著提升了SQL生成准确率,计算成本仅为传统方法的十分之一,并展现出强大的泛化能力,适用于各种生成器模型和SQL方言。
这项由香港大学和南京大学等机构研究人员联合开发的双专家一致性模型(DCM)解决了高质量视频生成中的效率难题。研究团队发现扩散模型蒸馏过程中存在优化冲突:早期阶段负责语义布局与运动,后期阶段关注细节精修,两者学习动态差异显著。DCM创新性地将这两个任务分配给不同的专家模型,通过参数高效的实现方式,使模型仅需4步即可生成接近50步原始模型质量的视频,大幅提升生成速度,为实用化AI视频创作铺平道路。
这项研究介绍了QARI-OCR,一种基于Qwen2-VL-2B-Instruct模型微调的阿拉伯文字识别系统。研究团队通过三阶段合成数据训练,成功解决了阿拉伯文字识别中的主要挑战:曲线连笔特性、上下文变化的字母形状和发音符号。QARI v0.2模型创下了0.061的字符错误率和0.160的单词错误率,超越了现有开源解决方案,为阿拉伯文化遗产的数字化保存提供了重要工具。