AI的热潮一浪接一浪,迄今为止没有丝毫退却的迹象,最近更是扩展到了视频领域。
今年2月,OpenAI发布的Sora让众多用户大为惊叹,它能够根据文本生成超现实的视频,预示着未来每个人都有可能颠覆传统的好莱坞影视制作模式。
一些人认为,Sora的能力已经到了令人担忧的地步,因为人工智能生成的视频已经足以让人难以辨认真伪。Sora可以生成涉及多个角色、特定动作以及精确主题和背景细节的复杂场景。
影视行业的未来并非被颠覆,而可能是彻底转型。AI生成视频的一个巨大优势是,在不依赖实景拍摄的情况下,可以迅速创造出现实中无法实现的内容。
除了Sora,Runway和Pika等AI视频工具也颇受关注。中国的一些企业,例如生数科技与清华大学合作,最近发布的Vidu实现了16秒长视频的生成,这也是一个重要的突破。
在本期数字化转型方略中,我们深入探讨了几款市场上的热门AI视频产品,虽然目前看来AI视频在实际使用中仍面临各种挑战,但还是展示了巨大的潜力。
总的来说,AI视频生成技术正以前所未有的速度重塑视频产业,不仅极大地丰富了内容创作者的工具箱,也促进了视频娱乐和教育行业的创新。
相信随着技术的进一步完善和应用领域的扩展,AI在视频生成领域的作用将变得更加突出和关键。
这将开启视频内容创作和分发的新纪元。
《数字化转型方略》2024年第4期:http://www.zhiding.cn/dxinsight/2404
好文章,需要你的鼓励
生成式AI的兴起让谷歌和Meta两大科技巨头受益匪浅。谷歌母公司Alphabet第三季度广告收入同比增长12%达742亿美元,云服务收入增长33%至151.5亿美元,季度总收入首次突破千亿美元大关。Meta第三季度收入512.5亿美元,同比增长26%。两家公司都将大幅增加AI基础设施投资,Meta预计2025年资本支出提升至700亿美元,Alphabet预计达910-930亿美元。
ServiceNow等机构联合研究团队提出了RULER和I-MROPE两项创新技术,解决GUI自动化中AI难以准确定位界面元素的核心问题。RULER技术为AI提供明确空间参考系统,I-MROPE技术平衡位置编码的频率分配。实验显示在高分辨率界面上定位准确率从31.1%提升至37.2%,为GUI自动化的实际应用铺平道路。
谷歌DeepMind开发的多智能体AI系统通过让多个AI代理相互协作、讨论和辩论来解决复杂问题。该系统在医疗领域表现出色,能够在两天内完成人类十年的研究成果,包括发现新的药物重新定位候选物和治疗方案。AI临床医生"Amy"不仅能生成更好的诊断方案,还表现出比人类医生更强的同理心。这项技术有望在十年内实现零边际成本的全球医疗服务普及。
上海交大团队开发SurveyBench评估体系,系统检验AI学术综述写作能力。研究发现,虽然AI在语言流畅度等表面指标上接近人类水平,但在内容深度、技术细节和抽象总结方面仍有显著差距,平均比人类综述低21%。研究揭示AI写综述面临深度理解不足、缺乏关联思维、抽象能力有限三大挑战,建议未来采用人机协作模式。