AI的热潮一浪接一浪,迄今为止没有丝毫退却的迹象,最近更是扩展到了视频领域。
今年2月,OpenAI发布的Sora让众多用户大为惊叹,它能够根据文本生成超现实的视频,预示着未来每个人都有可能颠覆传统的好莱坞影视制作模式。
一些人认为,Sora的能力已经到了令人担忧的地步,因为人工智能生成的视频已经足以让人难以辨认真伪。Sora可以生成涉及多个角色、特定动作以及精确主题和背景细节的复杂场景。
影视行业的未来并非被颠覆,而可能是彻底转型。AI生成视频的一个巨大优势是,在不依赖实景拍摄的情况下,可以迅速创造出现实中无法实现的内容。
除了Sora,Runway和Pika等AI视频工具也颇受关注。中国的一些企业,例如生数科技与清华大学合作,最近发布的Vidu实现了16秒长视频的生成,这也是一个重要的突破。
在本期数字化转型方略中,我们深入探讨了几款市场上的热门AI视频产品,虽然目前看来AI视频在实际使用中仍面临各种挑战,但还是展示了巨大的潜力。
总的来说,AI视频生成技术正以前所未有的速度重塑视频产业,不仅极大地丰富了内容创作者的工具箱,也促进了视频娱乐和教育行业的创新。
相信随着技术的进一步完善和应用领域的扩展,AI在视频生成领域的作用将变得更加突出和关键。
这将开启视频内容创作和分发的新纪元。
《数字化转型方略》2024年第4期:http://www.zhiding.cn/dxinsight/2404
好文章,需要你的鼓励
Forrester副总裁兼首席分析师高恩德在访谈中表示,尽管AI技术广泛存在,但在生产力统计数据中并未体现革命性改变。他引用美国劳工统计局数据指出,个人电脑时代同样未能显著提升生产力增长率。研究显示,95%的生成式AI项目未产生实际投资回报。Forrester预测到2030年AI可能取代6%的工作岗位,约1040万个职位,但目前大部分企业裁员主要出于财务考虑而非AI替代。
中国人民大学联合快手科技研发的DPWriter系统通过创新的"多样化规划分支"策略和智能奖励机制,成功解决了AI写作中质量与创意多样性难以兼得的问题。该系统让AI先制定包含五个维度的详细写作计划,在规划阶段进行创意分支,再配合双重奖励评价体系,实现了在保证写作质量的同时大幅提升创意多样性。实验显示新方法在多样性指标上提升15%,为AI辅助创意写作开辟了新路径。
谷歌发布Personal Intelligence工具,让用户可根据个人偏好定制Gemini聊天机器人。该工具能访问Gmail、谷歌相册和YouTube等服务中的个人数据,提供更精准的回复。例如分析收件箱中的餐厅预订来推荐食谱,或利用汽车照片回答维修问题。工具提供多项隐私控制选项,默认关闭且用户可自定义访问权限。初期仅向美国付费用户开放,未来将扩展至免费账户和国际市场。
ellamind公司研发的sui-1是首个能为长文档摘要提供精确引用标注的AI模型。该24B参数模型通过创新的XML标签系统,为每个摘要观点标注原文出处,解决了AI摘要"不可验证"的核心问题。模型可处理10万词文档,支持200万词超长文档的迭代处理,在准确性测试中达到84.2%,远超同类开源模型。研究团队采用Apache 2.0许可证完全开源模型和训练数据,为政府、法律等需要高准确性的领域提供可信赖的文档分析工具。