最近Adobe的一个宣传片在朋友圈里被很多人转发。
大家都在惊叹效率被再次打破,这也是Adobe Summit 2023发布的一款全新的创意生成式人工智能(AI)模型集 Firefly。
一直以来,Adobe有一个不变和一个变。不变就是Adobe从创始初一直是通过数字体验改变世界的决心,变的是Adobe不断在整个数字体验品牌上创新。
“现在的企业管理者最关注成本和营收两件事,实现可持续性的盈利增长。”Adobe大中华区解决方案顾问总监聂双艺说,Adobe在40年里一直聚焦数字企业和客户体验的管理,通过数字体验改变世界。
Adobe大中华区解决方案顾问总监聂双艺
今年Adobe Summit的创新相比往年不管在广度还是深度都更加丰富,而且有一些创新是颠覆性的创新。
Adobe的产品架构由三大基础,五大原则和四大产品组成,三大基础是数据、内容和Adobe Sensei;五大原则是拉动客户在各个渠道上留下的痕迹,将数据节点打通形成完整的客户画像、实时性、营销技术架构的深度整合、易用性、数据隐私和安全;四大产品是数据洞察、电商体验、客户流程、营销规划。
Adobe其实一直在利用人工智能希望进一步解放设计师、市场营销人员和管理者。今年在生成式人工智能上Adobe有两个重要发布,第一个是创意生成式人工智能(AI)模型集Firefly,第二个是Adobe Experience Cloud的生成式AI创新服务Sensei GenAI。
在Firefly的支持下,无论是何种经验和技能水平的内容创作者,都能按自己的语言生成理想的内容,从图像、音频、矢量图、视频和3D到诸如画笔、色彩渐变和视频转换等创意成分。
并且Adobe还推出了Firefly的测试版,通过测试Adobe将与创意社区和客户沟通,在发展这个颠覆性技术的同时,开始将之整合至旗下的应用程序中。首批与Firefly整合的应用程序将会是Adobe Experience Manager、Adobe Photoshop和Adobe Illustrator。
Adobe的生成式AI区别于其他厂商,最重要的特点就是确保商业用图的安全性。Adobe大中华区Experience Cloud高级产品经理张丹说道,Firefly是基于Adobe Stock素材库、公开许可内容和版权已过期的公共领域内容训练的,并且在训练过程中,我们利用程序或人工在把关尽量排除里面可能带来伦理或者是偏见性的问题。

Adobe大中华区Experience Cloud高级产品经理张丹
Adobe Experience Cloud的策略是聚焦于客户体验管理、实时客户体验平台、数量广泛的集成且由人工智能支持的应用程序、充分利用Adobe的品牌和全球影响力、规模化的企业市场推广。
Sensei GenAI服务原生集成在Adobe Experience Cloud中,可以重构端到端的营销工作流程。通过Microsoft Azure OpenAI的ChatGPT服务和FLAN-T5等不同的大型语言模型(LLM),Sensei GenAI将让品牌能立即产出和修改任何客户触点上以文字为基础的体验,且这些体验将会符合公司的独特需求,从品牌方针、产品特定词汇到客户洞察。
Sensei GenAI服务主要会从营销文案生成、对话式体验、受众和客户旅程建立以及生成文字说明这四个方面。Sensei GenAI将率先原生整合到Adobe Experience Manager、Adobe Journey Optimizer、Adobe Real Time Customer Data Platform、Customer Journey Analytics和Marketo Engage等应用程序,支持从规划和资产创建到个性化和客户旅程管理等使用情境。
同时Adobe还发布了全球首个内容供应链解决方案,高效连接Adobe Creative Cloud和Adobe Experience Cloud功能,以端到端的解决方案帮助品牌用更短的时间规划、制作、交付并分析更多内容。Adobe希望通过内容供应链来更来释放内容的生产力,来应对现在大规模个性化内容上的需求。
现在的Adobe正在通过生成式AI、产品分析、Adobe实时CDP、内容供应链不断创新,同时推出针对特定用例的全新Adobe Experience Cloud产品组合。
好文章,需要你的鼓励
OpenAI首席执行官Sam Altman表示,鉴于投资者的AI炒作和大量资本支出,我们目前正处于AI泡沫中。他承认投资者对AI过度兴奋,但仍认为AI是长期以来最重要的技术。ChatGPT目前拥有7亿周活跃用户,是全球第五大网站。由于服务器容量不足,OpenAI无法发布已开发的更好模型,计划在不久的将来投资万亿美元建设数据中心。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
英伟达推出新的小型语言模型Nemotron-Nano-9B-v2,拥有90亿参数,在同类基准测试中表现最佳。该模型采用Mamba-Transformer混合架构,支持多语言处理和代码生成,可在单个A10 GPU上运行。独特的可切换推理功能允许用户通过控制令牌开启或关闭AI推理过程,并可管理推理预算以平衡准确性和延迟。模型基于合成数据集训练,采用企业友好的开源许可协议,支持商业化使用。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。