生成式AI之前是卷模型,卷参数,现在开始了卷价格。
最早提出低价策略的是私募巨头幻方量化旗下的AI公司深度求索(DeepSeek)。5月6日, DeepSeek发布DeepSeek-V2,其API的定价为:每百万token输入1元、输出2元(32K上下文),价格为GPT-4-Turbo的近百分之一。
卷的第一枪已经打响,之后智谱AI、火山引擎、阿里云、百度智能云、腾讯、科大讯飞等都宣布了降价策略。
从之前大模型厂商的百花齐放,经过一年多的洗礼,市场已经进行了相对的筛选,现在的价格战也将进一步推动这一速度。
目前大模型的商业模式主要包括按调用量收费、SaaS订阅收费、增值服务和解决方案等多种收费形式。
当然降价最终带来的还是抢占更多市场份额和加速商业化进程。会员收取订阅服务费是针对C端用户,API调用主要是针对企业端。C端市场爆发力强、B端市场潜力巨大,厂商在两个市场都各有侧重。
C端市场,应用主要集中在生产力工具和娱乐类产品,写作助手、图片、视频编辑等。B端市场,主要分析用户具体需求,进行定制化的训练。
零售客户走量,高价值客户走质,国内的大模型厂商主要分为两类,一类是创业型,一类是公有云厂商,前者更多会选择C端为主力市场,后者则主要发展B端市场,这和两者的基因有着一定的关联。
创业型厂商多是互联网行业的出走者,对于C端用户的把握和熟悉程度更强,具有更明显的变现意识。公有云厂商背靠算力和基础用户,同样有着先天优势。而且大模型的应用爆发,也将进一步带动公有云的增长。华福证券研报显示,大模型的落地会衍生出更多的微调及推理等需求,将逐步盘活国内AI应用及国产算力发展。
卷价格同时也是一把双刃剑,以技术创新实现应用成本持续降低才是真正利于产业普及和推广。当然,技术到了成熟期后,价格可能就不是第一考虑因素,技术能力才是立身根本。
一些大模型厂商也提出了相应的战略规划来获取市场,并且大家也在不断壮大自身技术。昨天科大讯飞发布了最新的讯飞星火大模型V4.0,在性能指标上有了明显的增强,同时还带来了“个人空间”概念,打造一个“更懂你的AI助手”。
各家厂商都在自己擅长的行业或领域不断拓展,当然企业也要三思而后行,因为对于许多用例来说,一些替代技术比生成式AI模型更有效、更可靠、更易于理解。Gartner认为,现有和成熟AI技术的注意力被生成式AI分散,实际上其他AI技术或技术组合,可能才最适合用于支持特定用例。
企业IT领导者应当充分评估生成式AI是否适用于企业用例、何时应考虑其他AI技术,以及何时应将其他AI技术与生成式AI结合使用。
《数字化转型方略》2024年第6期:http://www.zhiding.cn/dxinsight/2406
好文章,需要你的鼓励
很多人担心被AI取代,陷入无意义感。按照杨元庆的思路,其实无论是模型的打造者,还是模型的使用者,都不该把AI放在人的对立面。
MIT研究团队提出递归语言模型(RLM),通过将长文本存储在外部编程环境中,让AI能够编写代码来探索和分解文本,并递归调用自身处理子任务。该方法成功处理了比传统模型大两个数量级的文本长度,在多项长文本任务上显著优于现有方法,同时保持了相当的成本效率,为AI处理超长文本提供了全新解决方案。
谷歌宣布对Gmail进行重大升级,全面集成Gemini AI功能,将其转变为"个人主动式收件箱助手"。新功能包括AI收件箱视图,可按优先级自动分组邮件;"帮我快速了解"功能提供邮件活动摘要;扩展"帮我写邮件"工具至所有用户;支持复杂问题查询如"我的航班何时降落"。部分功能免费提供,高级功能需付费订阅。谷歌强调用户数据安全,邮件内容不会用于训练公共AI模型。
华为研究团队推出SWE-Lego框架,通过混合数据集、改进监督学习和测试时扩展三大创新,让8B参数AI模型在代码自动修复任务上击败32B对手。该系统在SWE-bench Verified测试中达到42.2%成功率,加上扩展技术后提升至49.6%,证明了精巧方法设计胜过简单规模扩展的技术理念。