生成式AI之前是卷模型,卷参数,现在开始了卷价格。
最早提出低价策略的是私募巨头幻方量化旗下的AI公司深度求索(DeepSeek)。5月6日, DeepSeek发布DeepSeek-V2,其API的定价为:每百万token输入1元、输出2元(32K上下文),价格为GPT-4-Turbo的近百分之一。
卷的第一枪已经打响,之后智谱AI、火山引擎、阿里云、百度智能云、腾讯、科大讯飞等都宣布了降价策略。
从之前大模型厂商的百花齐放,经过一年多的洗礼,市场已经进行了相对的筛选,现在的价格战也将进一步推动这一速度。
目前大模型的商业模式主要包括按调用量收费、SaaS订阅收费、增值服务和解决方案等多种收费形式。
当然降价最终带来的还是抢占更多市场份额和加速商业化进程。会员收取订阅服务费是针对C端用户,API调用主要是针对企业端。C端市场爆发力强、B端市场潜力巨大,厂商在两个市场都各有侧重。
C端市场,应用主要集中在生产力工具和娱乐类产品,写作助手、图片、视频编辑等。B端市场,主要分析用户具体需求,进行定制化的训练。
零售客户走量,高价值客户走质,国内的大模型厂商主要分为两类,一类是创业型,一类是公有云厂商,前者更多会选择C端为主力市场,后者则主要发展B端市场,这和两者的基因有着一定的关联。
创业型厂商多是互联网行业的出走者,对于C端用户的把握和熟悉程度更强,具有更明显的变现意识。公有云厂商背靠算力和基础用户,同样有着先天优势。而且大模型的应用爆发,也将进一步带动公有云的增长。华福证券研报显示,大模型的落地会衍生出更多的微调及推理等需求,将逐步盘活国内AI应用及国产算力发展。
卷价格同时也是一把双刃剑,以技术创新实现应用成本持续降低才是真正利于产业普及和推广。当然,技术到了成熟期后,价格可能就不是第一考虑因素,技术能力才是立身根本。
一些大模型厂商也提出了相应的战略规划来获取市场,并且大家也在不断壮大自身技术。昨天科大讯飞发布了最新的讯飞星火大模型V4.0,在性能指标上有了明显的增强,同时还带来了“个人空间”概念,打造一个“更懂你的AI助手”。
各家厂商都在自己擅长的行业或领域不断拓展,当然企业也要三思而后行,因为对于许多用例来说,一些替代技术比生成式AI模型更有效、更可靠、更易于理解。Gartner认为,现有和成熟AI技术的注意力被生成式AI分散,实际上其他AI技术或技术组合,可能才最适合用于支持特定用例。
企业IT领导者应当充分评估生成式AI是否适用于企业用例、何时应考虑其他AI技术,以及何时应将其他AI技术与生成式AI结合使用。
《数字化转型方略》2024年第6期:http://www.zhiding.cn/dxinsight/2406
好文章,需要你的鼓励
Carma Technology 针对 Uber 提起专利侵权诉讼,称其侵犯了涉及拼车系统的五项专利。案情回溯至十年前,凸显专利保护对创新者的重要性,可能对 Uber 及其他公司带来巨大影响。
这项研究展示了如何通过在经济问题上进行后训练,让大语言模型像经济学家一样思考,从而实现战略性泛化能力。研究团队开发了名为Recon的7B参数开源模型,通过在2,100个高质量经济推理问题上进行监督微调和强化学习,不仅提升了模型在经济基准测试上的表现,更重要的是让模型在从未直接训练过的多智能体博弈中展现出合理的战略行为。结果表明,领域对齐的后训练可以作为智能体对齐的可扩展路径,通过结构化推理问题培养出更广泛适用的理性决策能力。
经过暂停战略调整,Automattic 宣布重返 WordPress 开发,包括核心、Gutenberg、Playground 等模块,计划今年推出 6.9 版本,并涉及与 WP Engine 的法律争端。
STORM框架是一种创新的对话系统研究方法,通过模拟用户和AI助手之间的信息不对称来解决意图触发性问题。研究发现中等程度的不确定性(40-60%未知信息)在某些情况下能够优于完全透明,挑战了传统的AI设计假设。通过对四种主流语言模型的测试,团队确定了不同模型在处理用户意图形成过程中的独特特点,为任务导向对话系统设计提供了实用指导。这项研究对隐私保护设计和偏见缓解具有重要启示,表明信息的战略性限制可能比信息最大化更有效。