生成式AI之前是卷模型,卷参数,现在开始了卷价格。
最早提出低价策略的是私募巨头幻方量化旗下的AI公司深度求索(DeepSeek)。5月6日, DeepSeek发布DeepSeek-V2,其API的定价为:每百万token输入1元、输出2元(32K上下文),价格为GPT-4-Turbo的近百分之一。
卷的第一枪已经打响,之后智谱AI、火山引擎、阿里云、百度智能云、腾讯、科大讯飞等都宣布了降价策略。
从之前大模型厂商的百花齐放,经过一年多的洗礼,市场已经进行了相对的筛选,现在的价格战也将进一步推动这一速度。
目前大模型的商业模式主要包括按调用量收费、SaaS订阅收费、增值服务和解决方案等多种收费形式。
当然降价最终带来的还是抢占更多市场份额和加速商业化进程。会员收取订阅服务费是针对C端用户,API调用主要是针对企业端。C端市场爆发力强、B端市场潜力巨大,厂商在两个市场都各有侧重。
C端市场,应用主要集中在生产力工具和娱乐类产品,写作助手、图片、视频编辑等。B端市场,主要分析用户具体需求,进行定制化的训练。
零售客户走量,高价值客户走质,国内的大模型厂商主要分为两类,一类是创业型,一类是公有云厂商,前者更多会选择C端为主力市场,后者则主要发展B端市场,这和两者的基因有着一定的关联。
创业型厂商多是互联网行业的出走者,对于C端用户的把握和熟悉程度更强,具有更明显的变现意识。公有云厂商背靠算力和基础用户,同样有着先天优势。而且大模型的应用爆发,也将进一步带动公有云的增长。华福证券研报显示,大模型的落地会衍生出更多的微调及推理等需求,将逐步盘活国内AI应用及国产算力发展。
卷价格同时也是一把双刃剑,以技术创新实现应用成本持续降低才是真正利于产业普及和推广。当然,技术到了成熟期后,价格可能就不是第一考虑因素,技术能力才是立身根本。
一些大模型厂商也提出了相应的战略规划来获取市场,并且大家也在不断壮大自身技术。昨天科大讯飞发布了最新的讯飞星火大模型V4.0,在性能指标上有了明显的增强,同时还带来了“个人空间”概念,打造一个“更懂你的AI助手”。
各家厂商都在自己擅长的行业或领域不断拓展,当然企业也要三思而后行,因为对于许多用例来说,一些替代技术比生成式AI模型更有效、更可靠、更易于理解。Gartner认为,现有和成熟AI技术的注意力被生成式AI分散,实际上其他AI技术或技术组合,可能才最适合用于支持特定用例。
企业IT领导者应当充分评估生成式AI是否适用于企业用例、何时应考虑其他AI技术,以及何时应将其他AI技术与生成式AI结合使用。
《数字化转型方略》2024年第6期:http://www.zhiding.cn/dxinsight/2406
好文章,需要你的鼓励
随着大语言模型在人工智能时代展现强大力量,可穿戴设备成为收集人体数据的重要载体。通过实时监测血压、心率、血糖等生命体征,结合AI边缘计算能力,医疗正向个性化转型。基因治疗、数字孪生技术让每个人都能拥有专属的医疗数字化身,实现从"报销型医疗"向"创新循证医疗"的转变,为疾病预防和健康管理带来革命性突破。
哥伦比亚大学研究团队开发了MathBode动态诊断工具,通过让数学题参数按正弦波变化来测试AI的动态推理能力。研究发现传统静态测试掩盖了AI的重要缺陷:几乎所有模型都表现出低通滤波特征和相位滞后现象,即在处理快速变化时会出现失真和延迟。该方法覆盖五个数学家族的测试,为AI模型选择和部署提供了新的评估维度。
在巴黎举办的欧洲开放基础设施峰会期间,专门用一整天时间讨论VMware迁移问题。博通收购VMware后许可证价格上涨,导致客户运营成本大幅增加。开源开发者展示了将VMware虚拟机迁移到开源替代方案的产品。Forrester分析师指出VMware客户对此感到信任破裂。OpenStack等开源解决方案虽然复杂度较高,但提供了健康的开源生态系统替代方案。
这项研究首次发现AI推理模型存在"雪球效应"问题——推理过程中的小错误会逐步放大,导致AI要么给出危险回答,要么过度拒绝正常请求。研究团队提出AdvChain方法,通过训练AI学习"错误-纠正"过程来获得自我纠错能力。实验显示该方法显著提升了AI的安全性和实用性,用1000个样本达到了传统方法15000个样本的效果,为AI安全训练开辟了新方向。