生成式AI之前是卷模型,卷参数,现在开始了卷价格。
最早提出低价策略的是私募巨头幻方量化旗下的AI公司深度求索(DeepSeek)。5月6日, DeepSeek发布DeepSeek-V2,其API的定价为:每百万token输入1元、输出2元(32K上下文),价格为GPT-4-Turbo的近百分之一。
卷的第一枪已经打响,之后智谱AI、火山引擎、阿里云、百度智能云、腾讯、科大讯飞等都宣布了降价策略。
从之前大模型厂商的百花齐放,经过一年多的洗礼,市场已经进行了相对的筛选,现在的价格战也将进一步推动这一速度。
目前大模型的商业模式主要包括按调用量收费、SaaS订阅收费、增值服务和解决方案等多种收费形式。
当然降价最终带来的还是抢占更多市场份额和加速商业化进程。会员收取订阅服务费是针对C端用户,API调用主要是针对企业端。C端市场爆发力强、B端市场潜力巨大,厂商在两个市场都各有侧重。
C端市场,应用主要集中在生产力工具和娱乐类产品,写作助手、图片、视频编辑等。B端市场,主要分析用户具体需求,进行定制化的训练。
零售客户走量,高价值客户走质,国内的大模型厂商主要分为两类,一类是创业型,一类是公有云厂商,前者更多会选择C端为主力市场,后者则主要发展B端市场,这和两者的基因有着一定的关联。
创业型厂商多是互联网行业的出走者,对于C端用户的把握和熟悉程度更强,具有更明显的变现意识。公有云厂商背靠算力和基础用户,同样有着先天优势。而且大模型的应用爆发,也将进一步带动公有云的增长。华福证券研报显示,大模型的落地会衍生出更多的微调及推理等需求,将逐步盘活国内AI应用及国产算力发展。
卷价格同时也是一把双刃剑,以技术创新实现应用成本持续降低才是真正利于产业普及和推广。当然,技术到了成熟期后,价格可能就不是第一考虑因素,技术能力才是立身根本。
一些大模型厂商也提出了相应的战略规划来获取市场,并且大家也在不断壮大自身技术。昨天科大讯飞发布了最新的讯飞星火大模型V4.0,在性能指标上有了明显的增强,同时还带来了“个人空间”概念,打造一个“更懂你的AI助手”。
各家厂商都在自己擅长的行业或领域不断拓展,当然企业也要三思而后行,因为对于许多用例来说,一些替代技术比生成式AI模型更有效、更可靠、更易于理解。Gartner认为,现有和成熟AI技术的注意力被生成式AI分散,实际上其他AI技术或技术组合,可能才最适合用于支持特定用例。
企业IT领导者应当充分评估生成式AI是否适用于企业用例、何时应考虑其他AI技术,以及何时应将其他AI技术与生成式AI结合使用。
《数字化转型方略》2024年第6期:http://www.zhiding.cn/dxinsight/2406
好文章,需要你的鼓励
机器人和自动化工具已成为云环境中最大的安全威胁,网络犯罪分子率先应用自动化决策来窃取凭证和执行恶意活动。自动化攻击显著缩短了攻击者驻留时间,从传统的数天减少到5分钟内即可完成数据泄露。随着大语言模型的发展,"黑客机器人"将变得更加先进。企业面临AI快速采用压力,但多数组织错误地关注模型本身而非基础设施安全。解决方案是将AI工作负载视为普通云工作负载,应用运行时安全最佳实践。
MBZUAI研究团队发布了史上最大的开源数学训练数据集MegaMath,包含3716亿个Token,是现有开源数学数据集的数十倍。该数据集通过创新的数据处理技术,从网页、代码库和AI合成等多个来源收集高质量数学内容。实验显示,使用MegaMath训练的AI模型在数学推理任务上性能显著提升,为AI数学能力发展提供了强大支撑。
面对心理健康专业人士短缺问题,谷歌、麦肯锡和加拿大重大挑战组织联合发布《心理健康与AI现场指南》,提出利用AI辅助任务分担模式。该指南构建了包含项目适应、人员选择、培训、分配、干预和完成六个阶段的任务分担模型,AI可在候选人筛选、培训定制、客户匹配、预约调度和治疗建议等环节发挥作用。该方法通过将部分治疗任务分配给经过培训的非专业人员,并运用AI进行管理支持,有望缓解治疗服务供需失衡问题。
这项由多个知名机构联合开展的研究揭示了AI系统的"隐形思维"——潜在推理。不同于传统的链式思维推理,潜在推理在AI内部连续空间中进行,不受语言表达限制,信息处理能力提升约2700倍。研究将其分为垂直递归和水平递归两类,前者通过重复处理增加思考深度,后者通过状态演化扩展记忆容量。