生成式AI之前是卷模型,卷参数,现在开始了卷价格。
最早提出低价策略的是私募巨头幻方量化旗下的AI公司深度求索(DeepSeek)。5月6日, DeepSeek发布DeepSeek-V2,其API的定价为:每百万token输入1元、输出2元(32K上下文),价格为GPT-4-Turbo的近百分之一。
卷的第一枪已经打响,之后智谱AI、火山引擎、阿里云、百度智能云、腾讯、科大讯飞等都宣布了降价策略。
从之前大模型厂商的百花齐放,经过一年多的洗礼,市场已经进行了相对的筛选,现在的价格战也将进一步推动这一速度。
目前大模型的商业模式主要包括按调用量收费、SaaS订阅收费、增值服务和解决方案等多种收费形式。
当然降价最终带来的还是抢占更多市场份额和加速商业化进程。会员收取订阅服务费是针对C端用户,API调用主要是针对企业端。C端市场爆发力强、B端市场潜力巨大,厂商在两个市场都各有侧重。
C端市场,应用主要集中在生产力工具和娱乐类产品,写作助手、图片、视频编辑等。B端市场,主要分析用户具体需求,进行定制化的训练。
零售客户走量,高价值客户走质,国内的大模型厂商主要分为两类,一类是创业型,一类是公有云厂商,前者更多会选择C端为主力市场,后者则主要发展B端市场,这和两者的基因有着一定的关联。
创业型厂商多是互联网行业的出走者,对于C端用户的把握和熟悉程度更强,具有更明显的变现意识。公有云厂商背靠算力和基础用户,同样有着先天优势。而且大模型的应用爆发,也将进一步带动公有云的增长。华福证券研报显示,大模型的落地会衍生出更多的微调及推理等需求,将逐步盘活国内AI应用及国产算力发展。
卷价格同时也是一把双刃剑,以技术创新实现应用成本持续降低才是真正利于产业普及和推广。当然,技术到了成熟期后,价格可能就不是第一考虑因素,技术能力才是立身根本。
一些大模型厂商也提出了相应的战略规划来获取市场,并且大家也在不断壮大自身技术。昨天科大讯飞发布了最新的讯飞星火大模型V4.0,在性能指标上有了明显的增强,同时还带来了“个人空间”概念,打造一个“更懂你的AI助手”。
各家厂商都在自己擅长的行业或领域不断拓展,当然企业也要三思而后行,因为对于许多用例来说,一些替代技术比生成式AI模型更有效、更可靠、更易于理解。Gartner认为,现有和成熟AI技术的注意力被生成式AI分散,实际上其他AI技术或技术组合,可能才最适合用于支持特定用例。
企业IT领导者应当充分评估生成式AI是否适用于企业用例、何时应考虑其他AI技术,以及何时应将其他AI技术与生成式AI结合使用。
《数字化转型方略》2024年第6期:http://www.zhiding.cn/dxinsight/2406
好文章,需要你的鼓励
随着员工自发使用生成式AI工具,CIO面临影子AI的挑战。报告显示43%的员工在个人设备上使用AI应用处理工作,25%在工作中使用未经批准的AI工具。专家建议通过六项策略管理影子AI:建立明确规则框架、持续监控和清单跟踪、加强数据保护和访问控制、明确风险承受度、营造透明信任文化、实施持续的角色化AI培训。目标是支持负责任的创新而非完全禁止。
NVIDIA研究团队开发的OmniVinci是一个突破性的多模态AI模型,能够同时理解视觉、听觉和文本信息。该模型仅使用0.2万亿训练样本就超越了使用1.2万亿样本的现有模型,在多模态理解测试中领先19.05分。OmniVinci采用三项核心技术实现感官信息协同,并在机器人导航、医疗诊断、体育分析等多个实际应用场景中展现出专业级能力,代表着AI向真正智能化发展的重要进步。
英国正式推出DaRe2THINK数字平台,旨在简化NHS全科医生参与临床试验的流程。该平台由伯明翰大学和MHRA临床实践研究数据链开发,能够安全传输GP诊所与NHS试验研究人员之间的健康数据,减少医生的管理负担。平台利用NHS现有健康信息,安全筛查来自450多家诊所的1300万患者记录,并使用移动消息系统保持试验对象参与度,为传统上无法参与的人群开辟了研究机会。
Salesforce研究团队发布BLIP3o-NEXT,这是一个创新的图像生成模型,采用自回归+扩散的双重架构设计。该模型首次成功将强化学习应用于图像生成,在多物体组合和文字渲染方面表现优异。尽管只有30亿参数,但在GenEval测试中获得0.91高分,超越多个大型竞争对手。研究团队承诺完全开源所有技术细节。