从2022年11月30日,OpenAI发布ChatGPT后,生成式AI的大势就一发不可收拾。
2月7日,微软宣布对Bing搜索引擎和Edge网络浏览器进行升级,将支持ChatGPT,提升搜索和回答能力。
2月8日,谷歌推出了聊天机器人产品Bard,作为ChatGPT最重要的挑战者,Bard却在现场演示时,尴尬出错。
3月15日,OpenAI发布多模态大型语言模型GPT-4,它可以处理超2.5万字的文本,并支持图像输入。
3月16日,百度文心一言正式发布,展现了文学创作、商业文案创作、数理推算、中文理解、多模态生成五个使用场景中的综合能力。
3月17日,微软宣布名为Microsoft 365 Copilot的AI产品将应用于Word、Excel、PowerPoint、Outlook、Teams等产品中。
3月21日,Adobe推出创意生成式人工智能(AI)模型集——Adobe Firefly,聚焦于图像生成和文本效果,其将整合至Adobe Creative Cloud、Document Cloud、Experience Cloud和Express Cloud的工作流程中。
3月23日,OpenAI宣布,开始为ChatGPT引入插件,帮助ChatGPT访问最新信息、运行计算或使用第三方服务。
几个月间,几乎每天都有关于生成式AI的消息,之前我们做过一期ChatGPT特刊来专门介绍它,这次我们则针对ChatGPT及其相关产品将会对产业带来哪些变化进行讨论。
这次我们问了很多人一个问题,ChatGPT的出现为您或您的企业带来的最大价值是什么?他们都给出了积极的反馈。而且一位CIO还提出了今天我们谈论生成式AI,它代表的不仅是技术,这其中也反映出了整个行业的焦虑和短板。
作为报道前沿科技的我们,也早早接入了ChatGPT,在使用ChatGPT的过程中我明显感觉到它的学习能力之强。我们不要把它当做一个搜索引擎,给它一些素材学习,你可能会得到一个意想不到的结果。
找灵感、写问题、列大纲、翻译都是我经常使用ChatGPT干的事,企业也都在寻找场景的结合点,我们看到金融和教育行业应该是最先应用的行业,像金融里的客服、智能投顾、辅助开发等,教育行业里的智能辅导、智能答题、智能导师、语言学习等都是我们已经能看到的落地场景。
ChatGPT就像一颗石子,当它落入水中之时,也激起了层层涟漪,而且涟漪还将不断扩大,将整个水面带入其中。
《数字化转型方略》2023年第3期:http://www.zhiding.cn/dxinsight/2303
好文章,需要你的鼓励
腾讯ARC实验室推出AudioStory系统,首次实现AI根据复杂指令创作完整长篇音频故事。该系统结合大语言模型的叙事推理能力与音频生成技术,通过交错式推理生成、解耦桥接机制和渐进式训练,能够将复杂指令分解为连续音频场景并保持整体连贯性。在AudioStory-10K基准测试中表现优异,为AI音频创作开辟新方向。
Coursera在2025年连接大会上宣布多项AI功能更新。10月将推出角色扮演功能,通过AI人物帮助学生练习面试技巧并获得实时反馈。新增AI评分系统可即时批改代码、论文和视频作业。同时引入完整性检查和监考系统,通过锁定浏览器和真实性验证打击作弊行为,据称可减少95%的不当行为。此外,AI课程构建器将扩展至所有合作伙伴,帮助教育者快速设计课程。
Meta与特拉维夫大学联合研发的VideoJAM技术,通过让AI同时学习外观和运动信息,显著解决了当前视频生成模型中动作不连贯、违反物理定律的核心问题。该技术仅需添加两个线性层就能大幅提升运动质量,在多项测试中超越包括Sora在内的商业模型,为AI视频生成的实用化应用奠定了重要基础。