Digital-adoption.com发布的网络分析数据发现,在最新版本的ChatGPT发布之后,其开发商OpenAI的访问量增长了3572%,从1830万暴增至6.72亿。
今年1月,微软公布了了对OpenAI的第三阶段投资计划,总数额在数十亿美元。如今,微软又祭出Bing搜索引擎的AI支持版本,其中使用的正是ChatGPT。公司CEO萨蒂亚·纳德拉 (Satya Nadella) 认为,AI将从根本上改变各个软件类别,微软希望这项技术能支持Bing每天回答50亿条查询。目前ChatGPT功能仍在预览阶段,但用户可以报名排队等候访问权限。
就在微软发布公告的一天之前,谷歌兼Alphabet那边也放出了名为Bard的竞争对手。这位对手基于谷歌的Lambda技术,据称能通过扩展支持更多用户。一篇讨论Bard的博文写道,“很快,用户就将在搜索中看到AI支持的功能。这些功能会将复杂的信息与多种视角提炼成易于理解的格式,供用户快速了解全局并从中把握更多信息。”
人们也由此看到了在企业内部使用生成式AI的机会。
Kyndryl UK and Ireland公司数据、AI与应用程序实践负责人Carolyn Prior表示,“根据观察,我们发现那些能够实现数据驱动、并真正将AI融入运营体系的组织,以及那些积极探索最新/最佳新兴技术并对数据管理架构做出现代化改造的组织,才能更好地驾驭当前的市场竞争格局。而他们对于AI及其他新兴技术的拥抱和采用,将成为保持竞争优势的关键。”
知识平台提供商eGain认为,软件开发者正越来越多地将生成式AI纳入其产品与服务开发。该公司已经将ChatGPT集成至Instant Answers产品当中。公司CEO Ashu Roy强调,“ChatGPT等生成式AI在知识管理和对话参与方面,开启了激动人心的自动化可能性。Instant Answers在我们的邀请客户内大受欢迎,他们喜欢它依托速度创造的价值。”
知识管理也有助于软件开发者更有效地开展工作。
Brightman Business Solutions公司董事Romy Hughes表示,“ChatGPT能帮助软件开发人员完成一段极具挑战性的代码。”例如,开发者可以询问ChatGPT如何优化现有代码。展望未来,她认为“这项技术将给非编码人员提供一种开发应用程序的可能性,借此推动编程大众化——这与低代码所承诺的收益基本一致,只是功能要强得多。这种大众化浪潮将让组织建立起新的、无需IT部门参与的创新流程,最大程度发挥其他员工的奇思妙想。ChatGPT将让这一切事半功倍。”
Arthur D Little AI公司专家Albert Meige和Gregory Renard则分析了这种技术拉低程序员整体技术水平的风险,并警告称生成的代码很可能包含算法偏差。一旦用于训练算法的数据中存在偏差,就有可能引发不准确或不公平的结果。根据Meige和Renard的介绍,尽管各方一直在努力消除此类偏差,但其仍然存在而且令人相当不安。
他们还列举了ChatGPT的一个分析示例,当被要求编写Python程序来根据某人的出身确定其是否应被监禁时,ChatGPT将关注重点放在了朝鲜、叙利亚和伊朗人身上。而且这种判定标准被硬编码进了Python代码,这种偏见很可能源自对互联网上对话内容的广泛分析。
虽然这个示例本身非常简单,毕竟在判断是否应当监禁时肯定要考虑其他因素,但也说明使用ChatGPT生成代码确实存在风险,而且其模型很容易被训练数据中的偏差/偏见所误导。
企业面临的另一个问题,则是生成式AI训练所对应的巨大成本,特别是训练数据中潜在偏差可能带来的高风险。《哈佛商业评论》最近发布报道,称训练生成式AI目前还是少数科技巨头的专利,因为训练过程要消耗大量数据和算力。文章作者引用了ChatGPT所基于的GPT-3模型的数据,称其初始训练要用到45 TB的数据素材,做出预测则使用了1750亿个参数。因此,GPT-3的单次训练成本就高达1200万美元。
作者们警告称,“大多数企业并没有相应的数据中心或云计算容量,来从零开始训练自己的同类模型。”
从这个角度看,率先将生成式AI引入自家搜索引擎的是微软和谷歌,也就在情理之中了。至于其他不具备这种巨头级计算设施和数据储备的组织来说,GPT系技术在短期内恐怕无法带来切实助益。
好文章,需要你的鼓励
Docker公司发布重大新功能,旨在简化智能体AI应用的构建、运行和部署。公司扩展了Docker Compose工具以支持AI智能体和模型的大规模部署,并推出Docker Offload服务,允许开发者将AI工作负载转移到云端。新功能还支持模型上下文协议网关的安全连接,并与谷歌云、微软Azure等合作伙伴集成。
这项研究首次将在线强化学习成功应用于流匹配模型,通过巧妙的ODE到SDE转换和去噪减少策略,显著提升了AI图像生成的精确度和可控性。在复合场景生成、文字渲染等任务上取得突破性进展,为AI生成领域开辟了新的技术路径。
欧盟发布AI法案实施细则,要求谷歌、Meta、OpenAI等公司承诺不使用盗版材料训练AI,详细披露训练数据来源和模型设计理念。新规还要求公司尊重付费墙和网站爬虫限制,公开训练和推理的总能耗,并在5-10天内向欧盟AI办公室报告安全事件。违规企业可能面临年销售额7%或3%的罚款。
这篇由阿里巴巴集团联合多所知名高校发表的综述论文,系统梳理了统一多模态理解与生成模型的最新发展。研究将现有模型分为扩散、自回归和混合三大类型,详细分析了不同图像编码策略的特点,整理了相关数据集和评估基准,并深入探讨了当前面临的技术挑战。