OpenAI 的 CEO Sam Altman 表示,他的超级创业公司——2022 年 11 月重新点燃人工智能领域的 ChatGPT 软件的创造者——已经掌握了构建通用人工智能的方法。
"我们现在有信心知道如何构建我们传统意义上理解的 AGI," Altman 在周末发布在个人博客上写道。"我们相信,到 2025 年,我们可能会看到第一批 AI 代理 '加入劳动力队伍',并实质性地改变公司的产出。"
然而,AGI 远不止于代理,这是商业软件公司已经讨论了一年的话题。通用人工智能关乎 "光明的未来",Altman 说,超越了为我们处理商业任务的代理。
"我们喜爱我们当前的产品,但我们追求的是光明的未来。有了超级智能,我们可以做任何其他事情。超级智能工具可以大大加速科学发现和创新,远超我们自身的能力,进而大幅提高丰富度和繁荣程度。"
这将让许多科技界的杰出人物感到担忧,比如被称为 "AI 教父" 的 Geoff Hinton,他对当前的 AI 研究发出了警告。还有许多其他人,包括 Elon Musk、苹果联合创始人 Steve Wozniak 和原子科学家公报主席 Rachel Bronson,他们在 2023 年初与数千人一起签署了一封公开信,呼吁暂停 "大规模 AI 实验"。
一些 AI 研究人员,如路易斯维尔大学教授 Roman Yampolskiy,认为我们在狭义定义下已经拥有了 AGI。例证:已经过时的 GPT-4 在数百个领域中普遍优于人类。
"它可以写诗、生成艺术、玩游戏," Yampolskiy 在 TechFirst 播客中告诉我。"没有人类能在所有这些领域竞争,即使是非常有能力的人。所以真的,如果你平均考虑所有现有和假设的未来任务,它已经占据主导地位,因为它如此普遍。"
当然,Altman 谈论的是另一个层次:超级智能 AI,它能够进行研究、创造新的知识领域并发明全新的事物,可能需要——但也可能不需要——人类持续的输入和合作。
Altman 知道这听起来有多么不可思议。
"这现在听起来像科幻小说,甚至谈论它都有点疯狂," 他说。
但他并不担心听起来疯狂。
"我们相当有信心,在未来几年内,每个人都会看到我们所看到的,而且极其谨慎地行动,同时最大化广泛利益和赋能的需求是如此重要," Altman 说。
谈论即将到来的 AGI 往往会引出奇点的概念,这是一个假设的未来时刻,届时由通用人工智能驱动的技术增长变得如此快速和深刻,以至于本质上无法控制和不可逆转,导致人类文明发生巨大且不可预测的变化。
去年,SingularityNet 的 CEO、人工通用智能学会主席和前汉森机器人公司首席科学家 Ben Goertzel 博士告诉我,AGI 只需 3 到 8 年就能实现。
"如果我们想将 AGI 定义为创造出具有真正聪明的人在最佳状态下的通用智能的机器,我会说我们离这个目标只有 3 到 8 年的距离," Goertzel 说。"所以我认为我们已经相当接近了。"
但 Goertzel 并不确信大语言模型是通往 AGI 的道路,也不认为给大语言模型增加一些功能或使其变得更大就能产生通用人工智能。
"另一方面,我认为它们可以成为创造 AGI 的强大加速剂," Goertzel 告诉我。
还有一些研究人员认为整个通用人工智能的概念是被误导的。其中一位是 Neil Lawrence,他是作家、剑桥大学 DeepMind 机器学习教授,以及艾伦图灵研究所高级研究员。
"我认为 AGI 的概念是种荒谬,因为这是对智能本质的误解," Lawrence 说,他写《原子人类》的部分原因就是为了抵制这种倾向。"我们有智能的谱系,能力的谱系。没有一个统治所有的至尊魔戒。智能是多样化的。"
尽管如此,Altman 仍在坚定地向前推进。考虑到 OpenAI 已经取得的成就——ChatGPT 是我主要的搜索引擎和知识引擎——要打败他将是相当具有挑战性的。
显而易见的是,如果 OpenAI 真的成功实现了某种版本的 AGI,许多事情将会非常、非常快速地改变。
Emerj 人工智能研究公司的 CEO 和创始人 Dan Fagella 采访了近 1000 名 AI 专家和商业领袖。他说,这些变化可能包括:
- 大规模自动化 - 显著的劳动力市场破坏 - 潜在的存在威胁 - 全球经济和军事力量的转移 - 以及更多方面
简而言之,AGI 是一个重大事件,Altman 对此心知肚明。
"考虑到我们工作的可能性,OpenAI 不可能是一家普通公司," Altman 说。"能够在这项工作中发挥作用,是何等幸运和令人谦卑的事。"
好文章,需要你的鼓励
亚马逊云服务宣布为S3云对象存储推出向量存储功能S3 Vectors,声称可将AI存储中向量数据的上传、存储和查询成本降低90%。该服务旨在让客户以经济方式在AWS云中存储大量向量数据并进行语义搜索,可替代昂贵的向量数据库。每个S3 Vectors存储桶支持多达1万个向量索引,每个索引可存储数千万个向量。
复旦大学研究团队开发的AnyI2V系统实现了从任意条件图像到视频的生成突破。该系统无需训练即可处理多种输入模态(包括3D网格、点云等),支持用户自定义运动轨迹控制,并通过创新的特征注入和语义掩模技术实现了高质量视频生成,为视频创作领域带来了革命性的便利工具。
AI公司正推动智能体成为下一个职场颠覆者,但专家认为还未成熟。初创公司Mixus推出AI智能体平台,让用户直接通过邮件或Slack与智能体交互,保持人类参与工作流程。该公司已获得260万美元种子轮融资,其最大卖点是易用性。用户可通过文本提示创建智能体,支持多步骤任务执行、团队协作和共享记忆功能。基于Claude 4和OpenAI o3构建,具备网络访问能力,旨在成为不知疲倦的数字同事。
斯坦福大学研究团队开发了KL-tracing方法,能让视频生成AI模型在无需专门训练的情况下进行精确物体追踪。该方法通过在视频帧中添加微小追踪标记,利用模型的物理理解能力预测物体运动轨迹。在真实场景测试中,相比传统方法性能提升16.6%,展现了大型生成模型在计算机视觉任务中的潜力。