近期,Open AI首席科学家Ilya Sutskever接受《麻省理工科技评论》专访,他认为ChatGPT可能有意识(如果你眯起眼睛仔细看的话)。
“总有一天,AGI会实现。也许来自OpenAI,也许来自别的公司。”他说。
事实上,大模型不仅在全球,在中国更是一个迅速发展的区域,并且一度更加深化发展为行业大模型、私域大模型。
在大模型蓬勃发展的背景下,爱数的路径是帮助企业构建数据的入口,投入领域认知智能的创新。10月24日,爱数领域认知智能解决方案巡展北京站上,爱数正在以丰富的全域数据产品与领域认知智能方案重塑企业未来生产力。
领域认知智能让企业用的放心
人工智能发展至今,经历了能存会算的第一代运算智能、能听会说,能看会认的第二代感知智能、能理解会思考的第三代认知智能,现在已经进入到领域认知智能阶段。
领域认知智能是人工智能发展的重要阶段,而爱数也展开了领域认知智能的探索。
爱数专注数据领域已有20年,2019年,正式发布“大数据基础设施”战略,现在以领域认知智能加持全域数据能力,“Data+AI”战略下,爱数大数据基础设施又焕然一新。
爱数产品副总裁李基亮认为,领域认知智能是利用人工智能的手段,基于业务模型,从各类数据中提取领域知识,并利用领域知识和大模型进行知识问答、内容生成和推理分析,解决领域内问题的技术体系。
领域认知智能在AGI时代面向特定技术或行业领域,基于领域数据对大模型进行预训练或调优,并利用知识工程将私域数据加工成领域知识网络。将两种技术结合,让计算机具备面向特定领域的理解、推理、归纳等认知能力。
在爱数看来,领域认知智能的基础是领域知识网络,领域知识网络是围绕领域认知模型的知识表示集合,包括领域知识图谱、领域词库、领域规则库、分析推理模型、领域预训练语言模型等。
这也进一步帮助企业在具体的领域上可以真正落地大模型。爱数AnyDATA领域认知智能框架通过检索增强生成模式(RAG模式),可以低成本帮助企业实现领域化、私有化,充分发挥大模型的推理能力和创造能力,确保私域数据和领域知识库的准确、及时、可解释性。
创新产品能力让企业用的舒心
爱数一直在结构化数据、非结构化数据、机器数据、多云环境所有数据入口迭代进化,为企业提供整套的解决方案,帮助客户在领域认知智能阶段成功。
AnyBackup Family 8,让AnyBackup不再仅仅面向数据保护,而是面向业务的数据管理平台,包括数据备份、副本数据管理、数据治理、数据归档、数据搜索等能力。
AnyBackup的创新优势可以体现在四个方面,第一,备份数据湖,实现海量数据存储、管理与利用;第二,开放架构,赋予平台集成与被集成的能力;第三,勒索病毒防御,守好最后一道防线;第四,赋能业务数据生命周期管理,实现业务敏捷。
针对AGI时代的不可解释以及安全性问题,2023年爱数推出AnyDATA Framework 3领域认知智能框架。面向各类大模型,提供认知应用的开发能力,兼容各类大模型。基于任务的大模型测评,帮助开发者用好大模型。
AGI时代的智能内容管理平台,AnyShare Family 7基于智能化、一体化和平台化的系统架构创新,高效洞察文档,显著提升搜索体验,全方位赋能业务与人,实现以内容改变生产力。
业务驱动的一体化数据运营平台AnyFabric,是基于领域认知智能和Data Fabric实现架构创新,帮助企业构建以业务架构和数据资产架构为中心的知识网络,以业务和数据标准化,指导数据治理,实现高效找数用数的的一体化数据运营。
云原生时代的可观测性平台AnyRobot Eyes 5,基于机器数据湖和全息观测实现架构创新,真正实现运维运营一体化,帮助组织整合机器数据孤岛,实现高效排障和业务敏捷,提升数字化效能。
未来爱数也将持续以数据重塑生产力,共创领域认知智能世界,就像巡展的主题一样“驶向领域深处”。
好文章,需要你的鼓励
香港中文大学与华为诺亚方舟实验室合作开发了PreMoe框架,解决了大型混合专家模型(MoE)在内存受限设备上的部署难题。研究团队发现MoE模型中的专家表现出明显的任务专业化特征,据此提出了概率专家精简(PEP)和任务自适应专家检索(TAER)两大核心技术。实验证明,DeepSeek-R1 671B模型在精简50%专家后仍保持97.2%的MATH500准确率,内存需求降至688GB;而更激进的精简方案(减少87.5%专家)也能保持72.0%的准确率。该方法适用于多种MoE架构,为强大AI系统的广泛部署铺平了道路。
SCIENCEBOARD是一项开创性研究,旨在评估多模态自主智能体在真实科学工作流中的表现。研究团队构建了一个包含169个高质量任务的基准测试,涵盖生物化学、天文学等六个科学领域,并开发了一个真实环境让智能体通过CLI或GUI接口与科学软件交互。实验评估表明,即使是最先进的模型在这些复杂科学任务上的成功率也仅为15%,远低于人类表现,揭示了当前技术的局限性并为未来科学智能体的发展提供了宝贵见解。
帝国理工学院的研究团队开发了AlphaMed,这是首个仅通过极简规则强化学习就能培养医疗推理能力的AI模型,无需依赖传统的思维链示范数据。通过分析数据信息丰富度和难度分布的影响,研究发现高信息量的医疗问答数据是推理能力的关键驱动因素。AlphaMed在六个医疗问答基准上取得了领先成绩,甚至超越了更大的封闭源模型,同时展现出自发的步骤推理能力,为医疗AI发展提供了更加开放、高效的新路径。
Alita是一种新型通用AI代理系统,采用极简设计理念,以"最小预定义,最大自我进化"为原则构建。由普林斯顿大学等多家机构研究团队开发的Alita,只配备一个核心能力和少量通用模块,能自主创建所需工具并重用为模型上下文协议(MCPs)。实验显示,Alita在GAIA基准测试上达到87.27%的通过率,超越包括OpenAI Deep Research在内的复杂系统,证明简约设计可带来卓越性能。