AI：跨越幻觉抵达真相原创

作者：王聪彬

我们常说的大模型幻觉，就是“胡说八道”。具体是指模型生成的内容与现实世界事实或用户输入不一致的现象。

虽然2023年被称为是大模型元年，但全球科技界普遍认为，今天对于未来的想象力，依然是保守的。

从Chat GPT的出现到百模大战，只用了不到半年时间，生成式AI已经成为一个不得不打，还要打出成绩的战役。

经过一年的沉淀，通用大模型的能力正在逐渐增强，大模型厂商也在将这些能力逐渐下沉，希望真正应用到实际场景产生价值。

行业中也出现了一些产业标准和评测指标，12月22日，国内首个官方“大模型标准符合性评测” 《人工智能大规模预训练模型第2部分：评测指标与方法》结果公布，百度文心一言、腾讯混元大模型、360智脑、阿里云通义千问四款国产大模型首批通过测试。

测试由工信部中国电子技术标准化研究院发起，评测围绕多领域多维度模型评测框架与指标体系，从大模型的通用性、智能性、安全性等维度开展，涵盖语言、语音、视觉等多模态领域。

评测指标与方法的出台，一方面可以评估大模型的能力，一方面可以减少大模型诸如幻觉带来的安全问题、伦理问题。

我们常说的大模型幻觉，就是“胡说八道”。具体是指模型生成的内容与现实世界事实或用户输入不一致的现象。

大模型幻觉问题在于可能会导致误信和误用，特别是在用户未能意识到模型输出的不可靠性时。因此，理解和识别大模型幻觉的存在，对于任何依赖或使用这些技术的人来说都至关重要。

这要求从技术层面持续改进模型的准确性，减少错误和偏差的发生。让我们可以更安全、更有效地利用大模型的强大能力，同时避免或减轻由幻觉带来的负面影响。

最近，来自哈尔滨工业大学和华为的研究团队发表了一篇长达50页的综述，综述给出了一套新的范畴框架来定义模型幻觉，并将其分为事实性幻觉、忠实性幻觉两大类，其中也列出了少不业内比较有代表性减轻幻觉的方法。

本期《数字化转型方略》将探讨大模型的指标和幻觉问题，因为大模型不能只是刷榜，企业可以通过哪些关键指标来做判断是未来应用的关键，还有就是需要持续性关注的大模型的幻觉问题，推动AI向更可靠、更安全的方向发展。

《数字化转型方略》2023年第12期：http://www.zhiding.cn/dxinsight/2312

来源：至顶网CIO与CTO频道

0赞

好文章，需要你的鼓励

AI：跨越幻觉抵达真相 原创

来源：至顶网CIO与CTO频道

2023

12/29

09:47

分享

点赞

WAIC2026 现场直击：开普勒顶流人气王，麒麟系列火爆出圈

面壁智能将密度定律带入具身智能

龙磁科技拟投3.58亿元扩建越南永磁铁氧体基地

首创一层Scale-up网络256卡全互联，摩尔线程MTT C256超节点为万卡及十万卡级集群夯实底座

从高血压诊疗入手，北京安贞医院让医疗大模型走出聊天框

西门子肖松：以场景为牵引，推动工业AI从单点实效迈向生产力跃迁

打造Token极致性价比 新华三震撼亮相2026世界人工智能大会

机器人管家系统上线！傅利叶携多款康养陪伴新品方案亮相WAIC 2026

赛那德“ 自主作业机器人天团” 登陆 WAIC：iLoabot-X+模型双升级，秀出具身场景落地硬实力

西门子Eigen工程智能体中国首发首展，荣获2026 WAIC SAIL之星奖

NVIDIA Cosmos 推动物理 AI 前沿发展

PPIO亮相WAIC 2026：发布智能模型网关，打造面向Agent时代的智能Token工厂

金融服务公司Discover CIO：混合云之旅正在初见成效

宾夕法尼亚大学教授Ethan Mollick：AI 比工业革命中的蒸汽动力更大，很多人还在“秘密”使用

AI：跨越幻觉抵达真相

生成式AI与内容创作前瞻

讯飞写作 开启“美文秀秀”的生产力革新

新华三为AI基建提供智慧算力基础设施

让人着迷的NFT，能复兴什么？

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

三一集团：数字化是必选项，AI是生存项

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

AI：跨越幻觉抵达真相原创

打造Token极致性价比新华三震撼亮相2026世界人工智能大会

讯飞写作开启“美文秀秀”的生产力革新