大模型 关键字列表
体验完百度世界2024上的iRAG,我觉得AI绘图也可以没有幻觉了。

体验完百度世界2024上的iRAG,我觉得AI绘图也可以没有幻觉了。

本质上,他是不是大模型按照自己的知识库回答,然后先通过一些工程化手段,比如联网搜索,比如文档搜索等等,先把相关信息给找出来,让大模型根据这些信息来进行回答。

上新“学术搜索” ,夸克成为年轻人PC端首选AI应用

上新“学术搜索” ,夸克成为年轻人PC端首选AI应用

年轻人学习、办公青睐电脑端AI应用,夸克PC端下载量行业第一。

李开复:零一万物的目标是,让大模型帮助企业赚到钱

李开复:零一万物的目标是,让大模型帮助企业赚到钱

大模型的应用落地仍面临诸多挑战。许多企业对大模型充满期待,却对如何将其融入自身业务感到困惑。如何选择合适的模型?如何进行模型训练和部署,最大限度地发挥大模型的价值、实现降本增效?这些问题如同层层迷雾,阻碍着企业拥抱AI的步伐。

ChatGPT新域名曝光,史上最贵顶级域名之一!

ChatGPT新域名曝光,史上最贵顶级域名之一!

OpenAI首席执行官Sam Altman公开确认购买了该域名,没有说收购价格。但肯定比之前1100万美元收购的AI.com(也是跳转到ChatGPT)贵很多。

赋能AI应用,引领智媒时代 新华三出席2024中国电影电视技术学会年会

赋能AI应用,引领智媒时代 新华三出席2024中国电影电视技术学会年会

当前,AI技术已成为媒体新质生产力的核心引擎。从新闻热点聚合、内容策划到创作和分发,再到传播力分析,AIGC赋能媒体业务全流程,显著提升了生产效率。然而,在向AI转型的过程中,媒体也面临着诸多挑战,例如算力需求的满足、专属大模型的打造、相关技能的学习、内容安全机制的制定,等等。

IBM Granite 3.0模型:为大规模企业AI应用指明方向

IBM Granite 3.0模型:为大规模企业AI应用指明方向

IBM在企业AI领域做出了一系列颇为独特的探索。蓝色巨人目前正在推动全栈技术布局,以自2020年来兴起的AI和混合云作为企业战略领域的两大基础性支柱,同时借鉴了自身在其产品组合中积累下的优势。

刚刚,OpenAI开源SimpleQA!轻松检测、校准大模型能力

刚刚,OpenAI开源SimpleQA!轻松检测、校准大模型能力

目前,很多大模型会出现一本正经胡说八道的问题,例如,你提问NBA历史上得分最多的是谁,它回答是迈克尔乔丹,实际上是勒布朗詹姆斯。包括OpenAI自己发布的GPT-4o、o1-preview、o1mini等前沿模型都有这些“幻觉”难题。

智谱AI的AutoGLM后,Google和微软也下场来做“贾维斯”了。

智谱AI的AutoGLM后,Google和微软也下场来做“贾维斯”了。

谷歌准备推出接管计算机的人工智能。上周三Claude、周五智谱AI、周末Google,然后微软。短短一周内,已经有四个公司爆出来要发布类似的产品了,其中三个已经悄悄发布产品:Anthropic的Claude,智谱的AutoGLM和微软的OmniParser。这些产品的能力有目共睹。

智算为生成式AI发展铺路

智算为生成式AI发展铺路

从PC时代到移动互联网时代,再到如今的AI时代,每一轮技术变革都在不断降低使用门槛和开发门槛,智算的发展也将进一步降低生成式AI的应用,使其可以快速推进。

科技部回复人大、政协提案:推进人工智能产业应用和立法工作

科技部回复人大、政协提案:推进人工智能产业应用和立法工作

提案针对我国人工智能大模型产业应用存在的问题,提出强化关键技术研发、促进数据安全共享、加强伦理治理规范、强化人才引培等建议,对提升我国生成式人工智能整体竞争力,推动人工智能快速有序健康发展具有重要意义。

Anthropic发布全新的Haiku 3.5和升级版Sonnet 3.5,大模型控制电脑使用能力强了很多!

Anthropic发布全新的Haiku 3.5和升级版Sonnet 3.5,大模型控制电脑使用能力强了很多!

Anthropic在这次更新中不仅提升了模型的整体性能,还在专业领域如编程、视觉理解等方面取得了显著进步。特别是新增的计算机使用能力,虽然仍处于早期阶段,但展现出了AI与计算机交互的新可能性。

趋势丨2024遍地开花的新能源大模型

趋势丨2024遍地开花的新能源大模型

当前,新能源头部企业对于“智能化”与“AI技术”的定位,早已不再是整齐划一的机械臂和简单存储的云平台了。AI技术正在接受海量样本数据喂养,加速实现行业落地,成为头部企业争先布局的“先手棋”,以保障成功穿越周期,继续领跑未来。

诺奖都颁给AI了,行业却已开启增速焦虑

诺奖都颁给AI了,行业却已开启增速焦虑

大模型的研发和运行确实需要大规模的资源和资金支持,非小规模团队能够轻易承担。这一点在当前的人工智能领域尤为明显。以GPT4-o为例,其训练涉及了文本、视觉和音频等多种数据模态,这意味着它需要处理和分析的数据量是巨大的。据OpenAI透露,GPT-4o在训练过程中使用了多达13兆的数据,这比之前的一些大型模型如LLAMA和PaLM使用的数据量还要多。此外,GPT-4o的模型参数数量也非常庞大,达到了1.8万亿。

一句废话就把OpenAI o1干崩了?大模型的推理能力还真挺脆弱的。

一句废话就把OpenAI o1干崩了?大模型的推理能力还真挺脆弱的。

保持提示词简单直接:模型擅长理解和相应简单、清晰的指令,而不需要大量的指导。 当时我对这一条的理解,觉得是为了让o1模型更好的理解我的要求,同时可以加快模型的处理速度,因为模型不需要花费额外的时间去解析复杂的语句。

新质发展X智领创新|北京· AIGC应用发展高峰论坛倒计时7天!

新质发展X智领创新|北京· AIGC应用发展高峰论坛倒计时7天!

AIGC应用发展高峰论坛暨AIGC100年度评选”将于下周在北京隆重开幕。本次活动将汇聚超过50位顶尖AI创业者,通过主题演讲、圆桌论坛、落地工坊、互动展区、播客马拉松、派对晚宴等多样化的形式,为与会者提供一个全面而深入的AI交流平台。

极智AI | 解读大模型量化算法之GPTQ

极智AI | 解读大模型量化算法之GPTQ

GPTQ 的核心思想是通过最小化量化引入的输出误差,实现高精度低比特量化。具体来说,GPTQ 在后量化过程中,针对每一层的权重矩阵,利用一小部分校准数据,最小化量化前后模型输出的差异。

大模型之家2024年9月热力榜:“快慢”思考引热议,大厂多模态领域齐发力

大模型之家2024年9月热力榜:“快慢”思考引热议,大厂多模态领域齐发力

“慢思考”概念的提出,也引发了全行业的深思。如360两月前便提出的CoE(专家协同)架构。该架构通过整合多个大型模型和专家模型,构建了一个协作网络,实现了“快思考”与“慢思考”的有机结合,进一步提高了推理任务的灵活性和精确度。

视觉能力媲美OpenAI,Meta发布Llama 3.2

视觉能力媲美OpenAI,Meta发布Llama 3.2

这是Meta首款能够理解图像和文本的旗舰视觉模型。

Qwen2.5全家桶发布,包含7种尺寸规模

Qwen2.5全家桶发布,包含7种尺寸规模

本次开源的Qwen2.5语言模型主要包含7种尺寸,0.5B到72B全尺寸覆盖,弥补了Qwen2 14B/32B这两种业务黄金尺寸缺失的遗憾,并且开源了强劲的3B的端侧模型。本次开源,一个字:尺寸丰富,性能强劲。(此外还包括Math、Code和VL专项模型)

人形机器人的灵魂觉醒:钉钉如何激发具身智能,引领产业新风潮?

人形机器人的灵魂觉醒:钉钉如何激发具身智能,引领产业新风潮?

在AI与大模型技术的加持下,人形机器人不再是冷冰冰的钢铁机器,而是拥有了更强大的“大脑”,它们能够理解、推理、学习,甚至与人类进行自然流畅的互动。钉钉,这个我们熟悉的办公平台,在其中扮演什么关键角色?“云启智跃·产业蝶变”本届的“云栖大会”为我们揭开了迷雾。