人工智能 关键字列表
MinIO融合对象存储与表格数据 为生成式AI工作负载提供统一存储

MinIO融合对象存储与表格数据 为生成式AI工作负载提供统一存储

MinIO正成为AI多模态数据存储平台,为AI提供数据访问和使用工具。该公司意识到自己本质上是键值数据库公司,键值存储可同时容纳非结构化对象数据和结构化表格数据。对于结构化数据,MinIO通过AI生成代码来理解表格数据结构,而非传统的向量化方式。MinIO支持KV缓存卸载,并提供promptObject API,让用户可像与LLM对话一样查询非结构化对象,桥接了对象存储、向量数据库和SQL数据库访问。

AI推动云计算三巨头增长,微软优势最明显

AI推动云计算三巨头增长,微软优势最明显

在截至6月的季度中,微软、亚马逊AWS和谷歌云三大云服务提供商都受益于AI技术的推动。微软凭借其庞大的平台和应用客户基础,在AI功能集成方面表现突出,核心系统业务收入达222.7亿美元,同比增长36.8%。AWS在AI基础设施上投入巨大,资本支出达331亿美元。谷歌云收入136.2亿美元,营业收入同比增长2.4倍。微软目前拥有全球最大且最具盈利能力的平台业务。

OpenMind要做人形机器人的安卓操作系统

OpenMind要做人形机器人的安卓操作系统

硅谷初创公司OpenMind正在开发名为OM1的机器人软件层,旨在成为人形机器人的操作系统。该公司将自己比作机器人领域的安卓系统,因其软件开源且硬件无关。公司还推出了FABRIC协议,允许机器人验证身份并与其他机器人共享信息。OpenMind计划9月前交付首批10台搭载OM1系统的机器狗,并已完成由Pantera Capital领投的2000万美元融资。

大语言推理模型效果不佳:数十亿投资面临挑战

大语言推理模型效果不佳:数十亿投资面临挑战

苹果公司研究显示,Claude、Gemini、DeepSeek-R1等大型推理模型在复杂问题上表现令人失望。研究发现,在低复杂度任务中,常规模型优于推理模型;中等复杂度时推理模型稍好但耗费10-50倍计算资源;高复杂度下两者均失效。专家认为这些模型只是复杂的模式匹配,缺乏真正推理能力。对冲基金CEO更倾向预测性AI,研究者建议结合符号AI与神经网络构建神经符号AI系统。

美光科技成为先进AI领域的关键供应商

美光科技成为先进AI领域的关键供应商

在AI发展中,GPU备受关注,但AI训练和推理还需要存储和内存来管理数据和模型。美光科技正迅速崛起为AI数据层的关键供应商。该公司在HBM3E和HBM4内存技术方面取得突破,性能效率比竞争对手高30%,已成为AMD和英伟达下一代AI平台的主要内存供应商。美光还制定了2000亿美元的制造扩张计划,支持美国本土制造业发展。

Snowflake与Databricks争夺企业AI市场核心地位

Snowflake与Databricks争夺企业AI市场核心地位

Snowflake和Databricks已成为企业AI项目中最受CIO青睐的两大平台。两家公司起初定位不同,Databricks专注非结构化数据处理和实时分析,Snowflake则专注云端数据仓库的抽象化和简化。随着生成式AI的爆发,两家公司在数据科学和机器学习平台市场展开直接竞争。专家认为,Snowflake在易用性、安全性和结构化数据分析方面表现出色,而Databricks则提供开发者友好的环境和强大的AI工具支持。

锁定9月13日,2025 AI创新者大会暨第二届提示工程峰会即将来袭
2025-08-04

锁定9月13日,2025 AI创新者大会暨第二届提示工程峰会即将来袭

2025年9月13日,“2025 AI创新者大会暨第二届提示工程峰会”将在北京召开。

OpenAI ChatGPT学习模式定制指令解析揭示提示工程核心技巧

OpenAI ChatGPT学习模式定制指令解析揭示提示工程核心技巧

本文深入分析OpenAI新发布的ChatGPT学习模式背后的自定义指令机制。学习模式通过教育专家协作制定的自定义指令,引导AI采用循序渐进的教学方式,而非直接给出答案。文章将自定义指令分为五个部分:总体目标、严格规则、行动指南、语调方法和重点强调。这些指令体现了优秀的提示工程技巧,可应用于其他AI场景。作者强调自定义指令的强大功能,建议用户通过分段结构化方式制定指令,并进行充分测试和调试以确保效果。

生成式AI如何改变我们的工作方式

生成式AI如何改变我们的工作方式

生成式AI正从理论概念转变为实用工具,深刻改变着各行业的工作模式。从营销到财务,从客服到开发,AI不再是简单的自动化工具,而是成为智能协作伙伴。它帮助团队快速生成内容、分析数据、优化流程,将员工从繁琐事务中解放出来,专注于战略思考和创新。然而,技能不足、信任缺失和组织准备不充分仍是主要障碍,企业需要通过系统培训、明确治理和有目的的实验来充分发挥AI潜力。

未来顶尖开发者不再只是编码,而是策划、协调和指挥AI

未来顶尖开发者不再只是编码,而是策划、协调和指挥AI

随着AI技术不断发展,初级编程工作正在消失。ChatGPT、GitHub Copilot等AI助手已能处理重复性脚本、HTML布局等基础任务。初学者现在需要具备系统级思维和产品管理能力。未来开发者将更像拥有技术专长的产品经理,负责指导AI完成工作。团队结构也在改变,一个AI增强的开发者可能替代整个团队。成功的关键在于培养无法自动化的技能,学会与AI协作而非竞争。

JAM音乐生成器:新加坡科技设计大学让电脑学会作词谱曲,词曲同步精准到每个字

JAM音乐生成器:新加坡科技设计大学让电脑学会作词谱曲,词曲同步精准到每个字

新加坡科技设计大学研究团队开发了JAM音乐生成系统,能够根据歌词生成完整歌曲,并实现词级精确时间控制。该系统仅用5.3亿参数就超越了参数量更大的同类系统,在歌词准确性、音乐质量等方面表现优异。通过创新的流匹配技术和审美对齐机制,JAM为AI音乐创作提供了新的技术路径。

突破性技术让AI变得更聪明:西湖大学团队彻底改变多模态AI的"记忆负担"

突破性技术让AI变得更聪明:西湖大学团队彻底改变多模态AI的"记忆负担"

西湖大学研究团队发表突破性论文,提出多模态大语言模型的令牌压缩技术。该技术能将AI处理图像、视频、音频时的信息量压缩80%以上,同时保持90%以上的准确率,有望解决当前AI系统"记忆不够用"的核心问题,为智能手机、医疗影像、自动驾驶等领域带来重大突破。

俄罗斯医疗AI突破:让电子病历自动生成疾病代码,准确率超越医生

俄罗斯医疗AI突破:让电子病历自动生成疾病代码,准确率超越医生

俄罗斯研究团队开发出首个针对俄语医疗记录的ICD自动编码系统RuCCoD,通过BERT、大语言模型和检索增强技术实现医疗诊断的智能编码。研究发现AI编码在训练诊断预测模型时比医生手工编码效果更好,准确率提升28%,为医疗信息化和临床辅助决策提供了新思路。

AI也有自己的"内心OS"?科学家首次破解大模型推理思考的神秘机制

AI也有自己的"内心OS"?科学家首次破解大模型推理思考的神秘机制

俄罗斯人工智能研究院等机构的研究团队首次成功破解了大语言模型内部推理机制的奥秘。他们使用稀疏自编码器技术将AI模型复杂的内部状态分解成可理解的功能组件,并开发了ReasonScore评分系统来识别负责推理的特定组件。通过精确调节这些"推理组件",研究团队实现了AI推理能力的显著提升,为开发更可控、更透明的AI系统奠定了基础。

阿里巴巴推出START:让AI也能像人一样用工具解题的突破性进展

阿里巴巴推出START:让AI也能像人一样用工具解题的突破性进展

阿里巴巴研究团队开发出START系统,首次让AI能像人类一样在推理过程中主动使用编程工具。通过创新的"提示注入"和自学习技术,START在数学竞赛和编程测试中表现显著提升,在AIME24达到66.7%准确率,比基础模型提升16.7%。这项突破性研究为AI推理能力带来质的飞跃,大幅减少计算错误和"幻觉"现象。

NVIDIA发布STORM系统:让AI看懂长视频的神奇技术突破

NVIDIA发布STORM系统:让AI看懂长视频的神奇技术突破

NVIDIA研究团队开发的STORM系统实现了AI长视频理解的重大突破。该系统采用Mamba时间编码技术,能够像人类一样理解视频的时间脉络和内容关联,而非孤立分析每帧画面。通过创新的三种压缩策略,STORM在大幅提升处理效率的同时保持了理解准确性,在多项基准测试中超越现有系统5%以上,为教育、医疗、安防等领域的智能化应用奠定了技术基础。

大语言模型智能代理评估大全:全球顶尖研究机构首次绘制AI代理能力地图

大语言模型智能代理评估大全:全球顶尖研究机构首次绘制AI代理能力地图

这项由希伯来大学、IBM研究院和耶鲁大学联合完成的综合性研究,首次系统梳理了大语言模型智能代理评估领域的完整现状,涵盖基础能力评估、应用场景测试、通用能力考量和开发框架四大维度,为这个快速发展的领域绘制了详细地图,并指出了向现实化、动态化、细粒度评估发展的重要趋势。

AI对齐与控制技术的现状与挑战探析

AI对齐与控制技术的现状与挑战探析

随着AI系统复杂性不断增加,AI对齐技术成为确保系统安全可靠的关键。研究人员正通过人类反馈强化学习、合成数据训练、红队测试等技术手段,以及AI治理、伦理委员会等管理方法来引导AI行为。然而,价值观的多样性和AI系统的"迎合性"行为带来了新挑战。最新研究表明,我们可以理解并调整AI内部表征参数来控制系统输出。控制AI不仅是技术挑战,更是道德和政治选择问题。

谷歌推出强大创造性问题解决AI模型Gemini 2.5 Deep Think

谷歌推出强大创造性问题解决AI模型Gemini 2.5 Deep Think

谷歌DeepMind发布Gemini 2.5 Deep Think,这是一款新的创意问题解决AI模型。该模型能够同时考虑多个想法并选择最佳答案来解决复杂问题。Deep Think通过延长"思考时间",探索不同假设以找到创意解决方案。新模型在编程、科学知识和推理能力基准测试中表现优异,特别擅长迭代开发、数学研究和复杂编程问题。该工具将在Gemini应用中向Ultra订阅用户提供,月费250美元。

Google发布Gemini 2.5 Deep Think仅供AI Ultra订阅用户使用

Google发布Gemini 2.5 Deep Think仅供AI Ultra订阅用户使用

谷歌正式推出其最强大的Gemini 2.5深度思考AI模型,但仅向每月250美元的AI Ultra订阅用户开放。该模型基于Gemini 2.5 Pro,通过增加"思考时间"和并行分析来处理复杂查询。深度思考模型在多个基准测试中表现优异,在人类最终考试中得分34.8%,远超其他模型的20-25%。该模型特别擅长数学推理、科学分析和编程,响应时间需要数分钟,每日使用次数有限制。