人工智能 关键字列表
希伯来大学开发的免费AI导演:一句话变多幅电影级故事板

希伯来大学开发的免费AI导演:一句话变多幅电影级故事板

希伯来大学研究团队开发的Story2Board系统实现了从文字故事到专业故事板的自动转换突破。该系统采用潜在面板锚定和相互注意力数值混合两项核心技术,在保持角色一致性的同时实现丰富的视觉表现力。系统无需训练即可运行,能够生成电影级构图效果的连续画面,为内容创作、教育和娱乐产业提供了强大的AI辅助工具,代表了人机协作创作的新模式。

音乐创作新革命:上海AI实验室让你只需输入歌词就能生成完整歌曲

音乐创作新革命:上海AI实验室让你只需输入歌词就能生成完整歌曲

上海AI实验室等机构联合开发的SongGen系统实现了AI音乐生成的重大突破,能够在单一阶段同时生成人声和伴奏,用户只需输入歌词和描述就能创作完整歌曲。该系统提供混合和双轨两种生成模式,支持语音克隆功能,在多项评估中超越传统多阶段方法。研究团队还构建了包含54万样本的开源数据集,并将完整代码和数据公开发布,为AI音乐创作的民主化奠定基础。

Amazon首次公开无需运行环境训练网络安全AI的突破性方法

Amazon首次公开无需运行环境训练网络安全AI的突破性方法

亚马逊AI实验室联合莫纳什大学开发的Cyber-Zero框架,首次实现了无需运行环境的网络安全AI训练。通过分析公开CTF解题报告,用双AI模型模拟真实解题过程,生成高质量训练数据。训练后的开源模型性能可媲美顶级商业模型,在成本效益上具有显著优势,为网络安全AI技术普及化提供了新路径。

耶鲁大学团队开发"虚拟细胞建筑师":一台能独立设计生物实验的AI超级助手

耶鲁大学团队开发"虚拟细胞建筑师":一台能独立设计生物实验的AI超级助手

这项研究开发了CellForge系统,通过多个AI专家协作自动化虚拟细胞建模全流程。系统在六种不同生物学场景测试中全面超越现有方法,预测误差最高降低40%,相关性提升20%。该技术将传统需要数月专家协作的工作压缩至几小时,成本从数千美元降至几美元,有望大幅降低科研门槛并加速生命科学发现。

阿里巴巴发布Qwen-Image:让AI画出完美中文字的图像生成新时代

阿里巴巴发布Qwen-Image:让AI画出完美中文字的图像生成新时代

阿里巴巴Quen团队发布了图像生成模型Qwen-Image,在复杂文字渲染和精准图像编辑方面实现重大突破。该模型通过创新的数据处理流程和渐进式训练策略,不仅在英文文字渲染上表现出色,更在中文字符生成方面远超现有模型,准确率达到58.30%。同时具备多任务处理能力,可进行图像编辑、深度估计、新视角合成等操作,为AI图像生成技术开启新纪元。

BITS Goa团队推出AlignGuard-LoRA:让AI安全微调不再左右为难的"防护盾"技术

BITS Goa团队推出AlignGuard-LoRA:让AI安全微调不再左右为难的"防护盾"技术

BITS Goa团队联合Meta AI和Amazon AI开发的AlignGuard-LoRA技术,创新性地解决了AI微调过程中的安全性流失问题。该方法通过Fisher信息矩阵识别安全关键参数,将更新分解为安全维护和任务学习两个独立组件,并设计碰撞感知正则化防止组件干扰。实验显示,该技术能将安全漂移降低50%,同时保持任务性能不变。

腾讯团队让AI学会在游戏中边玩边学:从"知道"到"会做"的智能飞跃

腾讯团队让AI学会在游戏中边玩边学:从"知道"到"会做"的智能飞跃

腾讯研究团队提出Think-In-Games(TiG)框架,成功解决大语言模型"知道但不会做"的核心问题。该方法通过让AI在《王者荣耀》游戏中实际互动学习,将强化学习与语言模型优势结合,使AI既能做出正确决策又能解释推理过程。实验显示14B参数小模型性能超越671B大模型,证明了专门化训练的有效性。

OPPO研究团队重新定义AI智能体:一个模型完成多智能体协作的Chain-of-Agents革命

OPPO研究团队重新定义AI智能体:一个模型完成多智能体协作的Chain-of-Agents革命

OPPO AI团队提出Chain-of-Agents新范式,让单个大语言模型内在模拟多智能体协作,解决传统多智能体系统效率低、成本高的问题。通过多智能体蒸馏和强化学习训练的AFM模型在20个基准测试中创造新纪录,推理成本降低84.6%,为AI智能体发展指出全新方向。

动画角色也能秒变真人演员:同济大学团队让任何角色都能自由表演动作

动画角色也能秒变真人演员:同济大学团队让任何角色都能自由表演动作

同济大学研究团队开发的CharacterShot系统实现了突破性进展,仅需一张角色图片和动作序列即可生成高质量4D角色动画。该技术通过双重注意力机制和邻居约束4D高斯点云优化,解决了传统方法中姿态与视角分离建模的难题,将动画制作时间从数月缩短至20-40分钟,为内容创作、游戏开发、教育应用等领域提供了经济便捷的解决方案。

阿里巴巴推出WebWatcher:一个能看图能思考的AI搜索助手,让信息查找像侦探破案一样智能

阿里巴巴推出WebWatcher:一个能看图能思考的AI搜索助手,让信息查找像侦探破案一样智能

阿里巴巴通义实验室推出WebWatcher,这是首个能同时处理图片和文字的深度研究AI助手。它像数字侦探一样,能主动搜索网页、分析图片、执行计算,通过多步推理解决复杂问题。在多项基准测试中,WebWatcher显著超越GPT-4o等知名系统,特别是在需要跨模态信息整合的任务中表现突出,代表了AI助手向真正智能推理的重要进展。

Canva收购Leonardo.ai 加强生成式AI技术布局

Canva收购Leonardo.ai 加强生成式AI技术布局

Canva宣布收购生成式AI内容创作初创公司Leonardo.ai,交易条款未披露,但采用现金加股票的混合方式。Leonardo.ai的120名员工将全部加入Canva。Leonardo.ai成立于2022年,拥有1900万注册用户,其工具已创建超过10亿张图像。该公司将继续独立运营,专注于快速创新和研发。此次收购旨在帮助Canva扩展其Magic Studio生成式AI套件功能。

亚马逊Quick Suite:企业智能体AI的入门训练平台

亚马逊Quick Suite:企业智能体AI的入门训练平台

亚马逊推出Quick Suite软件平台,旨在简化AI智能体和企业聊天机器人的创建过程。该平台支持50个企业级应用集成,包括Office 365、Slack等,提供无代码环境连接内部文档和数据源。平台包含Quick Flows自动化工具、Quick Research研究功能等组件。尽管降低了技术门槛,但AI智能体的准确性仍存疑虑,研究显示其办公任务错误率达70%。

忘记训练,在AI推理阶段寻找杀手级应用

忘记训练,在AI推理阶段寻找杀手级应用

大多数企业不会训练自己的AI模型,而是专注于将AI应用到生产环境和推理阶段。核心任务包括数据微调和管理。关键技术包括检索增强生成、向量数据库、AI提示重用和副驾驶功能,让用户能用自然语言查询企业信息。由于GPU硬件更新速度快且成本高昂,企业更倾向于租用云端GPU容量。真正的AI价值在于推理阶段快速整理数据并优化现有模型。

Infor推出行业专用AI智能体应对企业挑战

Infor推出行业专用AI智能体应对企业挑战

Infor发布新的行业专用人工智能智能体套件,声称通用AI工具未能提供商业价值。新的Infor行业AI智能体旨在自动化制造、分销和服务行业的运营工作流程。MIT研究显示,95%的企业未从生成式AI投资中获得价值。Infor将AI直接集成到微垂直领域的特定流程中,基于现有的行业流程目录构建。同时推出Leap云迁移计划,为本地ERP部署提供固定费用保障。

OpenAI战略转型:AMD与英伟达合作释放重要信号

OpenAI战略转型:AMD与英伟达合作释放重要信号

AMD股价本周飙升23.71%,受益于与OpenAI的高调合作。该协议将从2026年下半年开始为OpenAI提供1吉瓦计算能力,并给予OpenAI高达1.6亿股AMD普通股的期权。此举发生在OpenAI与英伟达签署1000亿美元协议两周后,标志着OpenAI向垂直整合计算、数据和模型训练的转变。通过同时押注AMD和英伟达,OpenAI正在供应商间制造竞价压力,确保竞争性定价的同时锁定供应稳定性,展现了其在AI基础设施领域的战略布局能力。

Meta将把React移交给Linux基金会以消除单一厂商主导担忧

Meta将把React移交给Linux基金会以消除单一厂商主导担忧

Meta宣布将React、React Native和JSX贡献给Linux基金会下的全新React基金会,强调"任何单一公司或组织都不应过度主导"。React基金会将由七家企业成员组成,包括亚马逊、Meta、微软、Vercel等,负责维护React基础设施、商标管理和生态赞助。作为最受欢迎的JavaScript框架,React自2013年创建以来使用率超过80%。此举旨在建立独立的技术治理结构,解决生态系统中对供应商影响力的不满。

分布式数据存储初创公司欲挑战云计算巨头

分布式数据存储初创公司欲挑战云计算巨头

AI公司爆发式增长推动计算需求激增,但大多数企业仍依赖AWS、谷歌云和微软Azure存储数据。Tigris Data开发AI原生存储平台,通过本地化数据中心网络满足分布式计算需求,数据可自动复制到GPU所在位置,支持数十亿小文件并提供低延迟访问。该公司刚完成2500万美元A轮融资,旨在打破传统云服务商的垄断地位。

NetApp为阿斯顿马丁F1车队提供全面数据存储解决方案

NetApp为阿斯顿马丁F1车队提供全面数据存储解决方案

阿斯顿马丁阿美F1车队已完成向NetApp存储系统的全面迁移。NetApp系统支持AI驱动的设计、仿真和比赛策略,用于遥测分析、赛事策略优化和赛车性能提升。该解决方案基于FlexPod融合基础架构和StorageGRID对象存储,覆盖英国工厂到各赛道的混合云环境,实现PB级数据的高效处理和传输。

英特尔发布Panther Lake笔记本处理器,预览288核服务器芯片

英特尔发布Panther Lake笔记本处理器,预览288核服务器芯片

英特尔今日发布基于最新18A制造工艺的Panther Lake笔记本处理器系列,将在亚利桑那州新建的Fab 52工厂生产。该系列包含三款系统级芯片,最高配置拥有16核CPU和12核GPU。新处理器采用四芯片设计,集成神经处理单元,每秒可执行50万亿次运算。相比上代产品,CPU和GPU性能提升50%,能耗降低10%。英特尔还预览了即将推出的Clearwater Forest服务器处理器系列,最高配置288个E核心。

加拿大女王大学:开源AI生态系统中的"版权炸弹"即将引爆?

加拿大女王大学:开源AI生态系统中的"版权炸弹"即将引爆?

加拿大女王大学研究团队首次对开源AI生态系统进行端到端许可证合规审计,发现35.5%的AI模型在集成到应用时存在许可证违规。他们开发的LicenseRec系统能自动检测冲突并修复86.4%的违规问题,揭示了AI供应链中系统性的"许可证漂移"现象及其法律风险。