Wayve联合创始人兼CEO Alex Kendall看到了将其自动驾驶初创公司技术推向市场的希望。前提是Wayve坚持其战略,确保其自动驾驶软件运行成本低廉、硬件不受限制,且可应用于高级驾驶辅助系统、机器人出租车,甚至机器人领域。
Kendall在英伟达GTC大会上阐述的这一战略,始于端到端的数据驱动学习方法。这意味着系统通过各种传感器(如摄像头)"看到"的内容直接转化为其驾驶方式(如决定刹车或左转)。此外,这也意味着系统不需要依赖高清地图或基于规则的软件,这与早期版本的自动驾驶技术不同。
这种方法吸引了投资者。Wayve成立于2017年,过去两年已筹集超过13亿美元资金,计划向汽车和车队合作伙伴(如Uber)授权其自动驾驶软件。
该公司尚未宣布任何汽车制造商合作伙伴关系,但一位发言人告诉TechCrunch,Wayve正与多家OEM进行"强有力的讨论",以将其软件集成到各种不同类型的车辆中。
其运行成本低廉的软件优势对于达成这些交易至关重要。
Kendall表示,将Wayve的高级驾驶辅助系统(ADAS)应用到新生产车辆的原始设备制造商(OEM)不需要在额外硬件上投资,因为该技术可以与现有传感器配合工作,这些传感器通常包括环绕摄像头和一些雷达。
Wayve还是"芯片不受限"的,这意味着它可以在OEM合作伙伴车辆中已有的任何GPU上运行其软件,据Kendall介绍。不过,该初创公司目前的开发车队确实使用了英伟达的Orin系统级芯片。
"进入ADAS领域非常关键,因为它使你能够建立可持续的业务,大规模建立分销网络,并获取数据暴露,以便将系统训练到[Level] 4级别,"Kendall在周三的舞台上说。
(4级驾驶系统意味着它可以在特定条件下自行导航环境,无需人类干预。)
Wayve计划首先在ADAS级别商业化其系统。因此,该初创公司设计的AI驾驶员可以在没有激光雷达的情况下工作——激光雷达是一种使用激光光线测量距离以生成高度准确的3D世界地图的光探测和测距雷达,大多数开发4级技术的公司认为这是必不可少的传感器。
Wayve的自动驾驶方法与特斯拉类似,特斯拉也在开发端到端深度学习模型来驱动其系统并持续改进其自动驾驶软件。正如特斯拉正在尝试做的那样,Wayve希望利用ADAS的广泛推广来收集数据,帮助其系统实现完全自动驾驶。(特斯拉的"全自动驾驶"软件可以执行一些自动驾驶任务,但并非完全自动驾驶。不过,该公司计划在今年夏天推出机器人出租车服务。)
从技术角度看,Wayve和特斯拉方法的主要区别之一是特斯拉只依赖摄像头,而Wayve乐于整合激光雷达以实现近期的完全自动驾驶。
"从长远来看,当你建立可靠性并能够验证某种规模水平时,肯定有机会进一步缩小那个[传感器套件],"Kendall说。"这取决于你想要的产品体验。你想要车辆在雾中更快行驶吗?那么你可能需要其他传感器[如激光雷达]。但如果你愿意让AI理解摄像头的局限性并因此采取防御性和保守性措施呢?我们的AI可以学习到这一点。"
Kendall还预告了GAIA-2,Wayve针对自动驾驶的最新生成式世界模型,该模型在大量真实世界和合成数据的广泛任务上训练其驾驶员。该模型一起处理视频、文本和其他动作,Kendall表示这使Wayve的AI驾驶员在驾驶行为上更具适应性和人性化。
"让我真正兴奋的是你看到的人性化驾驶行为,"Kendall说。"当然,没有手工编码的行为。我们不告诉汽车如何行动。没有基础设施或高清地图,相反,这种新兴行为是数据驱动的,能够应对非常复杂和多样化的场景,包括在训练过程中可能从未见过的场景。"
Wayve与自动驾驶卡车初创公司Waabi有着相似的理念,后者也在追求端到端学习系统。两家公司都强调扩展可以在不同驾驶环境中通用的数据驱动AI模型,并且都依赖生成式AI模拟器来测试和训练其技术。
好文章,需要你的鼓励
Replit与RevenueCat达成合作,将订阅变现工具直接集成至Replit平台。用户只需通过自然语言提示(如"添加订阅"),即可完成应用内购和订阅配置,无需离开平台。RevenueCat管理超8万款应用的订阅业务,每月处理约10亿美元交易。此次合作旨在让"氛围编程"用户在构建应用的同时即可实现商业变现,月收入未达2500美元前免费使用,超出后收取1%费用。
LiVER是由北京大学、北京邮电大学等机构联合提出的视频生成框架,核心创新是将物理渲染技术与AI视频生成结合,通过Blender引擎计算漫反射、粗糙GGX和光泽GGX三种光照图像构成"场景代理",引导视频扩散模型生成光影物理准确的视频。框架包含渲染器智能体、轻量化编码器适配器和三阶段训练策略,支持对光照、场景布局和摄像机轨迹的独立精确控制。配套构建的LiVERSet数据集含约11000段标注视频,实验显示该方法在视频质量和控制精度上均优于现有方法。
所有人都说AI需要护栏,但真正在构建它的人寥寥无几。SkipLabs创始人Julien Verlaguet深耕这一问题已逾一年,他发现市面上多数"护栏"不过是提示词包装。为此,他打造了专为后端服务设计的AI编程智能体Skipper,基于健全的TypeScript类型系统与响应式运行时,实现增量式代码生成与测试,内部基准测试通过率超90%。他认为,编程语言的"人类可读性时代"正走向终结,面向智能体的精确工具链才是未来。
这项由蒙特利尔学习算法研究所(Mila)与麦吉尔大学联合发布的研究(arXiv:2604.07776,2026年4月)提出了AGENT-AS-ANNOTATORS框架,通过模仿人类数据标注的三种角色分工,系统化生成高质量网页智能体训练轨迹。以Gemini 3 Pro为教师模型,仅用2322条精选轨迹对90亿参数的Qwen3.5-9B模型进行监督微调,在WebArena基准上达到41.5%成功率,超越GPT-4o和Claude 3.5 Sonnet,并在从未见过的企业平台WorkArena L1上提升18.2个百分点,验证了"数据质量远比数量重要"这一核心结论。