Wayve联合创始人兼CEO Alex Kendall看到了将其自动驾驶初创公司技术推向市场的希望。前提是Wayve坚持其战略,确保其自动驾驶软件运行成本低廉、硬件不受限制,且可应用于高级驾驶辅助系统、机器人出租车,甚至机器人领域。
Kendall在英伟达GTC大会上阐述的这一战略,始于端到端的数据驱动学习方法。这意味着系统通过各种传感器(如摄像头)"看到"的内容直接转化为其驾驶方式(如决定刹车或左转)。此外,这也意味着系统不需要依赖高清地图或基于规则的软件,这与早期版本的自动驾驶技术不同。
这种方法吸引了投资者。Wayve成立于2017年,过去两年已筹集超过13亿美元资金,计划向汽车和车队合作伙伴(如Uber)授权其自动驾驶软件。
该公司尚未宣布任何汽车制造商合作伙伴关系,但一位发言人告诉TechCrunch,Wayve正与多家OEM进行"强有力的讨论",以将其软件集成到各种不同类型的车辆中。
其运行成本低廉的软件优势对于达成这些交易至关重要。
Kendall表示,将Wayve的高级驾驶辅助系统(ADAS)应用到新生产车辆的原始设备制造商(OEM)不需要在额外硬件上投资,因为该技术可以与现有传感器配合工作,这些传感器通常包括环绕摄像头和一些雷达。
Wayve还是"芯片不受限"的,这意味着它可以在OEM合作伙伴车辆中已有的任何GPU上运行其软件,据Kendall介绍。不过,该初创公司目前的开发车队确实使用了英伟达的Orin系统级芯片。
"进入ADAS领域非常关键,因为它使你能够建立可持续的业务,大规模建立分销网络,并获取数据暴露,以便将系统训练到[Level] 4级别,"Kendall在周三的舞台上说。
(4级驾驶系统意味着它可以在特定条件下自行导航环境,无需人类干预。)
Wayve计划首先在ADAS级别商业化其系统。因此,该初创公司设计的AI驾驶员可以在没有激光雷达的情况下工作——激光雷达是一种使用激光光线测量距离以生成高度准确的3D世界地图的光探测和测距雷达,大多数开发4级技术的公司认为这是必不可少的传感器。
Wayve的自动驾驶方法与特斯拉类似,特斯拉也在开发端到端深度学习模型来驱动其系统并持续改进其自动驾驶软件。正如特斯拉正在尝试做的那样,Wayve希望利用ADAS的广泛推广来收集数据,帮助其系统实现完全自动驾驶。(特斯拉的"全自动驾驶"软件可以执行一些自动驾驶任务,但并非完全自动驾驶。不过,该公司计划在今年夏天推出机器人出租车服务。)
从技术角度看,Wayve和特斯拉方法的主要区别之一是特斯拉只依赖摄像头,而Wayve乐于整合激光雷达以实现近期的完全自动驾驶。
"从长远来看,当你建立可靠性并能够验证某种规模水平时,肯定有机会进一步缩小那个[传感器套件],"Kendall说。"这取决于你想要的产品体验。你想要车辆在雾中更快行驶吗?那么你可能需要其他传感器[如激光雷达]。但如果你愿意让AI理解摄像头的局限性并因此采取防御性和保守性措施呢?我们的AI可以学习到这一点。"
Kendall还预告了GAIA-2,Wayve针对自动驾驶的最新生成式世界模型,该模型在大量真实世界和合成数据的广泛任务上训练其驾驶员。该模型一起处理视频、文本和其他动作,Kendall表示这使Wayve的AI驾驶员在驾驶行为上更具适应性和人性化。
"让我真正兴奋的是你看到的人性化驾驶行为,"Kendall说。"当然,没有手工编码的行为。我们不告诉汽车如何行动。没有基础设施或高清地图,相反,这种新兴行为是数据驱动的,能够应对非常复杂和多样化的场景,包括在训练过程中可能从未见过的场景。"
Wayve与自动驾驶卡车初创公司Waabi有着相似的理念,后者也在追求端到端学习系统。两家公司都强调扩展可以在不同驾驶环境中通用的数据驱动AI模型,并且都依赖生成式AI模拟器来测试和训练其技术。
好文章,需要你的鼓励
数据分析平台公司Databricks完成10亿美元K轮融资,公司估值超过1000亿美元,累计融资总额超过200亿美元。公司第二季度收入运营率达到40亿美元,同比增长50%,AI产品收入运营率超过10亿美元。超过650家客户年消费超过100万美元,净收入留存率超过140%。资金将用于扩展Agent Bricks和Lakebase业务及全球扩张。
Meta与特拉维夫大学联合研发的VideoJAM技术,通过让AI同时学习外观和运动信息,显著解决了当前视频生成模型中动作不连贯、违反物理定律的核心问题。该技术仅需添加两个线性层就能大幅提升运动质量,在多项测试中超越包括Sora在内的商业模型,为AI视频生成的实用化应用奠定了重要基础。
医疗信息管理平台Predoc宣布获得3000万美元新融资,用于扩大运营规模并在肿瘤科、研究网络和虚拟医疗提供商中推广应用。该公司成立于2022年,利用人工智能技术提供端到端平台服务,自动化病历检索并整合为可操作的临床洞察。平台可实现病历检索速度提升75%,临床审查时间减少70%,旨在增强而非替代临床判断。
上海AI实验室发布OmniAlign-V研究,首次系统性解决多模态大语言模型人性化对话问题。该研究创建了包含20万高质量样本的训练数据集和MM-AlignBench评测基准,通过创新的数据生成和质量管控方法,让AI在保持技术能力的同时显著提升人性化交互水平,为AI价值观对齐提供了可行技术路径。