至顶网CIO与应用频道 01月18日 编译:特斯拉已经成为家喻户晓的电动车市场的领导者和先锋,同时也生产和销售先进的电池和太阳能电池板技术。
作为一个对开发和销售自动驾驶汽车有着浓厚兴趣的技术先驱,如今特斯拉对人工智能充满浓厚的兴趣是有道理的。正是在本月,特斯拉的亿万富翁创始人兼首席执行官Elon Musk公开宣布公司正在致力于开发自己的AI硬件。
Musk在他对AI的观点方面一直是直言不讳。他几乎把社会的每一个方面都革新化了,他警告说,这会造成广泛的失业,甚至可能引发第三次世界大战。
Musk同时也是OpenAI的联合创始人之一,该组织致力于确保以安全、可管理的方式开发和部署人工智能,最大限度地减少机器人可能会对人类造成的任何潜在风险。
尽管目前关于特斯拉新AI技术的细节少之又少,但人们相信该技术将会采用特斯拉自动驾驶仪软件的“思考”算法,该算法目前给予特斯拉汽车有限的(2级)自动驾驶能力水平。Musk说,他相信他特斯拉汽车将在2019年实现完全自动驾驶(5级)。
特斯拉因为即使发生了第一起因自动驾驶汽车发生的致命事故之后仍然继续率先将自动驾驶汽车开上路而受到一些人的批评。
但这作为一个商业决策,特斯拉希望这一战略手段能够得到回报,专家认为特斯拉在数据收集方面已经超越了竞争对手。特斯拉曾经销售过的所有车辆,有一天都有可能成为自动驾驶汽车,尽管这个事实直到2014年发布一项免费升级的时候才对外界公布。这意味着特斯拉从道路上大量传感器收集来的数据要远远多于在底特律或硅谷的多数竞争对手,其中许多公司仍处于概念阶段。特斯拉刚刚推出了第一款大众车型Model 3,价格为3.5万美元,预计到2018年,道路上的特斯汽车数量将增加近2/3,达到65万辆左右——意味着传感器数量庞大。
事实上,所有的特斯拉汽车(无论是否启用了自动驾驶模式)会直接发送数据到云端。发动机运行的问题意味着部件有时会过热,2014年通过监测数据诊断出来了一个由于部件过热所导致的发送机运转问题,每辆车都通过软件补丁自动进行“修复”。
特斯拉有效地收集所有车辆及其司机的数据,结合其内部和外部的传感器,这些传感器可以获取驾驶员在仪表上的操作。除了帮助特斯拉改进其系统,这个数据本身就具有巨大的价值。麦肯锡公司研究人员估计,到2030年,汽车收集数据的市场价值将达到每年7500亿美元。
这些数据用于生成数据高度密集的地图,显示从一段路上的平均交通速度的增加,以及导致司机采取行动的危险所在位置。云中的机器学习负责处理整个车队,而在个人汽车级别,边缘计算决定了现在汽车需要采取的行动。还有第三层的决策,也就是汽车可以与附近的其他特斯拉车辆形成网络,以分享本地信息。在不久的将来,自动驾驶汽车普及的情况下,这些网络很可能还会与其他制造商的汽车、以及交通摄像头、路面传感器或移动电话等其他系统进行交互。
虽然Tesla打造的新AI技术缺少细节,但特斯拉目前的AI(由硬件制造商Nvidia合作驱动)主要基于机器学习的无监督学习模型。
Nvidia在其Facebook页面上指出:“与通常的自动驾驶汽车操作方式相比,我们没有将任何明确的目标检测、制图、路径规划或控制组件编程到车辆中。相反,汽车只靠自己的学习来创造一切必要的内在表征,只需通过观察人的驱动因素就可以驾驭。”
无论特斯拉开发出何种新技术,都有可能进入经过更多测试的监督式学习领域,在这些领域中,算法会事先接受正确或错误的决策。然而,真正无监督式学习所能达到的理论上更大的收益,也可能会让特斯拉仍然继续这方面的发展。
特斯拉显然一直是把数据收集和分析当成一切的核心。这不仅仅是设计和制造,特斯拉用人工智能来处理客户数据,甚至分析自己的在线论坛,通过文本洞察常见问题。对人工智能的专注,能够使其在即将到来的自动驾驶汽车市场霸主争夺战中取得胜利,这还有待观察,但这无疑为特斯拉带来了先机。
好文章,需要你的鼓励
zip2zip是一项创新技术,通过引入动态自适应词汇表,让大语言模型在推理时能够自动组合常用词组,显著提高处理效率。由EPFL等机构研究团队开发的这一方法,基于LZW压缩算法,允许模型即时创建和使用"超级tokens",将输入和输出序列长度减少20-60%,大幅提升推理速度。实验表明,现有模型只需10个GPU小时的微调即可适配此框架,在保持基本性能的同时显著降低计算成本和响应时间,特别适用于专业领域和多语言场景。
这项研究创新性地利用大语言模型(LLM)代替人类标注者,创建了PARADEHATE数据集,用于仇恨言论的无毒化转换。研究团队首先验证LLM在无毒化任务中表现可与人类媲美,随后构建了包含8000多对仇恨/非仇恨文本的平行数据集。评估显示,在PARADEHATE上微调的模型如BART在风格准确性、内容保留和流畅性方面表现优异,证明LLM生成的数据可作为人工标注的高效替代方案,为创建更安全、更具包容性的在线环境提供了新途径。
这项研究由中国科学技术大学的研究团队提出了Pro3D-Editor,一种新型3D编辑框架,通过"渐进式视角"范式解决了现有3D编辑方法中的视角不一致问题。传统方法要么随机选择视角迭代编辑,要么同时编辑多个固定视角,都忽视了不同编辑任务对应不同的"编辑显著性视角"。Pro3D-Editor包含三个核心模块:主视角采样器自动选择最适合编辑的视角,关键视角渲染器通过创新的MoVE-LoRA技术将编辑信息传递到其他视角,全视角精修器修复并优化最终3D模型。实验证明该方法在编辑质量和准确性方面显著优于现有技术。
这项研究提出了ComposeAnything,一个无需重新训练的框架,可显著提升AI图像生成模型处理复杂空间关系的能力。该技术由INRIA、巴黎高师和CNRS的研究团队开发,通过三个创新步骤工作:首先利用大型语言模型创建包含深度信息的2.5D语义布局,然后生成粗略的场景合成图作为先验指导,最后通过物体先验强化和空间控制去噪引导扩散过程。在T2I-CompBench和NSR-1K基准测试中,该方法远超现有技术,特别是在处理复杂空间关系和多物体场景时表现卓越,为AI辅助创意设计开辟新可能。