ZD至顶网CIO与应用频道 10月25日 北京消息:10月18日北京消息,人工智能技术近年取得突破性进展,国内外巨头纷纷在深度学习、机器学习、数据挖掘等AI领域布局。滴滴出行联合创始人兼CTO张博在2016年世界人工智能大会上发表演讲时表示,人工智能将影响每一位用户的出行体验。

滴滴CTO张博在2016世界人工智能大会现场演讲
他以人工智能在滴滴的六大场景应用为例,介绍了AI对用户出行体验带来的改变。首先在上车地点推荐场景中,“滴滴出行大脑具备预测能力,通过发单和历史轨迹预测上车地点,能有效帮助提升用户体验。”张博说:“当乘客发出订单,需要知道上车点和目的地,滴滴上线的猜您想去功能,使得用户无需再填目的地,而推荐上车地点功能,可减少与司机沟通具体接驾时间,我们会根据历史上发布订单和乘客行驶轨迹预测会在哪里上车,我们设置这个地点,司机会直接到该点接乘客。

人工智能在出行领域供需预测场景中的应用
供需预测是张博透露的第二个人工智能在出行场景里的应用。他认为,理想的交通状态是,全城拥有一个智能交通大脑,可对未来的出行需求进行预测。“滴滴对15分钟后供需预测的准确度达到了85%,平台会调度司机满足未来需求,使得未来该区域供需不平衡的概率下降。比如,预测某个区域15分钟后出现供给需求,就会把运力往这个区域调度,使得未来该区域供需不平衡的概率下降。”同时张博表示,“利用人工智能技术实现基于供需预测进行运力调度,该技术将至少带来五大社会意义,包括缓解区域之间供需不平衡的局面;提前布局运力;提高成交率;改善乘客出行体验以及提升司机收入。”
第三大场景是滴滴为用户作路线规划时,人工智能也在发挥重要作用。“ETA是很复杂的技术问题,从A点到B点到底需要多长时间,需要预估未来的路况。”据悉,滴滴出行是国内第一家把机器学习成功应用到ETA的公司,这是解决“订单高效匹配”和“司机运力调度”的关键技术。传统方法一般通过路况和每段路的平均速度计算出时间,然后加上可能的等待时间,得到整体所需时间,而滴滴则是利用机器学习来计算时间,大幅提升了用户体验。根据这一技术,目前滴滴出行平台上已经可以实时更新所剩余的距离以及到达终点的时间。
在拼车出行的场景中,张博表示,“拼车是提高交通效率的大杀器,怎么满足出行需求又不增加道路车辆,拼车是唯一办法,当发出拼车订单时,不仅计算路径匹配程度,还要预测同路线是否有其他乘客能拼成功。”公开数据显示,滴滴利用算法技术,每天有超过200万人次通过拼车出行,大量减少了道路上的车辆,为社会创造了价值,而这些复杂的拼车运算,都是在以秒计算的很短时间内完成。
值得一提的是人工智能在优质服务场景中的应用价值。张博表示,“我们会利用算法模型来计算不同服务水平的司机对用户产生的长期影响。”滴滴在9月上线服务信用体系,司机将拥有个人专属的服务信用档案和服务分值,为乘客提供优质服务的车主可获得更高的服务分,从而获得更多的订单和收入。目前服务分已与滴滴的智能派单系统结合,在距离、车型等条件类似的情况下,系统将优先派单给服务分较高的车主,帮助服务优良的车主获得高的收入。上述服务信用体系就是利用人工智能建立算法模型来实现。据悉,该信用体系上线后,用户投诉率和订单取消率都显著下降。
第六大场景应用体现在商业效率领域,“乘客完成行程后分享红包,并可在朋友圈分享折扣券,这个折扣券的数字也是通过大数据来计算和预测。”张博说。
人工智能当前取得突破性进展源于计算处理能力、算法以及大数据三方面的进步,其中大数据是当下的新能源,因为难以获取所以尤为珍贵。数据显示,当前滴滴在高峰期每分钟接收超过2万乘客需求,每位乘客需求在推送给合适司机前,要进行1000次左右运算,在中国外的任何国家都不会见到如此大的数据处理需求。此外,在收购Uber中国之前,滴滴就已经每天处理超过70TB数据,90亿次路径规划请求,90亿次地图定位。
据公开数据,人工智能市场正在高速增长,2015年全球人工智能市场规模为74.5亿美元,预计到2020年该市场将达到183亿美元。艾瑞咨询数据显示,去年我国人工智能市场规模约12亿元人民币,未来5年的增长率将达到50%。
好文章,需要你的鼓励
谷歌发布新的AI学术搜索工具Scholar Labs,旨在回答详细研究问题。该工具使用AI识别查询中的主要话题和关系,目前仅对部分登录用户开放。与传统学术搜索不同,Scholar Labs不依赖引用次数或期刊影响因子等传统指标来筛选研究质量,而是通过分析文档全文、发表位置、作者信息及引用频次来排序。科学界对这种忽略传统质量评估方式的新方法持谨慎态度,认为研究者仍需保持对文献质量的最终判断权。
Meta公司FAIR实验室与UCLA合作开发了名为HoneyBee的超大规模视觉推理数据集,包含250万训练样本。研究揭示了构建高质量AI视觉推理训练数据的系统方法,发现数据质量比数量更重要,最佳数据源比最差数据源性能提升11.4%。关键创新包括"图片说明书"技术和文字-图片混合训练法,分别提升3.3%和7.5%准确率。HoneyBee训练的AI在多项测试中显著超越同规模模型,同时降低73%推理成本。
Meta发布第三代SAM(分割一切模型)系列AI模型,专注于视觉智能而非语言处理。该模型擅长物体检测,能够精确识别图像和视频中的特定对象。SAM 3在海量图像视频数据集上训练,可通过点击或文本描述准确标识目标物体。Meta将其应用于Instagram编辑工具和Facebook市场功能改进。在野生动物保护方面,SAM 3与保护组织合作分析超万台摄像头捕获的动物视频,成功识别百余种物种,为生态研究提供重要技术支持。
上海AI实验室团队提出ViCO训练策略,让多模态大语言模型能够根据图像语义复杂度智能分配计算资源。通过两阶段训练和视觉路由器,该方法在压缩50%视觉词汇的同时保持99.6%性能,推理速度提升近一倍,为AI效率优化提供了新思路。