滴滴“猜你去哪”预测准确率超90% KDD论文详解背后黑科技

掏出手机，轻点几下，键入目的地、发单，几分钟后，一位出租车司机准时出现在楼下等你。这一操作已经被数亿用户所熟悉。

至顶网CIO与应用频道 08月14日北京消息：掏出手机，轻点几下，键入目的地、发单，几分钟后，一位出租车司机准时出现在楼下等你。这一操作已经被数亿用户所熟悉。

看似简单的背后其实是一个多层次处理问题的过程。期间，有一系列复杂的智能算法模型在默默地为你提供服务，快速地进行超大规模地计算。

实际上，相比于在搜索引擎中找到一个你想要的网页，在茫茫车潮中匹配到一辆载你去目的地的车辆会更加复杂。毕竟，网页可以持续呈现一整天，甚至半个月；但车辆是高速移动的，乘客和司机的相对位置一直在实时变动。匹配的过程和方式也极其重要，在一个既定区域，乘客有很多，车辆也有很多，系统需要全局考虑区域内的需求、供给，以毫秒级的速度进行计算，实时地进行最合理的分单，最大化用户的出行效率和出行体验。

在滴滴出行，从乘客发出一个出租车订单，到订单被播报给周围的出租车司机，再到成功被司机应答，所需的时间被压缩到极短。这背后的最大功臣，就是基于组合优化的滴滴出租车分单模型。这一模型投入使用后，滴滴出租车的打车成功率较之前进一步提升。

而为了进一步提高用户叫车时的体验，滴滴还开发出一个目的地预测模型，能在用户打开软件时，2毫秒为用户推荐出他最可能前往的地点。目前这一功能的预测准确率已经超过90%。

相关论文《A Taxi Order Dispatch Model based On Combinatorial Optimization》也被国际数据挖掘顶级会议KDD 2017收录。

接下来是对该论文的中文讲解，完整论文PDF可点击阅读原文下载：

1，我们的工作：分单时优化整体成交率

早期，出租车打车软件的订单分配主要聚焦在每个订单与每个出租车司机的相关性算法上。当一个乘客发起一单需求，系统会尽量匹配调度最近距离的司机，力图让接驾时间最短。然而此时往往会忽略到这些司机是否更适合其他订单。

此前业界曾提出过一个基于多代理体系结构的新模型NTuCab，它的目的是最小化乘客的等待时间和接驾距离。这一模型会将每个代理视为一个计算单元，它会同时计算处理N个订单和司机的匹配，但一个订单只会匹配一个出租车司机。如果一个出租车司机拒绝该订单，系统才会转发给下一司机。

然而这些方法的调度时间往往偏长，成功率较低。对此，滴滴出行提出了新的组合优化方法。在这个模型中，一个订单会播报给几个出租车司机，当多个出租车司机收到相同的订单时，最先抢单的人会获得订单。如果订单未被应答，则进入下一轮播单，直到它被出租车司机应答或被乘客取消。而模型的目标则是最大化订单成交率，从而确保司机和乘客的出行体验。实验数据也显示，这一模型下打车的全局成功率比同类模型高出了4%。

我们工作一个主要的改进是使用“整体”的概念，即会整体考虑当前时刻所有待分配司机和订单群体的多对多的匹配问题。以成交率为优化目标，通过整体分配司机与乘客，提升乘客订单的整体成交率。

模型的数学形式即：