ZD至顶网CIO与应用频道 07月21日 北京消息(文/王聪彬):“大数据、云计算、人工智能算法是过去三年人工智能发展的主要依赖的三件事。”
互联网将信息孤岛连通,并且让整个社会的数据快速扩张;云计算实现资源的随时取用;人工智能算法在计算机视觉领域的应用得到了翻天覆地的变化。“三大技术可以说日新月异,尤其人工智能算法正在以周为单位在进行更新。”滴滴出行CTO张博说道。
滴滴出行CTO张博
人工智能在原Google无人驾驶创始团队成员Anthony看来,要远比电力、手机的发明重要的多。人工智能的作用就是让人类更加关注我们需要关注的事,像会计师、律师、翻译等工作都将被取代。
人工智能也恰恰最适合滴滴的业务场景。“滴滴要解决的问题比AlphaGo还要复杂。”正如滴滴研究院副院长叶杰平所说,滴滴解决的是供需之间的复杂关系,这显然比下棋挑战更大。
如果再没有人工智能的前提下,滴滴为了响应不同状态的需求,就会产生大量复杂的人工规则,长此以往肯定是不可行的。所以滴滴采用大量机器需求、人工智能方法,通过大数据找出其中的规律,并且可以随着时间、地点等因素的变化自动进行调节。
现在滴滴对未来15分钟全城需求分配准确率已经达到了85%,在未来调度要在需求发出前1秒就可以做好调度,让成交距离缩短为0。
在未来滴滴甚至可以知道每一位乘客和司机的想法,实现预测人的心里状态,把整个城市的交通管理的更有秩序。滴滴研究院院长何晓飞认为,通过多种渠道的数据,未来有一天我们甚至能够知道每一位乘客、每一位司机的意愿,或许前一分钟他不愿意接这个订单,也许下一分钟他就愿意了。”
在中国共享经济已经完全颠覆了出行方式,而滴滴做的就是人与车的连接。在竞赛的上半场终端和互联网起到了重要的连接作用,滴滴出行CEO程维也意识到在人口红利渐失的下半场将是人工智能的较量,要用智慧让平台变的更强大。
滴滴出行CEO程维
但在机器学习、人工智能领域人才非常稀缺,这也是滴滴发起Di-Tech算法大赛的初衷,历时两个月中国团队”inferrrr”以绝对优势夺得冠军并收获10万美元奖金,“一剑风吼”和“blitz”两团队分别获二、三名。
比赛题目也非常符合滴滴目前的需求“解决出行行业供需预测问题”,重点是滴滴出行为本次算法大赛开放了真实的国内出行数据。
最后也引用滴滴中老桔子(滴滴员工)经常会对新桔子经说的一句话“不忘初心”,初心有多远,我们就能走多远。而人工智能不仅在过去的1095天,未来也会陪滴滴走的更远。
好文章,需要你的鼓励
新加坡国立大学研究团队开发了名为IEAP的图像编辑框架,它通过将复杂编辑指令分解为简单原子操作序列解决了当前AI图像编辑的核心难题。研究发现当前模型在处理不改变图像布局的简单编辑时表现出色,但在需要改变图像结构时效果差。IEAP框架定义了五种基本操作,并利用思维链推理技术智能分解用户指令,实验证明其性能显著超越现有方法,尤其在处理复杂多步骤编辑时。
Character AI的研究者开发出TalkingMachines系统,通过自回归扩散模型实现实时音频驱动视频生成。研究将预训练视频模型转变为能进行FaceTime风格对话的虚拟形象系统。核心创新包括:将18B参数的图像到视频DiT模型改造为音频驱动系统、通过蒸馏实现无错误累积的无限长视频生成、优化工程设计降低延迟。系统可让多种风格的虚拟角色与人进行自然对话,嘴型与语音同步,为实时数字人交互技术开辟了新可能。
这项由中国人民大学高瓴人工智能学院研究团队发表的研究解决了大语言模型评判中的自我偏好问题。研究提出了DBG分数,通过比较模型给自身回答的分数与黄金判断的差异来测量偏好度,有效分离了回答质量与自我偏好偏差。实验发现,预训练和后训练模型都存在自我偏好,但大模型比小模型偏好度更低;调整回答风格和使用相同数据训练不同模型可减轻偏好。研究还从注意力分析角度揭示了自我偏好的潜在机制,为提高AI评判客观性提供了重要指导。
这篇研究提出了DenseDPO,一种改进视频生成模型的新方法,通过三大创新解决了传统方法中的"静态偏好"问题:使用结构相似的视频对进行比较,采集细粒度的时序偏好标注,并利用现有视觉语言模型自动标注。实验表明,DenseDPO不仅保留了视频的动态性,还在视觉质量方面与传统方法相当,同时大大提高了数据效率。这项技术有望推动AI生成更加自然、动态的视频内容。