至顶网CIO与应用频道 11月21日 北京消息:电子商务是日常生活不可分割的一部分,物流速度很大程度决定购物体验。京东商城的崛起的制胜因素就在于物流。京东智慧的供应链造就了带来了非常优秀的用户体验,其实物流有着非常长且复杂的链条,包括实时快递监控、智能配送、件量预测、库存优化、供应链管理、未来物流方式探索等。其中也分布着很多的场景和应用模块。
“京东-爱动人工智能叉车效率管理模组项目”旨在开发一种便于安装的小型化模块群组,用于对京东仓库内现有的叉车的日常装卸货数据进行统计,以便在未来对叉车的仓库作业轨迹和作业数量进行优化,提升京东物流资产的利用效率。自2016年底,爱动与京东物流合作,开始了“京东-爱动人工智能叉车效率管理模组”的开发计划。
爱动超越人工智能科技公司在运动传感器的模式识别领域有较长时间的经验积累,并且与Intel合作推出过基于Intel Curie模组的智能跑鞋(已经在京东众筹发售)。基于Curie的RBF神经网络技术,在项目开始初期,爱动团队采用激光测距仪辅助6轴惯性传感器,同时在服务器端配合机器学习算法,实现了对叉车主要日常动作的检测:空驶、水平搬运、静止,空叉升降以及装卸货升降等。相对于传统的叉车效率检测工业装置,该设备尺寸小巧,部署简单,不需要对叉车进行任何改造,并且内置锂聚合物电池,充满电后可以连续工作12个小时,基本满足了京东的初期项目需求。
在该版本的基础上,京东提出了新的需求,即能够实现粗略的“叉车轨迹记录”,同时“不能部署任何基站设备”。传统的物流技术解决方案中,室内的轨迹定位技术往往需要依赖大量的“电子标签”或者“有源基站”,独立的轨迹计算,并且不对叉车进行改造难度非常大。新技术中的VSLAM技术可以达成这一目标,但是设备成本和开发成本过高,完全超出了项目预算。
爱动团队发挥了在机器人技术和运动模式匹配技术多年的积累,利用“光流+惯性导航“技术再次达成了京东的新目标。
目前市面上的高技术无人机,在实现室内定点定高时,往往采用“超声波+光流”的技术,该技术通过摄像头计算两帧画面之间的“特征像素位移”确定飞行器的物理漂移,并根据PID算法纠正飞行器的位置。这样即便在没有GPS的室内,也可以实现飞行器的悬停定点。大疆精灵三开始的各个系列无人机都配备了这项“黑科技”。
爱动团队正是借助这项技术实现了京东的“无基站粗略室内轨迹”需求。通过集成“光学摄像模块+激光测距仪+ARM 微型计算机”,爱动团队在短短45天内从硬件到软件实现了相对稳定的轨迹定位模组。该模组同样非常小巧,便于安装,只需要叉车提供一个12v的供电接口,便可以通过磁铁固定在车辆顶部,通过对车辆后部的地面进行特征追踪,实现对车辆运行轨迹的计算。
通过加入轨迹计算模组,京东-爱动叉车效率监控模块目前可以非常准确地监控车辆的工作状态,并且可以相对准确地统计一天内叉车的工作里程,对提升叉车的工作效率提供了有力的数据支持。
未来,爱动团队还会继续和京东合作,开发更加可靠经济的“车辆效率管理模组”。目前爱动团队已经和北京的知名高校实验室达成了合作协议,建立了由十多名博士和硕士组成的研究团队,主攻机器视觉在仓储移动平台领域的应用技术。希望在2018年可以推出更加小型便捷的效率监控模块,实现对物流资产的智能化管理。
好文章,需要你的鼓励
新加坡国立大学研究团队开发了名为IEAP的图像编辑框架,它通过将复杂编辑指令分解为简单原子操作序列解决了当前AI图像编辑的核心难题。研究发现当前模型在处理不改变图像布局的简单编辑时表现出色,但在需要改变图像结构时效果差。IEAP框架定义了五种基本操作,并利用思维链推理技术智能分解用户指令,实验证明其性能显著超越现有方法,尤其在处理复杂多步骤编辑时。
Character AI的研究者开发出TalkingMachines系统,通过自回归扩散模型实现实时音频驱动视频生成。研究将预训练视频模型转变为能进行FaceTime风格对话的虚拟形象系统。核心创新包括:将18B参数的图像到视频DiT模型改造为音频驱动系统、通过蒸馏实现无错误累积的无限长视频生成、优化工程设计降低延迟。系统可让多种风格的虚拟角色与人进行自然对话,嘴型与语音同步,为实时数字人交互技术开辟了新可能。
这项由中国人民大学高瓴人工智能学院研究团队发表的研究解决了大语言模型评判中的自我偏好问题。研究提出了DBG分数,通过比较模型给自身回答的分数与黄金判断的差异来测量偏好度,有效分离了回答质量与自我偏好偏差。实验发现,预训练和后训练模型都存在自我偏好,但大模型比小模型偏好度更低;调整回答风格和使用相同数据训练不同模型可减轻偏好。研究还从注意力分析角度揭示了自我偏好的潜在机制,为提高AI评判客观性提供了重要指导。
这篇研究提出了DenseDPO,一种改进视频生成模型的新方法,通过三大创新解决了传统方法中的"静态偏好"问题:使用结构相似的视频对进行比较,采集细粒度的时序偏好标注,并利用现有视觉语言模型自动标注。实验表明,DenseDPO不仅保留了视频的动态性,还在视觉质量方面与传统方法相当,同时大大提高了数据效率。这项技术有望推动AI生成更加自然、动态的视频内容。