至顶网CIO与应用频道 07月14日 北京消息:早在上世纪,图灵就对机器与人的智能关系做了思考,他希望机器可以模拟人类思维。今天,人工智能的定义已被改写,机器在很多领域超越了人类的分析、学习能力。一些人开始担忧: “机器是否会控制未来,取代人类?” 在7月12日香港举行的RISE全球科技创业者大会上,滴滴出行美国研究院负责人、硅谷资深投资人的弓峰敏博士以“人类与智能机器”为主题,与科技业者、青年创业者和投资人展开交流。
弓峰敏回顾了工业革命之后,机器的“进化”过程。从蒸汽机到内燃机,从电子计算机到移动互联网,每一次技术革命都将人类能力提升至新的境界。最初机器拓展了我们的身体能力,让我们能拥有远远超越自身极限的移动速度和力量。随后机器增强了我们的脑力,让我们有更强大的运算和数据处理能力。然而弓峰敏认为,机器不会取代人类,新的机器只是淘汰了旧的机器,它们的最终目的是为了人类服务。
滴滴出行信息安全战略副总裁、美国研究院负责人弓峰敏博士
历史的经验表明,新技术可能会在短时间受到限制和质疑。例如,汽车刚出现时,英国通过了“红旗法案”:要求汽车前必须有指挥者手举红旗步行开道,车辆只能跟在后面缓慢行驶。技术革新在全球范围不均匀地发生;创新者、监管者和社会各界需要及时形成共识,积极驾驭新技术,才能让个体和社会最大程度获益;反之则很可能失去先行者优势。
弓峰敏以新兴的移动出行行业为例。滴滴等平台系统每天处理着全球最庞大、复杂的交通数据。通过机器学习对大数据进行多维度分析,滴滴不仅可以在用户层面,向司机提供合理的分单以及路径规划、为乘客提供多样化的出行服务;在整体交通体系规划上也走在全球同行的前面。在济南,滴滴与交管部门合作,将平台数据与公共交通数据相融合,为城市干道的红绿灯提供了动态优化方案。这个项目在济南经十路落地两个月后,车辆在高峰期经等待时间减少了10%。
“未来交通领域还将发生更剧烈的变化。电动汽车、智能驾驶技术将与共享经济模式协同作用,在汽车发明百年后对道路安全和交通模式进行一次革命性的提升。 ” 弓峰敏表示,滴滴美国研究院正在探索将人工智能与增强现实技术结合,提示驾驶者日常难以察觉的道路安全隐患。
弓峰敏认为 “创业者精神”首先是一种变革精神,它并非创业者独有。“在交通行业,创业者的脚步已经带动亿万普通的司机、乘客、监管者,和各界共同拥抱这场技术革新。但这只是开始,”弓峰敏说,“在科技变革当下,希望在座的每一位可以持续创新,同时坚持‘创业者的精神’,直面变化和问题,推动人类社会向前发展。”
好文章,需要你的鼓励
新加坡国立大学研究人员开发出名为AiSee的可穿戴辅助设备,利用Meta的Llama模型帮助视障人士"看见"周围世界。该设备采用耳机形态,配备摄像头作为AI伴侣处理视觉信息。通过集成大语言模型,设备从简单物体识别升级为对话助手,用户可进行追问。设备运行代理AI框架,使用量化技术将Llama模型压缩至10-30亿参数在安卓设备上高效运行,支持离线处理敏感文档,保护用户隐私。
阿里达摩院联合浙江大学推出VideoRefer套件,这是首个能够精确理解视频中特定物体的AI系统。该系统不仅能识别整体场景,更能针对用户指定的任何物体进行详细分析和跨时间追踪。研究团队构建了包含70万样本的高质量数据集VideoRefer-700K,并设计了全面的评估体系VideoRefer-Bench。实验显示该技术在专业视频理解任务中显著超越现有方法,在安防监控、自动驾驶、视频编辑等领域具有广阔应用前景。
OpenAI推出新AI模型GPT-5-Codex,能够在无用户协助下完成数小时的编程任务。该模型是GPT-5的改进版本,使用额外编码数据训练。测试显示,GPT-5-Codex可独立工作超过7小时,能自动发现并修复编码错误。在重构基准测试中得分51.3%,比GPT高出17%以上。模型可根据任务难度调整处理时间,简单请求处理速度显著提升。目前已在ChatGPT付费计划中提供。
Sa2VA是由UC默塞德等高校联合开发的突破性AI系统,首次实现图像视频的统一理解与精确分割。通过巧妙融合SAM-2视频分割技术和LLaVA多模态对话能力,Sa2VA能够同时进行自然对话和像素级物体标注。研究团队还构建了包含7万多个复杂视频表达式的Ref-SAV数据集,显著提升了AI在长文本描述和复杂场景下的表现。实验显示,Sa2VA在多个基准测试中达到业界领先水平,为视频编辑、医疗诊断、智能监控等领域带来新的应用可能性。