一位获奖者说:“本身技术并不坏,但是人们会用技术做坏事。”
拉吉·瑞迪(Raj Reddy)之前是卡内基·梅隆大学机器人研究所的创始所长,他在2016年9月20日的海德堡获奖者论坛上发言。
技术大有潜力让世界变得更美好,但是那些好处远远不能得到保证。一路上会出现许多负面因素,其中一些让图灵奖获奖者特别担忧。
1. 互联网回音室
芭芭拉·利斯科夫(Barbara Liskov)是麻省理工学院的学院教授,她在近日出席德国海德堡获奖者论坛时对台下的新闻记者说:“本身技术并不坏,但是人们会用技术做坏事。我确实很担心这方面。”
利斯科夫最担心的问题之一就是,能够选择性地过滤掉与己见不合的新闻和观点。
由于技术带来的这种极化,“人们不再未必就是良好公民,因为他们可能不明白世界上发生的事情,”利斯科夫说,她在2008年获得了图灵奖。
2. 自由受到攻击
拉吉·瑞迪(Raj Reddy)之前是卡内基·梅隆大学机器人研究所的创始所长,他在1994年获得了图灵奖。他说:“如果我可以使用电子邮件,恐怖分子也可以使用。如今,他们可以借助加密技术保持联系而逍遥法外。”
面临的挑战是,保持言论自由和隐私,又不助长犯罪分子,这就引起了诸多新的道德和理念层面的问题。为了解决这些问题,“政府会侵犯你的个人自由,”瑞迪说。
3. 有缺陷的物联网软件
文特·瑟夫(Vint Cerf)在2004年获得了图灵奖,现在是谷歌副总裁兼首席互联网宣传官。他说:“我曾经以编程谋生,所以很清楚编写优秀软件有多难。”
比如说,用来制定重要政策的电子表格中的一个错误可能会带来深远的影响。控制物联网设备的软件中的缺陷同样如此。
瑟夫说:“我们依赖设备中的软件来确保正常运行。不然,房子可能会着火,或者汽车掉下悬崖。”
瑟夫并不担心“杀手机器人”会大行其道。他说:“我不认为那是重大威胁。普通设备里面有许多软件,只不过软件并没有以我们预期的方式来运行。”
4. 数字化“黑暗时代”
瑟夫还担心这种可能性:由于访问所需的软件变得过时,我们如今以数字化手段保存起来的照片、文档及其他内容可能再也无法显示。
瑟夫说:“软件要做到今后100年可以执行。”
瑟夫表示,云端使用虚拟机以模拟必要的过时硬件将成为解决方案的一部分,不过还需要解决其他问题,包括相关知识产权的所有权以及支持长期保存的商业模式。
5. 互联网安全
利斯科夫说,最后,“我担心上网的孩子们。我认为,这年头当父母比过去难当多了。”
她补充道:计算机科学家们“并没有预见到互联网的爆炸式发展或邪恶的黑客和网络喷子。想当初,我们在网上都是朋友。”
利斯科夫说:“给我希望的是,我们在过去遇到了这类事情,我们最后想出了更好的办法应对这类事情。我希望我们能够再度做到这点。而在此期间,我为子孙一辈感到担心。”
好文章,需要你的鼓励
新加坡国立大学研究团队开发了名为IEAP的图像编辑框架,它通过将复杂编辑指令分解为简单原子操作序列解决了当前AI图像编辑的核心难题。研究发现当前模型在处理不改变图像布局的简单编辑时表现出色,但在需要改变图像结构时效果差。IEAP框架定义了五种基本操作,并利用思维链推理技术智能分解用户指令,实验证明其性能显著超越现有方法,尤其在处理复杂多步骤编辑时。
Character AI的研究者开发出TalkingMachines系统,通过自回归扩散模型实现实时音频驱动视频生成。研究将预训练视频模型转变为能进行FaceTime风格对话的虚拟形象系统。核心创新包括:将18B参数的图像到视频DiT模型改造为音频驱动系统、通过蒸馏实现无错误累积的无限长视频生成、优化工程设计降低延迟。系统可让多种风格的虚拟角色与人进行自然对话,嘴型与语音同步,为实时数字人交互技术开辟了新可能。
这项由中国人民大学高瓴人工智能学院研究团队发表的研究解决了大语言模型评判中的自我偏好问题。研究提出了DBG分数,通过比较模型给自身回答的分数与黄金判断的差异来测量偏好度,有效分离了回答质量与自我偏好偏差。实验发现,预训练和后训练模型都存在自我偏好,但大模型比小模型偏好度更低;调整回答风格和使用相同数据训练不同模型可减轻偏好。研究还从注意力分析角度揭示了自我偏好的潜在机制,为提高AI评判客观性提供了重要指导。
这篇研究提出了DenseDPO,一种改进视频生成模型的新方法,通过三大创新解决了传统方法中的"静态偏好"问题:使用结构相似的视频对进行比较,采集细粒度的时序偏好标注,并利用现有视觉语言模型自动标注。实验表明,DenseDPO不仅保留了视频的动态性,还在视觉质量方面与传统方法相当,同时大大提高了数据效率。这项技术有望推动AI生成更加自然、动态的视频内容。