至顶网CIO与应用频道 01月10日 北京消息:全球领先的信息技术研究和顾问公司Gartner的报告指出,人工智能(AI)不仅将帮助智能手机厂商留住现有用户,还能助力其赢得新客户,因此AI会是智能手机厂商实现核心产品差异化的重要手段。随着智能手机市场逐渐从销售技术产品转向提供令人信服的个性化体验,在智能手机上运行AI解决方案将成为未来两年手机厂商发展路线图的重要组成部分。
Gartner预测,到2022年,80%售出的智能手机将拥有基于设备的人工智能(on-device AI),与2017年的10%相比,增加迅猛。目前,基于设备的人工智能仅限于高级设备,凭借在本地处理和存储数据,它可以提供比完全基于云端AI(full cloud-based AI)更好的数据保护和电源管理。
Gartner研究总监吕俊宽表示:“随着智能手机逐步成为一种日用品,厂商正在寻找产品差异化的方法。未来具备AI功能的智能手机能够帮助用户学习、规划和解决问题。AI不仅让智能手机变得更加智能,还能通过减少用户的认知负担来增强用户体验。然而,应用于智能手机的AI功能目前尚处于起步阶段。”
AI驱动型智能手机的10种用途
Gartner研究总监Roberta Cozza认为:“在今后两年内,大部分使用案例仍将拘泥于单一的AI功能和技术。展望未来,智能手机将融合两种或更多种AI功能和技术,以提供更高级的用户体验。”
Gartner为AI驱动型智能手机确定了10种具有重大影响力的用途,帮助厂商及企业为客户提供更多价值。
1)移动端“Digital Me”("Digital Me" Sitting on the Device)
智能手机将成为用户的一种延伸,它可以识别、预测用户的下一步行动;还能够理解用户身份、用户需求、需要时间、用户交待的任务以及在获得授权后执行任务。
Gartner首席研究分析师王争表示:“智能手机将与用户如影随形,帮助他们学习、计划和解决问题。智能手机将利用传感器、摄像头和数据自动完成这些任务。例如:在联网家庭(connected home)中,它能设置吸尘器在家中无人时打扫房间,或者在用户到家前20分钟启动电饭煲。”
2)用户认证(User Authentication)
基于密码的简单身份验证越来越复杂,效率也越来越低,这就导致了安全性差、用户体验不佳和使用成本居高不下。结合机器学习(machine learning)、生物识别(biometrics)和用户行为的安全技术将提高可用性和自助服务功能。例如:智能手机无需密码或主动身份验证即可捕获和学习用户行为,例如观察用户走路的姿态以及在手机上触摸滑动、点击操作、滚动和输入的方式。
3)情感识别(Emotion Recognition)
情绪感知系统(emotion sensing systems)和情感计算(affective computing)能让智能手机检测、分析、处理和回应人们的情感状态和情绪。虚拟个人助理(virtual personal assistants)的普及和用于会话系统(conversational systems)的其它AI技术正在促使手机厂商引入情感智能(emotional intelligence),来提供更好的情境和更好的服务体验。例如:汽车制造商可以使用智能手机的前置摄像头了解驾驶员的身体状况或评估疲劳水平,以此提高安全性。
4)自然语言理解(Natural-Language Understanding)
智能手机的持续训练和深度学习将提高其语音识别的准确性,同时更好地理解用户的具体意图。例如:当用户说“天气很冷”时,智能手机可根据情况来判断用户的真实意图是“请在线订购一件夹克衫”还是“请将空调温度调高”。此外,在国外旅行时,自然语言理解的功能可以用于智能手机上近乎实时的语音翻译。
5)增强现实(AR)和AI视觉(AI Vision)
随着iOS 11正式发布,苹果推出了ARKit功能——它为开发人员提供一种新工具,可以更加轻松地将AR添加到应用程序中。谷歌同样宣布推出Android版ARCore AR开发工具,并计划在2019年年底之前,在约1亿个Android设备上启用AR。谷歌预计几乎所有Android新手机在明年都将配备AR-ready功能。在应用程序中使用AR的一个例子就是收集用户数据和检测诸如皮肤癌或胰腺癌的疾病。
6)设备管理(Device Management)
机器学习将提高设备性能和待机时间。在配备多个传感器后,智能手机可以更好地理解和学习用户的行为,例如:何时启用某种应用。智能手机将在后台运行经常使用的应用程序以便快速重启或者关闭未使用的应用,节省内存和电池。
7)个人分析(Personal Profiling)
智能手机能够收集行为和个人分析数据。用户可以根据正在进行的活动及其所处环境(如:家中、汽车、办公室或休闲活动)动态地获得保护和协助。保险公司等服务提供商现在可以更加关注用户而非资产。例如它们可以根据用户的驾驶行为调整汽车保险费率。
8)内容审查/检测(Content Censorship/Detection)
限制内容将被自动检测。不良图像、视频或文本将被标记,同时启动各种通知警报。计算机识别软件可以检测违反法律或政策的内容。例如,在高度安全的设施中拍摄照片或在公司付费的智能手机上存储高度机密数据的行为都将被告知IT部门。
9)个人拍摄(Personal Photographing)
个人拍摄包括智能手机能够基于用户个人审美偏好自动生成美图照片。例如:东西方之间有着不同的审美偏好,大多数中国人喜欢白皙的肤色,而西方的消费者更喜欢棕褐色的肤色。
10)音频分析(Audio Analytic)
智能手机的麦克风能够持续收听真实世界的声音。该设备上的人工智能功能可以通过分辨这些声音来指导用户或触发事件。例如:当智能手机听到用户打鼾声时,其将触发用户的腕带,以提醒用户改变睡眠姿势。
好文章,需要你的鼓励
继苹果和其他厂商之后,Google正在加大力度推广其在智能手机上的人工智能功能。该公司试图通过展示AI在移动设备上的实用性和创新性来吸引消费者关注,希望说服用户相信手机AI功能的价值。Google面临的挑战是如何让消费者真正体验到AI带来的便利,并将这些技术优势转化为市场竞争力。
麻省理工学院研究团队发现大语言模型"幻觉"现象的新根源:注意力机制存在固有缺陷。研究通过理论分析和实验证明,即使在理想条件下,注意力机制在处理多步推理任务时也会出现系统性错误。这一发现挑战了仅通过扩大模型规模就能解决所有问题的观点,为未来AI架构发展指明新方向,提醒用户在复杂推理任务中谨慎使用AI工具。
Meta为Facebook和Instagram推出全新AI翻译工具,可实时将用户生成内容转换为其他语言。该功能在2024年Meta Connect大会上宣布,旨在打破语言壁垒,让视频和短视频内容触达更广泛的国际受众。目前支持英语和西班牙语互译,后续将增加更多语言。创作者还可使用AI唇形同步功能,创造无缝的口型匹配效果,并可通过创作者控制面板随时关闭该功能。
中科院自动化所等机构联合发布MM-RLHF研究,构建了史上最大的多模态AI对齐数据集,包含12万个精细人工标注样本。研究提出批评式奖励模型和动态奖励缩放算法,显著提升多模态AI的安全性和对话能力,为构建真正符合人类价值观的AI系统提供了突破性解决方案。