至顶网CIO与应用频道 11月20日 北京消息:曾经有一个坡著名的问题,叫“乔布斯之问”。“乔布斯之问”是苹果公司创始人乔布斯生前提出的:“为什么计算机改变了几乎所有领域,却唯独对学校教育的影响小得令人吃惊?”这次这不是给技术提出问题,而是针对教育。
在驰声创始人兼CEO林远东看来,信息化技术并不是没有改变教育行业,但相较其他行业,教育信息化并没有那么显著的主要原因是因为教育行业的受众是人,所以不是简单的信息化技术可以解决的。未来教育模式将会融入更多的IT技术。
驰声创始人兼CEO林远东
教育不仅是知识的传递,“教育+技术”成趋势
林远东说,随着教育的核心发生变化,不再仅仅是知识的传递,所以未来“教育+科技”的模式将会是教育发展的必由之路,同时也是科技创新的实践园地,二者的碰撞磨合经历了从改良到渐进融合的演化。
在改良阶段,互联网技术是一种改变教育传播方式和辅助教学的工具;VR、人工智能、大数据等新兴技术出现后,教育普及加速,学习模式深刻改变,效率快速提高,个性化学习成为可能。新技术提供了高效的机器化中浅层次技能练习模式,并改变了成绩评定方式和评价标准。
林远东认为,不久的将来,教育和技术将高度融合,这将是颠覆性的。教育产品将拥有自适应学习能力,这将高度个性化个体学习路径;老师将会从知识传递者成为数据分析师。
瞄准国内教育领域的智能语音需求
今年前,瞄准国内教育领域庞大的智能语音需求,驰声展开了技术+解决方案的布局。一方面驰声面向客户提供语音技术授权服务。创建了经济易用的教育语音云平台,提供安全稳定的云计算服务与全面精准的智能语音功能。
“人工智能技术要解决教育中的技能传授问题,比如口语评测。”林远东介绍,驰声推出了独树一帜的中高考口语考试机考机评和考辅解决方案。驰声中高考听说考评系统,针对各地教育考试机构提供一整套的考试评分系统来实施考试。从2012年开始,驰声参与湛江中考开始登上中高考的舞台,先后服务了广东、辽宁、宁夏等省份的中高考考试和成都、重庆的中职考试。
今年,驰声不仅成功助力了银川、沈阳等地中考,而且成功参加了北京中考的机器评分验证,长春小升初考试的顺利实施,为考试业务的发展开辟了新的战线。驰声校园版模拟考试训练系统,面向体制内学校组织的期中、期末、模考、月考和随堂考试等考试,同时支持日常随堂练习。2017年与宏碁签定了战略合作协议,使得驰声的产品交付能力迅速覆盖到全国范围内。
源于剑桥大学的语音技术
据了解,驰声主打的语音技术源于剑桥大学。在此基础上,团队自主研发了基于大数据、拥有深度学习网络的智能语音系列技术,有效帮助学习者开口练习发音,这一核心技术已惠及海内外亿万学习者。
迄今为止,驰声在培训、出版、教育软硬件、在线教育、考试考辅服务等领域均占据了一定的市场份额,培养了新东方、好未来、VIPKID等大批深度合作的客户,市场上的智能语音教育产品,半数以上核心技术都源自驰声。
林远东谈到,驰声一直致力于成为世界一流的智能语音技术品牌服务商,为全球用户提供专业、完善、优质的智能技术与解决方案。目前,驰声已准备进行分拆融资,今年内就将完成一轮融资,预计3年内上市。未来,驰声将会有新的姿态、新的力量继续专注于教育智能语音技术开发,为新时代教育智能语音发展提出“驰声方案”。
好文章,需要你的鼓励
新加坡国立大学研究团队开发了名为IEAP的图像编辑框架,它通过将复杂编辑指令分解为简单原子操作序列解决了当前AI图像编辑的核心难题。研究发现当前模型在处理不改变图像布局的简单编辑时表现出色,但在需要改变图像结构时效果差。IEAP框架定义了五种基本操作,并利用思维链推理技术智能分解用户指令,实验证明其性能显著超越现有方法,尤其在处理复杂多步骤编辑时。
Character AI的研究者开发出TalkingMachines系统,通过自回归扩散模型实现实时音频驱动视频生成。研究将预训练视频模型转变为能进行FaceTime风格对话的虚拟形象系统。核心创新包括:将18B参数的图像到视频DiT模型改造为音频驱动系统、通过蒸馏实现无错误累积的无限长视频生成、优化工程设计降低延迟。系统可让多种风格的虚拟角色与人进行自然对话,嘴型与语音同步,为实时数字人交互技术开辟了新可能。
这项由中国人民大学高瓴人工智能学院研究团队发表的研究解决了大语言模型评判中的自我偏好问题。研究提出了DBG分数,通过比较模型给自身回答的分数与黄金判断的差异来测量偏好度,有效分离了回答质量与自我偏好偏差。实验发现,预训练和后训练模型都存在自我偏好,但大模型比小模型偏好度更低;调整回答风格和使用相同数据训练不同模型可减轻偏好。研究还从注意力分析角度揭示了自我偏好的潜在机制,为提高AI评判客观性提供了重要指导。
这篇研究提出了DenseDPO,一种改进视频生成模型的新方法,通过三大创新解决了传统方法中的"静态偏好"问题:使用结构相似的视频对进行比较,采集细粒度的时序偏好标注,并利用现有视觉语言模型自动标注。实验表明,DenseDPO不仅保留了视频的动态性,还在视觉质量方面与传统方法相当,同时大大提高了数据效率。这项技术有望推动AI生成更加自然、动态的视频内容。