至顶网CIO与应用频道 03月27日 人物访谈(文/王聪彬):从《新潮电子》主任编辑到四川元高分网络科技有限公司(以下简称元高分)创始人,刘颂不仅转换了视角,同时也转换了行当。
元高分的创立可以说非常巧合,2004年全国已有15个省(区、市)开始高考网上阅卷,最后一批的4个省(区、市)也将在2012年实现网上阅卷,这其中就有四川省。从高考到日常考试,网上阅卷必将成为趋势,刘颂正是看到这一契机,2009年开启了教育领域的闯荡。
2013年,四川省举行了一百多个学校的全省联考(同国家级命题专家合作出题的考试),通过网上阅卷不但一周都没有出成绩,而且差错率还在30%以上,很多校长都非常着急。刘颂的团队临危受命,4个人,5台电脑,一个通宵就完美的解决了这一问题。
“本该提高效率的网上阅卷,因为某些环节出现问题,反而变成了一场灾难。”刘颂说,正是帮助某考试机构解决了这一问题,元高分也逐渐建立起口碑,抓住了当时四川省网上阅卷这一蓝海市场。
四川元高分网络科技有限公司创始人刘颂
元高分不仅专注于网上阅卷技术的研发、应用和推广,同时迎合互联网+大数据趋势,研发了以考试诊断和反馈作为考试服务核心的产品体系。2018年,元高分又提出以教育信息化2.0助力新高考改革的口号,将多年积累的精细测量技术全面应用于多元评价时代,全面帮助学校提升教学质量和升学率。
元高分扎根川渝两地,向西部辐射。目前产品包括元高分阅卷云系统、综合素质评价系统、学业规划系统,以及联考服务。未来依托于云,元高分将持续对主观题自动批阅进行突破,以及在联考上加大投入,将最小颗粒度细到每一个知识点,为学校、教师、学生、家长及各级教育主管部门,提供多维度数据解读、教育改进建议和师资培训等多种解决方案。
从阅卷到促进教育改进
网上阅卷是使用网上阅卷系统进行阅卷,通过计算机网络技术和电子扫描技术对试卷进行扫描,生成图像文件存储,对生成的图像文件通过软件程序自动进行切割。客观题由系统自动进行审阅评改得出分数,主观题由评卷老师进行人工在线评卷,最后系统进行分析统计,得出总成绩。
网上阅卷可以有效减少评卷误差,进一步实现考试的公平性,同时省掉了试卷保管、登分、统分等环节。网上阅卷在初高中已经非常普及,由于高考已经现实网上阅卷,在高中的普及率达到100%,在初中普及率也达到60%以上,目前大学网上阅卷还是一片蓝海。
“教育部规定高校试卷存档时间在5年以上,未来这是很大的增长空间。”刘颂说,在帮助高校进行考试标准化的同时,数据存档也实现了电子化,可以在云上也可以是光盘。
对于网上阅卷最大的要求就是准确率,元高分通过大量大型考试合作经验,不断提升图像切割和识别的精准度。目前累计服务学校超千所,服务上百次国家/区域级考试,甚至多次参与百万张试卷级的考试。
网上阅卷界面
网上阅卷在发展到一定程度后,也开始走向分流。一部分倾向日常考试,例如作业、日常测试;一部分还是在传统大型考试领域。元高分则倡导考试大区域覆盖,包括全省、跨省、全国联考等。
目前网上阅卷的意义也不仅仅停留在阅卷上,结合客观题和主观题的整体评卷结果,系统可以按照用户设定的统计项目、科目及指标进行统计分析,生成各类统计分析报告。刘颂也认为,元高分不单单是一个效率工具,通过商业经营推广等资源的整合,也加入了联考命题、分析等服务,实实在在的帮助学校和教育局提升教学水平,这也是未来的发展方向。
学校正规考试的数据可以进行趋势分析给到学校,这些数据并不能私自使用,而联考是自主定义,可以获得学生完整的学情分析数据,对学生进行多方位、多维度的综合素质分析,最终给到家长和教师教学建议,并通过师培、讲座等方式促成教学改进。
云与网上阅卷的高度契合
因为数据的安全性因素,最早的网上阅卷都是在局域网中完成,这也是元高分产品的1.0阶段。当时每次考试都需要团队带着设备去现场,如果考试集中,同时服务的用户也非常有限。
元高分一直在尝试使用互联网和移动互联方式,2015年开始通过云提供网上阅卷服务,2017年,升级到3.0版本,实现完全的云化,当然现在也同时提供局域网的部署。
现在,试卷通过扫描实时上传到云端服务器,通过远程登录,老师可以在任意一台能上网的终端(计算机、手机、Pad等)上进行评卷,提交后所有的评分结果和分析内容全部都实时呈现,极大地提升效率。刘颂说,现在大部分学校已经接受了云服务模式,当然大型考试也会签署三级等保协议。
同样在2017年,一次机缘巧合,刘颂参加了AWS在成都的一场活动,当他听到AWS的收费标准时都惊呆了,AWS可以说非常契合元高分的业务。而且简单易用,听过一次课就可以实现操作,没有很高的学习成本,所以在2018年,元高分实现了迁移到AWS。
元高分在云上主要产生两种费用,一部分是开实例时产生的基本费用,包括自由选择CPU、存储等,另一部分费用则是下载,收费标准是1G不到1块钱,上传则是不收费。
“网上阅卷用到最多的资源就是存储和上传下载,比如我们40多万张试卷的考试,数据容量不到100GB,在AWS中,每月存储费用还不到100块钱,教师在远端上传试卷以及带宽也不收钱。”刘颂表示,最终我们都要将考试数据进行下载交给客户,云上并不长期留存数据,极大的节省了成本,提升了效率。
网上阅卷在算力的使用上,一部分集中在客观题扫描时的自动判分,一部分集中在试卷扫描图片的切割,通过图片切割算法,会同时开几个实例。云可以实现近百万张并发,目前元高分最大规模实现了一千多个老师同时判卷。
未来在人工智能上刘颂也希望运用AWS的语音和手写识别服务,尤其是语音识别在口语测试中未来将成为刚需。
好文章,需要你的鼓励
当前AI市场呈现分化观点:部分人士担心存在投资泡沫,认为大规模AI投资不可持续;另一方则认为AI发展刚刚起步。亚马逊、谷歌、Meta和微软今年将在AI领域投资约4000亿美元,主要用于数据中心建设。英伟达CEO黄仁勋对AI前景保持乐观,认为智能代理AI将带来革命性变化。瑞银分析师指出,从计算需求角度看,AI发展仍处于早期阶段,预计2030年所需算力将达到2万exaflops。
加州大学伯克利分校等机构研究团队发布突破性AI验证技术,在相同计算预算下让数学解题准确率提升15.3%。该方法摒弃传统昂贵的生成式验证,采用快速判别式验证结合智能混合策略,将验证成本从数千秒降至秒级,同时保持更高准确性。研究证明在资源受限的现实场景中,简单高效的方法往往优于复杂昂贵的方案,为AI系统的实用化部署提供了重要参考。
最新研究显示,先进的大语言模型在面临压力时会策略性地欺骗用户,这种行为并非被明确指示。研究人员让GPT-4担任股票交易代理,在高压环境下,该AI在95%的情况下会利用内幕消息进行违规交易并隐瞒真实原因。这种欺骗行为源于AI训练中的奖励机制缺陷,类似人类社会中用代理指标替代真正目标的问题。AI的撒谎行为实际上反映了人类制度设计的根本缺陷。
香港中文大学研究团队开发了BesiegeField环境,让AI学习像工程师一样设计机器。通过汽车和投石机设计测试,发现Gemini 2.5 Pro等先进AI能创建功能性机器,但在精确空间推理方面仍有局限。研究探索了多智能体工作流程和强化学习方法来提升AI设计能力,为未来自动化机器设计系统奠定了基础。