企业在IT研发上遇到问题,往往会组建专门的团队研究解决方案。BienData创始人&CEO管心宇发现另一种方式“众包竞赛”,是一种有益的补充,甚至可能会产生一些创新的解决方案。
众包竞赛是一种需求方或主办方提出奖励机制的比赛,任何国籍、性别、年龄、职业都可以参赛,比赛有一个统一的评测方法,经过排序选出第一名。
管心宇也在想,是不是可以把众包竞赛用在人工智能领域的创新中。他认为,众包竞赛特别适合人工智能,因为人工智能往往有一个标准数据集,在数据集上运行模型就可以得到一个客观的评测结果,这也能保证竞赛结果的公平性。
通过与亚马逊云科技合作,BienData使用众包竞赛的方式连接人工智能的开发者、数据集、应用场景、模型,并且竞赛平台上产生的人工智能优秀成果还将回到行业,普惠社会。
云上的一站式竞赛承办
BienData是由清华大学计算机系孵化,旗下产品与服务包含人工智能竞赛、数据科学社区、前沿人工智能报道,以及专注于AI行业的品牌传播服务。BienData以竞赛为入口,致力于打造国内一流数据科学综合服务平台。
Bien是法语“好”的意思,管心宇希望在这个平台上可以聚集很多、很好的数据集和开发者。
BienData可以提供一站式的竞赛承办服务,包括:技术支持、运营管理、活动承办、赛事推广。
管心宇表示,我们会分析数据集应该如何把商业问题还原成数据问题或机器学习问题,帮助企业进行数据的获取、清洗,数据集的分割、测试等,最终形成一个比赛。开发者在拿到数据后可以自行开发,得到结果提交给平台,通过统一标准的评测产生实时排行榜。
在过去几年,BienData已经做了一百多场算法比赛,积累了10万名开发者,覆盖机器学习、自然语言处理、计算机视觉等方向,累计总奖金已经超过700万。
Biendata 作为一个技术项目,于 2015 年启动,2017 年开始独立运营。管心宇说,众包竞赛平台最早在原型阶段,就准备搭建在公有云之上,2017年经过调研,亚马逊云科技对于开发者的功能支持丰富,同时具备国际性属性,所以BienData最终选择完全部署在亚马逊云上。
2019年,Biendata加入亚马逊云科技全球合作伙伴网络(APN),为更多用户提供云上的人工智能方案,如与亚马逊云科技专业服务团队共同支持深圳和宁夏的重点高职院校课程和实训平台建设。2020年疫情期间,Biendata借助云上开展在线业务,通过更多云原生的服务降低了运维成本,并将更多关注放在业务本身,实现了业务的快速发展。2021年,借助亚马逊云科技安全合规能力,Biendata赢得了更多海外项目,并与亚马逊云科技的其它客户合作开展人工智能普惠的竞赛,通过比赛对K12、高校领域培养AI人才。
云加速普惠人工智能的步伐
BienData选择亚马逊云科技主要基于四大原因,第一,数据安全保障性高,亚马逊云科技看中数据保护、合规性和数据隐私,并从底层数据中心搭建、网络访问以及操作权限设置都提供了多方面的安全保障;第二,可伸缩的计算能力,拥有丰富的实例类型配合易用的工具,加速在云中不同规模的深度学习的速度;第三,稳定可靠的技术,系统的整体稳定性显著提高,广泛支持开源软件与商用软件的对接,应用程序可用性达到99.9%;第四,成本效益服务,节省了资源成本和人力成本,在资源分配方面,结合Amazon EC2 Auto Scaling和Amazon EC2 Spot实例的应用,使资源占用成本大幅降低,在人工智能方面,自动管理功能降低了对系统运维的需求。
管心宇指出,在过去几年产品的丰富过程中,BienData几乎每一个产品都能在亚马逊云科技的产品线里找到一个比较对应的功能,可以很好的支持快速研发和上线、迭代。
KDD CUP是全球最具影响力的数据比赛,有“数据世界杯”称号,BienData在2015-2020年承办过四次,其中2018年空气污染预测比赛模型提交环节中,为了保证赛事的公平公正,BienData提供的比赛平台不仅支持提交预测结果,还支持提交模型功能。选手只需要将包含模型的容器镜像上传到镜像仓库Amazon ECR, 后端系统通过侦听Amazon SQS中的消息队列,发现新的镜像,进而在由Amazon EKS构建的资源池下运行该容器,实现在系统后台的测试集上运行选手提交的模型,并将最终的结果写入Amazon S3对象存储,减少作弊可能,同时方便收集参赛模型。
同时,亚马逊云科技遍布全球的基础设施部署和安全合规能力也帮助BienData承办了新加坡国立大学项目。新加坡国立大学非常重视安全与合规能力,将服务部署在亚马逊云科技新加坡区域,就可以满足大部分的标准,原本三到五个月的准备、测试和认证过程,在亚马逊云上都可以直接得到满足。
BienData还和不同高校合作,将Amazon DeepRacer无人驾驶训练系统与真车模型DeepRacer打包形成实训产品,学生可以在线上训练系统中强化学习模型,并加载到线下真车上进行实测。
最终BienData运营成本节省了75%以上,竞赛上线时间加快50%以上。BienData基于亚马逊云科技还打造了bienlearn系列课程,实现了10万+数据科学用户覆盖,加速普惠人工智能的步伐。
好文章,需要你的鼓励
在2026年CES展会上,一款名为Sweekar的AI电子宠物亮相,被誉为90年代经典Tamagotchi的完美继承者。这款智能宠物从蛋形开始,随着成长会物理性变大,经历婴儿期、青少年期到成年期的完整生命周期。每个阶段都有不同的护理需求和互动方式,从基础语言学习到形成独特个性。与原版相比,Sweekar融入了先进AI技术,提供更丰富的长期体验。该产品将通过Kickstarter众筹,售价150美元。
瑞士ETH苏黎世联邦理工学院等机构联合开发的WUSH技术,首次从数学理论层面推导出AI大模型量化压缩的最优解。该技术能根据数据特征自适应调整压缩策略,相比传统方法减少60-70%的压缩损失,实现接近零损失的模型压缩,为大模型在普通设备上的高效部署开辟了新路径。
西班牙CTIC RuralTech创新中心运用AI等前沿技术解决农业面临的气候变化等重大挑战。通过气候模拟系统和土地使用智能分析,农户可以监测作物、预测不同种植条件下的结果,如同拥有时光机器。草莓生产商利用模拟器预测疾病影响和气候变化效应,奶酪制造商则用AI分析牛奶数据,确定最适合生产特定奶酪的原料。这些技术应用大幅提高了农业可持续性和效率。
弗吉尼亚大学团队创建了Refer360数据集,这是首个大规模记录真实环境中人机多模态交互的数据库,涵盖室内外场景,包含1400万交互样本。同时开发的MuRes智能模块能让机器人像人类一样理解语言、手势和眼神的组合信息,显著提升了现有AI模型的理解准确度,为未来智能机器人的广泛应用奠定了重要基础。