至顶网CIO与应用频道 08月07日 北京消息:8月3日,“2017中国大数据企业50强”隆重揭晓,为期两天的由中国电子信息产业发展研究院主办,以“智领先机 数见未来”为主题的“2017中国大数据产业生态大会暨中国大数据产业生态联盟周年庆”活动在北京划上了圆满的句号。作为中国大数据产业最盛大、最具专业性及深度的行业聚会,本届大会吸引了政府主管领导、行业专家、企业领袖、知名投资人等汇聚一堂,深入探讨大数据产业融合创新发展之道,执行等目标。
普元凭借大数据业务上持续的研发投入、创新能力,以及产品及方案成熟度、应用案例、发展潜力等多方面的综合实力,在入围的覆盖中国大数据全产业生态链的近三百家中国大数据企业中脱颖而出,2017年继续蝉联“中国大数据企业50强”。
工匠精神得认证,王轩斩获“中国数据大工匠”
与会,普元软件产品部副总经理、大数据产品总经理王轩依托技术、研发等方面不可替代、至关重要的地位荣膺“中国数据大工匠”。作为普元大数据产品的技术领头人,王轩自 “2017年中国数据大工匠”评选起,即受邀参评,其无论在产业和行业内拥有的影响力和地位均广受赞誉。具有丰富实践经验的王轩,不仅是中国大数据产业生态联盟专家委员会的专家委员,还是专注数据治理领域权威协会国际数据管理协会(DAMA)的会员。
此次全面主持普元大数据产品的研发、拓展及团队管理工作的王轩斩获“中国数据大工匠”奖项,证明了普元人在中国大数据领域的领导力、影响力、贡献力、技术特长、实践力均得到了行业和权威机构的广泛认可。
普元大数据治理解决方案在东方航空的最佳实践
同时被认可的,还有普元基础支撑领域的大数据治理解决方案。凭借优势,普元荣登由工业和信息化部指导和支持、中国大数据产业生态联盟权威发布的《2017中国大数据产业生态地图暨中国大数据产业发展白皮书》。此项白皮书展示了5个月深度调研2000余家大数据企业梳理出的国内大数据产业发展现状,对未来重要技术突破点进行了透彻分析。
此外,普元大数据治理解决方案还被收录于《2017中国大数据应用典型案例集》中。该方案适用于政府、公安、航空、电力、能源、金融、电信、制造、证券等行业。
1.方案核心特点
数字化时代,用户能否自主发现与自助获得高质量的大数据成为业务创新的关键,为此,企业在搭建大数据平台时,就需要着手大数据治理相关建设。普元大数据治理解决方案,是一个面向政府、公安、航空、电力、能源、金融、电信、制造、证券等行业的整体解决方案,为企业加强数据管理、提升数据质量、自助查找与获得数据提供了基础,是一个集“管数据”、“看数据”、“找数据”、“用数据”于一体的解决方案。
2.方案行业应用
作为国内领先的大数据治理厂商,普元的大数据治理解决方案曾为全国各地上百家客户带来业务价值,包括政府、公安、航空、电力、能源、金融、电信、制造、证券等多个行业的各大知名企业,以中国东方航空为例:
中国东方航空股份有限公司(以下简称东航)是中国三大国有大型骨干航空企业之一,近几年,东航已经建设了各种数据集市、数据仓库,但随着业务系统和数据量的增多,数据一致性问题和业务指标口径不一致问题日益凸显,影响了东航对海量数据的有效利用。为加强数据管理,提升数据质量,普元帮助东航建立了统一的数据资产管理平台,通过元数据管理、数据数据标准梳理和建设、数据质量管理、数据地图建设,东航数据支撑能力和行业竞争力显著提升。
东航信息系统复杂,需要以数据仓库相关业务系统为基础,形成数据从有到用的链条,实现数据资产的全过程、全角度管理。通过数据资产管理平台的建设,东航实现了业务化数据地图的展现。普元借鉴达美航空经验,分析了航空领域模型中近2000个实体,逐个核对了1249张业务系统表数据,梳理出了数据主题域、数据实体、业务系统在内的三层结构的数据地图:包括航班、票务等13个主题域,针对每个主题域给出了多达227个业务实体目录及定义,给出了每个业务实体对应的数据库表与业务系统。
3.方案应用价值
普元大数据治理解决方案曾为全国各地上百家知名客户带来业务价值。普元根据各行业实际情况的不同量身定制出了差异化的大数据治理解决方案,形成了以元数据管理为核心的众多数据治理相关产品,其中,自助化数据服务平台有望成为大数据治理的最佳实践。
普元的元数据管理产品,具有全面的数据管理能力,实现了对包括大数据在内的多种类型数据信息的全面自动地采集,能让用户在一个界面全面了解到企业元数据信息,通过图像从更多维度、更直观地了解企业数据全貌和数据关系,关注企业各种用户的使用诉求,跟具体用户的使用场景相结合,让业务人员、开发人员、运维人员能更加便捷地工作。
普元自助化数据服务平台,为用户提供了一套数据服务的生产线,让用户能通过这条生产线自助地找到数据、获得数据,并规范化地使用数据。作为大数据治理的落地工具,普元自助化数据服务共享平台不仅为开发者提供了一套完整的数据生产线,也给运维者提供了易用的监控界面。同时,普元自助化数据服务共享平台还提供了全局的数据资产监控能力和数据问题的跟踪能力,通过全局的数据资产监控能力,使客户方便地了解企业数据共享交换的全貌、系统间的数据关系和数据提供方和消费方的使用情况;通过数据问题跟踪能力,实现了数据问题的智能定位,减少运维工作难度。
好文章,需要你的鼓励
这篇研究提出了OThink-R1,一种创新的大型推理模型,能够像人类一样在快速直觉思维和慢速深度推理之间自动切换。研究者发现,现有推理模型即使面对简单问题也会生成冗长的推理过程,导致计算资源浪费。通过分析推理轨迹并使用LLM评判员区分冗余和必要推理,OThink-R1能根据问题复杂度动态调整思考深度。实验表明,该方法平均减少了23.4%的生成文本量,同时保持或提高了准确率,代表了向更高效、更人性化AI推理系统迈出的重要一步。
这项研究提出了SHARE,一种新型文本到SQL修正框架,它利用三个小型语言模型(SLM)协同工作,实现高效精准的SQL错误修正。SHARE首先通过基础行动模型将SQL转换为行动轨迹,再经过模式增强模型和逻辑优化模型的层次化精细化修正。研究团队还创新性地提出了层次化自演化训练策略,大大提高了训练数据效率。实验结果表明,SHARE在多个基准测试上显著提升了SQL生成准确率,计算成本仅为传统方法的十分之一,并展现出强大的泛化能力,适用于各种生成器模型和SQL方言。
这项由香港大学和南京大学等机构研究人员联合开发的双专家一致性模型(DCM)解决了高质量视频生成中的效率难题。研究团队发现扩散模型蒸馏过程中存在优化冲突:早期阶段负责语义布局与运动,后期阶段关注细节精修,两者学习动态差异显著。DCM创新性地将这两个任务分配给不同的专家模型,通过参数高效的实现方式,使模型仅需4步即可生成接近50步原始模型质量的视频,大幅提升生成速度,为实用化AI视频创作铺平道路。
这项研究介绍了QARI-OCR,一种基于Qwen2-VL-2B-Instruct模型微调的阿拉伯文字识别系统。研究团队通过三阶段合成数据训练,成功解决了阿拉伯文字识别中的主要挑战:曲线连笔特性、上下文变化的字母形状和发音符号。QARI v0.2模型创下了0.061的字符错误率和0.160的单词错误率,超越了现有开源解决方案,为阿拉伯文化遗产的数字化保存提供了重要工具。