至顶网CIO与应用频道 07月10日 新闻消息:2018年7月10日-11日,2018中国大数据应用大会在成都召开,大会以"大数据赋能数字中国"为主题。由成都市人民政府指导,中国大数据专家委员会、中国电子信息产业集团有限公司中国电子学会、四川省经济和信息化委员会主办,世界工程组织联合会工程技术创新委员会(WFEO-CEIT)、成都市经济和信息化委员会、成都市博览局全力支持,中国电子器材有限公司、中国电子学会科技交流中心承办,业内知名媒体至顶网与科技行者协办。TERADATA天睿公司大中华区解决方案总监姜欣带来了《数字经济时代的大数据分析》的主题演讲。
TERADATA天睿公司大中华区解决方案总监姜欣
市场洞察
基于大数据、物联网、人工智能等技术,企业和组织可以采集、处理、整合、分析越来越多的海量数据,并产生业务价值亮点,从而支持数字经济作为整个国民经济的原动力。
数字经济包括数字产业化和产业数字化两大部分:
根据中国信息通信研究院报告数据显示:2017年,中国大数据产业整体规模4700亿元,而且未来三年仍将保持近30%的增速。估计到2020年超万亿。
业务应用
企业和组织的使命和奋斗目标——争做“感知型”,顾名思义就是“有感情、有知觉”的企业和组织,能够有预见性的、敏捷的、自动的完成业务目标的企业和组织。在《感知型企业》这本书中有很好的诠释,并对“感知型”的五大核心数据能力进行了阐述。
“连接万物,连接未来”,我们先来看一些企业如何实践“感知型”:
北美最大的移动运营商Verizon,整合物联网、通信及大数据分析技术为一揽子解决方案,将北美最大的食品零售集团Ahold,打造成感知型食品零售商。当最终用户从开始进入零售店开始,贯穿整个购物消费过程,并提供智能配送及客户服务,客户获得良好体验和感知。
中国移动大连接战略,坚持“以人民为中心”的发展理念,将个人客户、政企客户、家庭宽带客户、供应商、甚至跨行业客户都连接到中国移动这张大网上,实现数据的互联互通,从移动信息专家转变为大数据运营商。
德国电信,构建共享数字服务平台,将全欧洲用户的日常行为加以整合分析,提供最好的产品和服务感知,覆盖交通、医疗、购物、教育等生活的方方面面,让用户感觉“自由翱翔在整个欧洲上空”。
纵观这些企业,目标都是“数据资源整合和开放共享,更好的服务于经济社会发展和人民生活改善”。
技术使能
大数据分析的灵魂和终极目标是要解决实际的业务问题。因此,对于每一个企业或者组织,一定要从体系上建立分析应用的规划和框架,从而分步实施,实现业务价值的持续释放。这里举例说明了轨道交通行业和互联网行业的业务提升机会点,大数据应用要整体来规划和建设,涉及组织的方方面面。
有了前面的业务应用方向,下一个问题就是需要用到怎样的分析技术。按照gartner的说法,每一种数据科学技术都要经历所谓的炒作期、高潮期、梦想幻灭期和实际应用期。
企业要兼顾架构的开放性、技术的先进性和产品的成熟性,才能构建可持续发展的大数据支持体系。所有桔色突出部分的技术,都是Teradata在研发重点投入的方面,并保证用户价值最大化。
由于大数据技术发展过快,历史原因,产生了很多数据孤岛、部署方式也不够灵活。如果我们能够找到一种架构同时实现:敏捷分析、弹性部署、统一管理、架构稳定、减少数据搬移。那将是一件非常美妙的事情。因此,大数据分析平台的未来架构一定是,在多类型数据存储和高速连接的基础上,实现数据整合,基于此以组件式实现SQL、机器学习、图分析、深度学习、spark,甚至是基于docker的自定义分析引擎。并支持多种分析开发语言,也支持多种开源及商用分析工具。
好文章,需要你的鼓励
随着AI模型参数达到数十亿甚至万亿级别,工程团队面临内存约束和计算负担等共同挑战。新兴技术正在帮助解决这些问题:输入和数据压缩技术可将模型压缩50-60%;稀疏性方法通过关注重要区域节省资源;调整上下文窗口减少系统资源消耗;动态模型和强推理系统通过自学习优化性能;扩散模型通过噪声分析生成新结果;边缘计算将数据处理转移到网络端点设备。这些创新方案为构建更高效的AI架构提供了可行路径。
清华大学团队开发了CAMS智能框架,这是首个将城市知识大模型与智能体技术结合的人类移动模拟系统。该系统仅需用户基本信息就能在真实城市中生成逼真的日常轨迹,通过三个核心模块实现了个体行为模式提取、城市空间知识生成和轨迹优化。实验表明CAMS在多项指标上显著优于现有方法,为城市规划、交通管理等领域提供了强大工具。
Meta以143亿美元投资Scale AI,获得49%股份,这是该公司在AI竞赛中最重要的战略举措。该交易解决了Meta在AI发展中面临的核心挑战:获取高质量训练数据。Scale AI创始人王亚历山大将加入Meta领导新的超级智能研究实验室。此次投资使Meta获得了Scale AI在全球的数据标注服务,包括图像、文本和视频处理能力,同时限制了竞争对手的数据获取渠道。
MIT研究团队发现了一个颠覆性的AI训练方法:那些通常被丢弃的模糊、失真的"垃圾"图片,竟然能够训练出比传统方法更优秀的AI模型。他们开发的Ambient Diffusion Omni框架通过智能识别何时使用何种质量的数据,不仅在ImageNet等权威测试中创造新纪录,还为解决AI发展的数据瓶颈问题开辟了全新道路。