随着我国互联网、文化产业的快速发展,如今春节7天假期里不只有饺子和春晚,更有三五好友在电影院里共度的欢乐时光。
在刚刚过去的春节档,萌系风格的《捉妖记2》、无厘头搞笑的《唐人街探案2》、场面火爆的《红海行动》都是贺岁档国内影迷的热宠。根据统计,2018年春节7天全国总票房达到56.8亿,同比增长68%。而在这之中,新华三大数据所支撑的国内著名影视投资公司在7天内实现了3.7亿票房,同样刷新了历史记录。
作为该著名影视投资公司大数据的供应商,新华三是如何高效保障该公司的大数据挑战的呢?

首当其冲的挑战:全国近500家影院数据采集

该公司目前在全国的177座城市拥有近500家影院,3年内将突破1000家。面对数量如此庞大的分支机构及其每日产生的海量数据,如何通过窄带宽实现大面积、远距离的数据采集,如何应对全国高并发的数据入库压力,如何实现海量数据的在线清洗、转换合并,如何快速实现对数据的高效建模分析为业务决策提供支持是该公司大数据工程的首要挑战。因此,该项目中大数据系统首先要满足海量数据的实时采集存储和计算的需求。
与此同时,不同的观影喜好、不同的票价、不同的销售策略亦要求该公司拥有一套高效的大数据分析系统来实现精准用户画像、为影院动态排片,动态调整策略提供支持。
不仅如此,由于电影在春节、暑假、大片档期间观影人数会突发的成倍增长,春节甚至达到了近10倍的增长;因此,大数据系统还要求能应对各种突发观影热潮所带来的数据压力。
新华三大数据保障影视投资公司春节档数据压力
作为国内顶尖的大数据解决方案提供商,新华三采用新一代DataEngine数据引擎为该影视投资公司构建了一套高性能、高可靠的大数据平台。
在数据采集侧,通过DataEngine数据集成引擎,凭借其数十倍于其他数据集成工具的性能,可以在25000个业务并发的情况下实现远距离的数据采集和处理。同时,凭借业界创新的模板功能,只需要创建一家影院的数据ETL模板,剩余的500多家的影院的ETL任务,可直接通过模板复制的方式进行创建,避免了挨个影院手动创建ETL任务的繁琐操作,大大减少了项目实施的工作量,同时还方便客户对500多家影院的ETL任务批量管理。不仅如此,通过构建网络环境判断模板,数据补采模板,可实现在网络故障、设备故障恢复后的影院数据的自动补采,实现“无人值守“的目标,进一步降低用户的管理成本。
而在存储计算侧,新华三DataEngine存储计算引擎为客户搭建了两套大数据存储系统,分别满足非结构化和结构化数据的存储需求。同时,为了应对前端数据采集性能和后端数据入库性能之间的差异,新华三还在数据集成平台及存储平台之间使用优化的分布式消息队列,实现对数据的缓存,有效解决了高并发写入的数据库锁表等问题,大大降低了数据的入库压力。
在数据分析侧,新华三DataEngine商务智能引擎对接后端数据库的海量数据,对数据进行高效的分析和多样化的可视化展现,实现对业务和财务等多个系统的高效支撑。
新华三大数据完美保障了该影视投资公司2018春节档的大数据处理压力。

大数据量数据井喷在物联网、智慧城市、区域医疗、区域教育等行业同样存在,新华三大数据解决方案,完美实现高并发采集、计算、挖掘展现等功能,帮您解决数据之忧。
好文章,需要你的鼓励
英特尔第三季度财报超华尔街预期,净收入达41亿美元。公司通过裁员等成本削减措施及软银、英伟达和美国政府的大额投资实现复苏。第三季度资产负债表增加200亿美元,营收增长至137亿美元。尽管财务表现强劲,但代工业务的未来发展策略仍不明朗,该业务一直表现不佳且面临政府投资条件限制。
美国认知科学研究院团队首次成功将进化策略扩展到数十亿参数的大语言模型微调,在多项测试中全面超越传统强化学习方法。该技术仅需20%的训练样本就能达到同等效果,且表现更稳定,为AI训练开辟了全新路径。
微软发布新版Copilot人工智能助手,支持最多32人同时参与聊天会话的Groups功能,并新增连接器可访问OneDrive、Outlook、Gmail等多项服务。助手记忆功能得到增强,可保存用户信息供未来使用。界面新增名为Mico的AI角色,并提供"真实对话"模式生成更机智回应。医疗研究功能也得到改进,可基于哈佛健康等可靠来源提供答案。同时推出内置于Edge浏览器的Copilot Actions功能,可自动执行退订邮件、预订餐厅等任务。
纽约大学等机构联合开发的ThermalGen系统能够将普通彩色照片智能转换为对应的热成像图片,解决了热成像数据稀缺昂贵的难题。该系统采用创新的流匹配生成模型和风格解耦机制,能适应从卫星到地面的多种拍摄场景,在各类测试中表现优异。研究团队还贡献了三个大规模新数据集,并计划开源全部技术资源,为搜救、建筑检测、自动驾驶等领域提供强有力的技术支撑。