随着我国互联网、文化产业的快速发展,如今春节7天假期里不只有饺子和春晚,更有三五好友在电影院里共度的欢乐时光。
在刚刚过去的春节档,萌系风格的《捉妖记2》、无厘头搞笑的《唐人街探案2》、场面火爆的《红海行动》都是贺岁档国内影迷的热宠。根据统计,2018年春节7天全国总票房达到56.8亿,同比增长68%。而在这之中,新华三大数据所支撑的国内著名影视投资公司在7天内实现了3.7亿票房,同样刷新了历史记录。
作为该著名影视投资公司大数据的供应商,新华三是如何高效保障该公司的大数据挑战的呢?

首当其冲的挑战:全国近500家影院数据采集

该公司目前在全国的177座城市拥有近500家影院,3年内将突破1000家。面对数量如此庞大的分支机构及其每日产生的海量数据,如何通过窄带宽实现大面积、远距离的数据采集,如何应对全国高并发的数据入库压力,如何实现海量数据的在线清洗、转换合并,如何快速实现对数据的高效建模分析为业务决策提供支持是该公司大数据工程的首要挑战。因此,该项目中大数据系统首先要满足海量数据的实时采集存储和计算的需求。
与此同时,不同的观影喜好、不同的票价、不同的销售策略亦要求该公司拥有一套高效的大数据分析系统来实现精准用户画像、为影院动态排片,动态调整策略提供支持。
不仅如此,由于电影在春节、暑假、大片档期间观影人数会突发的成倍增长,春节甚至达到了近10倍的增长;因此,大数据系统还要求能应对各种突发观影热潮所带来的数据压力。
新华三大数据保障影视投资公司春节档数据压力
作为国内顶尖的大数据解决方案提供商,新华三采用新一代DataEngine数据引擎为该影视投资公司构建了一套高性能、高可靠的大数据平台。
在数据采集侧,通过DataEngine数据集成引擎,凭借其数十倍于其他数据集成工具的性能,可以在25000个业务并发的情况下实现远距离的数据采集和处理。同时,凭借业界创新的模板功能,只需要创建一家影院的数据ETL模板,剩余的500多家的影院的ETL任务,可直接通过模板复制的方式进行创建,避免了挨个影院手动创建ETL任务的繁琐操作,大大减少了项目实施的工作量,同时还方便客户对500多家影院的ETL任务批量管理。不仅如此,通过构建网络环境判断模板,数据补采模板,可实现在网络故障、设备故障恢复后的影院数据的自动补采,实现“无人值守“的目标,进一步降低用户的管理成本。
而在存储计算侧,新华三DataEngine存储计算引擎为客户搭建了两套大数据存储系统,分别满足非结构化和结构化数据的存储需求。同时,为了应对前端数据采集性能和后端数据入库性能之间的差异,新华三还在数据集成平台及存储平台之间使用优化的分布式消息队列,实现对数据的缓存,有效解决了高并发写入的数据库锁表等问题,大大降低了数据的入库压力。
在数据分析侧,新华三DataEngine商务智能引擎对接后端数据库的海量数据,对数据进行高效的分析和多样化的可视化展现,实现对业务和财务等多个系统的高效支撑。
新华三大数据完美保障了该影视投资公司2018春节档的大数据处理压力。

大数据量数据井喷在物联网、智慧城市、区域医疗、区域教育等行业同样存在,新华三大数据解决方案,完美实现高并发采集、计算、挖掘展现等功能,帮您解决数据之忧。
好文章,需要你的鼓励
在技术快速发展的时代,保护关键系统越来越依赖AI、自动化和行为分析。数据显示,2024年95%的数据泄露源于人为错误,64%的网络事件由员工失误造成。虽然先进的网络防御技术不断发展,但人类判断仍是最薄弱环节。网络韧性不仅是技术挑战,更是人员和战略需求。建立真正的韧性需要机器精确性与人类判断力的结合,将信任视为战略基础设施的关键要素,并将网络韧性提升为国家安全的核心组成部分。
南洋理工大学团队开发了Uni-MMMU基准测试,专门评估AI模型的理解与生成协同能力。该基准包含八个精心设计的任务,要求AI像人类一样"边看边想边画"来解决复杂问题。研究发现当前AI模型在这种协同任务上表现不平衡,生成能力是主要瓶颈,但协同工作确实能提升问题解决效果,为开发更智能的AI助手指明了方向。
自计算机诞生以来,人们就担心机器会背叛创造者。近期AI事件包括数据泄露、自主破坏行为和系统追求错误目标,暴露了当前安全控制的弱点。然而这种结果并非不可避免。AI由人类构建,用我们的数据训练,在我们设计的硬件上运行。人类主导权仍是决定因素,责任仍在我们。
360 AI Research团队发布的FG-CLIP 2是一个突破性的双语精细视觉语言对齐模型,能够同时处理中英文并进行精细的图像理解。该模型通过两阶段训练策略和多目标联合优化,在29个数据集的8类任务中均达到最先进性能,特别创新了文本内模态对比损失机制。团队还构建了首个中文多模态评测基准,填补了该领域空白,为智能商务、安防监控、医疗影像等应用开辟新可能。