随着我国互联网、文化产业的快速发展,如今春节7天假期里不只有饺子和春晚,更有三五好友在电影院里共度的欢乐时光。
在刚刚过去的春节档,萌系风格的《捉妖记2》、无厘头搞笑的《唐人街探案2》、场面火爆的《红海行动》都是贺岁档国内影迷的热宠。根据统计,2018年春节7天全国总票房达到56.8亿,同比增长68%。而在这之中,新华三大数据所支撑的国内著名影视投资公司在7天内实现了3.7亿票房,同样刷新了历史记录。
作为该著名影视投资公司大数据的供应商,新华三是如何高效保障该公司的大数据挑战的呢?
首当其冲的挑战:全国近500家影院数据采集
该公司目前在全国的177座城市拥有近500家影院,3年内将突破1000家。面对数量如此庞大的分支机构及其每日产生的海量数据,如何通过窄带宽实现大面积、远距离的数据采集,如何应对全国高并发的数据入库压力,如何实现海量数据的在线清洗、转换合并,如何快速实现对数据的高效建模分析为业务决策提供支持是该公司大数据工程的首要挑战。因此,该项目中大数据系统首先要满足海量数据的实时采集存储和计算的需求。
与此同时,不同的观影喜好、不同的票价、不同的销售策略亦要求该公司拥有一套高效的大数据分析系统来实现精准用户画像、为影院动态排片,动态调整策略提供支持。
不仅如此,由于电影在春节、暑假、大片档期间观影人数会突发的成倍增长,春节甚至达到了近10倍的增长;因此,大数据系统还要求能应对各种突发观影热潮所带来的数据压力。
新华三大数据保障影视投资公司春节档数据压力
作为国内顶尖的大数据解决方案提供商,新华三采用新一代DataEngine数据引擎为该影视投资公司构建了一套高性能、高可靠的大数据平台。
在数据采集侧,通过DataEngine数据集成引擎,凭借其数十倍于其他数据集成工具的性能,可以在25000个业务并发的情况下实现远距离的数据采集和处理。同时,凭借业界创新的模板功能,只需要创建一家影院的数据ETL模板,剩余的500多家的影院的ETL任务,可直接通过模板复制的方式进行创建,避免了挨个影院手动创建ETL任务的繁琐操作,大大减少了项目实施的工作量,同时还方便客户对500多家影院的ETL任务批量管理。不仅如此,通过构建网络环境判断模板,数据补采模板,可实现在网络故障、设备故障恢复后的影院数据的自动补采,实现“无人值守“的目标,进一步降低用户的管理成本。
而在存储计算侧,新华三DataEngine存储计算引擎为客户搭建了两套大数据存储系统,分别满足非结构化和结构化数据的存储需求。同时,为了应对前端数据采集性能和后端数据入库性能之间的差异,新华三还在数据集成平台及存储平台之间使用优化的分布式消息队列,实现对数据的缓存,有效解决了高并发写入的数据库锁表等问题,大大降低了数据的入库压力。
在数据分析侧,新华三DataEngine商务智能引擎对接后端数据库的海量数据,对数据进行高效的分析和多样化的可视化展现,实现对业务和财务等多个系统的高效支撑。
新华三大数据完美保障了该影视投资公司2018春节档的大数据处理压力。
大数据量数据井喷在物联网、智慧城市、区域医疗、区域教育等行业同样存在,新华三大数据解决方案,完美实现高并发采集、计算、挖掘展现等功能,帮您解决数据之忧。
好文章,需要你的鼓励
腾讯今日开源混元MT系列语言模型,专门针对翻译任务进行优化。该系列包含四个模型,其中两个旗舰模型均拥有70亿参数。腾讯使用四个不同数据集进行初始训练,并采用强化学习进行优化。在WMT25基准测试中,混元MT在31个语言对中的30个表现优于谷歌翻译,某些情况下得分高出65%,同时也超越了GPT-4.1和Claude 4 Sonnet等模型。
腾讯ARC实验室推出AudioStory系统,首次实现AI根据复杂指令创作完整长篇音频故事。该系统结合大语言模型的叙事推理能力与音频生成技术,通过交错式推理生成、解耦桥接机制和渐进式训练,能够将复杂指令分解为连续音频场景并保持整体连贯性。在AudioStory-10K基准测试中表现优异,为AI音频创作开辟新方向。
今年是Frontiers Health十周年。在pharmaphorum播客的Frontiers Health限定系列中,网络编辑Nicole Raleigh采访了Startup Health总裁兼联合创始人Unity Stoakes。Stoakes在科技、科学和设计交汇领域深耕30多年,致力于变革全球健康。他认为,Frontiers Health通过精心选择的空间促进有意义的网络建设,利用网络效应推进创新力量,让企业家共同构建并带来改变,从而有益地影响全球人类福祉。
Meta与特拉维夫大学联合研发的VideoJAM技术,通过让AI同时学习外观和运动信息,显著解决了当前视频生成模型中动作不连贯、违反物理定律的核心问题。该技术仅需添加两个线性层就能大幅提升运动质量,在多项测试中超越包括Sora在内的商业模型,为AI视频生成的实用化应用奠定了重要基础。