至顶网CIO与CTO频道 08月03日 北京消息:2020年7月,“会说话的汤姆猫”首款赛车类游戏《汤姆猫飞车》上线公测。它保持了汤姆猫游戏家族一贯的Q萌风格,赛道上一路都有萌宠陪伴,引领玩家进入奇妙的赛车世界。“会说话的汤姆猫”是上市公司金科文化旗下子公司Outfit7开发的一款风靡全球的手机游戏。自推出以来,它很快成为全球知名IP,形成了一个由数十款游戏组成的游戏家族,业务覆盖欧盟、美国、中国、俄罗斯、巴西、印度等全球200多个国家和地区。目前,其App产品矩阵的全球累计下载量超过130亿人次,月活跃用户超过4.1亿,全球日活用户超过4000万,中国日活用户超过1000万。
在庞大用户量的背后,是对于游戏平台伸缩性的巨大挑战。如何在晚上6-8点的流量高峰期保持与流量较低时同样的系统反应速度和游戏体验,真正让用户做到对后台技术和基础设施“无感”,是金科文化在构建游戏平台时首要关注的重点。为了满足这一需求,金科文化将服务平台构建在了AWS云服务之上。通过在AWS上建立一套云原生的系统架构,金科文化能够轻松满足高并发、高效率、高可用、低成本的运营需求,不管流量多大,用户体验感受一致,不受影响。
此外,为了服务遍布全球的用户,金科文化在全球建立了同样架构的两个游戏服务平台:国内用户平台使用西云数据运营的AWS中国(宁夏)区域,海外用户平台使用AWS亚太(新加坡)区域,为世界各地的用户提供更加顺畅、更低延迟的服务。
云原生架构支撑千万级日活的“无感”体验
由于汤姆猫家族游戏的日活用户达到千万级,由此产生的日广告点击量更是高达百亿级,金科文化需要设计一个高并发的系统架构,以便顺畅地处理前端大量用户的访问请求,并在后台进行大数据量的实时处理和分析。当一个用户进入/退出游戏、点击广告、做出支付购买行为时,用户平台要能够迅速提取出该用户的基本信息、状态信息,同时实时更新用户的状态信息。
为了充分利用云的好处,金科文化采用了云原生的架构。云原生是当前一种重要的IT理念。所谓云原生,就是相对于传统的应用开发方式,以应用在云上运行为前提,在应用的开发运维中充分利用云的特性和优势,实现应用的敏捷性、弹性伸缩、高可用性、高效率、降低总拥有成本等好处。云原生架构开发中通常采用的技术包括开发运维一体化(DevOps)、微服务(MicroServices)、敏捷基础设施(Agile Infrastructure)等。
通过采用Amazon Elastic Compute Cloud(Amazon EC2)弹性计算服务、Amazon EC2 Auto Scaling弹性伸缩服务、Application Load Balancer(ALB)负载均衡服务和Amazon DynamoDB键/值和文档数据库服务,金科文化的游戏平台实现了7倍的自动伸缩和负载均衡。云原生架构帮助金科文化在保证系统开发、运维、交付效率的同时,实现了自动扩容、自动运维等来保证系统弹性,从而为其打造“无感”用户体验打下了扎实的基础。
云应用的下一步延申:大数据分析
汤姆猫游戏家族成功的背后,除了通过云原生架构实现的“无感”用户体验,还来源于通过大数据分析不断改善应用开发和运营,持续提高用户体验。用户分析系统是金科文化在AWS云上的另一个重要应用,通过分析用户留存、使用时长等数据,为游戏开发和运营提供决策依据。
金科文化巨大的用户量背后,每天需要处理的数据量在压缩后依然高达百GB 级别,导致传统数据库无法承担,更无法支撑实时数据分析。金科文化的用户分析系统使用了Amazon Kinesis Data Streams接入数据流,通过Amazon Kinesis Data Analytics进行实时数据分析,并将离线数据接入Amazon Simple Storage Service (Amazon S3) 云存储服务进行数据的抽取、转换和加载(Extract-Transform-Load,简称ETL)处理。金科文化还使用Amazon Redshift托管式数据仓库替代了原有架构中开源的解决方案Apache Kylin,将部署和运维开支成本降低了70%多。
游戏行业对云服务的应用由来已久,而云原生的概念也被广泛验证和推崇。在实际应用中,通过广泛而深入的云服务提高应用弹性和敏捷性,最大限度发挥云原生的价值,将帮助游戏企业提升运营效率、降低运营成本,适应用户需求快速创新,从而为企业发展带来巨大的价值。金科文化在AWS的应用,为业界同行树立了一个成功的典范。
好文章,需要你的鼓励
这项来自苹果公司的研究揭示了视频大语言模型评测的两大关键问题:许多测试问题不看视频就能回答正确,且打乱视频帧顺序后模型表现几乎不变。研究提出VBenchComp框架,将视频问题分为四类:语言模型可回答型、语义型、时序型和其他类型,发现在主流评测中高达70%的问题实际上未测试真正的视频理解能力。通过重新评估现有模型,研究团队证明单一总分可能掩盖关键能力差距,并提出了更高效的评测方法,为未来视频AI评测提供了新方向。
这篇来自KAIST AI研究团队的论文提出了"差分信息分布"(DID)这一创新概念,为理解直接偏好优化(DPO)提供全新视角。研究证明,当偏好数据编码了从参考策略到目标策略所需的差分信息时,DPO中的对数比率奖励形式是唯一最优的。通过分析DID熵,研究解释了对数似然位移现象,并发现高熵DID有利于通用指令跟随,而低熵DID适合知识密集型问答。这一框架统一了对DPO目标、偏好数据结构和策略行为的理解,为语言模型对齐提供理论支持。
VidText是一个全新的视频文本理解基准,解决了现有评估体系的关键缺口。它涵盖多种现实场景和多语言内容,提出三层评估框架(视频级、片段级、实例级),并配对感知与推理任务。对18个先进多模态模型的测试显示,即使最佳表现的Gemini 1.5 Pro也仅达46.8%平均分,远低于人类水平。研究揭示输入分辨率、OCR能力等内在因素和辅助信息、思维链推理等外部因素对性能有显著影响,为未来视频文本理解研究提供了方向。
ZeroGUI是一项突破性研究,实现了零人工成本下的GUI代理自动化在线学习。由上海人工智能实验室和清华大学等机构联合开发,这一框架利用视觉-语言模型自动生成训练任务并提供奖励反馈,使AI助手能够自主学习操作各种图形界面。通过两阶段强化学习策略,ZeroGUI显著提升了代理性能,在OSWorld环境中使UI-TARS和Aguvis模型分别获得14%和63%的相对改进。该研究彻底消除了传统方法对昂贵人工标注的依赖,为GUI代理技术的大规模应用铺平了道路。