2018年,家庭保险服务商Homeprotect完成了其根据顶尖IT人才技能设计的首个内部数据科学平台版本。这套方案突破了现有软件的限制,成为公司探索技术可能性的一个重要里程碑。而作为成果的最大功臣,公司CTO Dan Huddart将自己在大型企业保险领域积累的经验,成功转化为Homeprotect的自由创新策略。
在18个月的设计与研发周期当中,整套方案的核心系统——名为Cortex的数据科学平台——不仅有助于计算产品保费,同时也深刻改变了Homeprotect在关键领域的业务运营方式。
Cortex是Huddart于2015年加入Homeprotect并担任CTO以来的心血结晶。Huddart直接向公司CEO汇报工作,当初刚入职时正值这家家庭保险企业被私募基金收购、获得可观的资金注入,于是扩大业务的雄心就成为接下来的发展重点。
在保险行业“大厂”积累下丰富经验之后,Huddart个人的愿景与企业的发展路线完美契合,誓要把握机会施展拳脚。
Huddart表示,“大家对于行业大厂应该不会陌生。当时我已经积累到丰富的经验,也有不少想法和奋斗的热情,所以我打算进入一家体量较小的企业、争取更大的决定权,把自己的理想全面转化为现实。”
Huddart初入保险行业是在2011年,当时加入的是RSA Insurance,正值该公司“在数字平台上的大规模投资”。
RSA其时正在全球范围内扩张业务并收购保险公司,这也让Huddart获得了在斯堪的纳维亚半岛和波兰的工作经验。在此期间,他开始参与跨国项目,并在完成后返回英国。
他在RSA工作了6年,其中有2年从事核心系统的检查和修复工作。
而在与Homeprotect团队及私募股权基金的所有者会面之后,他终于踏上了自己“规模虽小、但却令人激动”的全新旅程。
当时Homeprotect的客户刚刚超过10万,公司共有60位员工,但IT岗位只有6个。不过新的经营方已经准备好重磅投入并推动业务增长。Huddart回忆道,“接下来的挑战,就是如何扩大Homeprotect的业务规模、使其成长为一家主流保险大厂。”
Homeprotect是非标保险服务领域的专家,能够为客户提供大多数保险公司无法实现的个性化服务。
Huddart刚开始任职时,面对的主要难题就是如何扩大IT团队。“小企业主要面临两个挑战。首先就是用自动化方式扩展业务,否则就无法容纳更多的客户和员工。因此,我们必须在员工和企业技术自动化方面进行大量投资。”
“第二,我们得在短期之内拿出超越竞争对手的增值产品,否则就没办法在市场对抗中压制对方。在我们所处的市场中,技术确实直接决定了不同保险企业所能提供的客户体验。”
其中具体包括精算算法、网站和数据库方面的工作,Huddart将其描述为“与竞争对手之间的生死较量。”
“谁能做得更多、更好,谁就能生存下来。”
勃勃野心
如今,Homeprotect公司的IT团队约有18名员工,全公司雇员数量也已突破100,另有110人负责包外客服中心。
在Huddart加入的一年之后,也就是2016年,他迎来了推动业务提升的第一个好机会。当时,Homeprotect公司需要开发一套新的精算引擎(业内称为评级引擎)。
Huddart表示当时保险行业的精算流程正变得愈发复杂,数据科学也开始在行业内逐步兴起。
“由于我们为整个市场(包括非标市场)提供保险服务已经有大约10年,所以我们收集到的客户数据要比竞争对手丰富得多。随着数据科学的出现,我们无疑迎来了超越普通保险企业的绝佳机会。毕竟作为一家非标保险服务提供商,我们会向客户询问更多问题,而这些问题都转化成了相应的数据。”
随着保险公司通过中介机构乃至其他外部数据源收集更多决策因素,精算流程正变得越来越复杂、多变。
“精准精算的军备竞赛已经打响,战况越来越激烈。过去,算法主要用于核定价格。但现在,企业的数据科学技术必须足够先进,市场竞争的门槛已经远超以往。”
用科技服务于人才
为了提高效力,Huddart研究了市面上的可用精算引擎,并开始寻找顶尖的数据科学人才。
“在努力招聘最优秀的精算人才时,我们发现不少数据科学和精算人才的确很有才华,但需要与其他领域一同争夺这些稀缺劳动力。”
在与面试者交流时,他发现保险精算体系的一大问题,就是技术水平“远远落后于其他行业”。
Huddart的指出,与其他保险企业一样,直接采购市面上的现成保险精算系统已经严重制约Homeprotect的技术能力。而该公司看中的人才,根本就不可能接受这种远落后于整体水平的工具。
这促使Huddart和他的团队着手构建自己的新平台,希望跟上“顶尖人才”们的探索步伐,而不再继续购买已经落后于时代的产品。
“我们要求团队设计出一套拥有足够吸引力的平台,充分服务于市场上最出色的人才。”
Cortex平台由此诞生。Huddart将其描述为围绕公司员工所设计的智能化平台。它使用开源技术组件,同时匹配Homeprotect内部编写的某些闭源功能。
“当然,Cortex平台也反映出了技术领域的不少共同趋势。例如在消息传递方面,我们看到LinkedIn这样的大厂在使用Kafka,并意识到这可能就是目前最具竞争力的消息传递系统。我们还看到很多公司在使用Kubernetes,并决定将自己的算力也投入进去。”
集众多成果于一身的Cortex
Huddart强调,他的团队其实是“拼凑出了一套平台”,也就是Cortex。它最初只是一套精算引擎,但如今已经成为“一套在云端运行的开放平台,能够吸纳数据并帮助我们以极快的速度做出决策。”
他解释道,Cortex的功能已经不限于精算,而是应用于其他领域,甚至开始用于训练谷歌引擎。
当企业在谷歌上花钱进行数字营销时,首先需要告知谷歌自己想要吸引怎样的目标受众。Huddart表示,Cortex会向谷歌提交客户反馈,随着时间推移逐渐摸清谷歌的价值判断逻辑和分析流程。该公司开始将Google接入Cortex,从而根据之前的关系将营销支出导向最容易被吸引、最具价值空间的客户。
“Cortex提供的支出数据,在谷歌当中建立起了一份Homeprotect最有价值客户指南。”
接下来的目标,就是努力在数据输入与数据科学模型更新之间架起桥梁。索赔要求随时出现、保费需要不断调整,但以往保险公司经常需要几个月、甚至数年时间才能完成数据更新,最终导致企业面对不断变化的索赔案例时反应缓慢。但Cortex正依托于先进技术,帮助Homeprotect摆脱这一困境。
Huddart表示,“我们计划让Cortex实时监控索赔数据。在接下来的几年中,我们希望能根据传入的索赔数据以自动、近实时的方式重新训练我们的所有数据模型。”
好文章,需要你的鼓励
谷歌发布新的AI学术搜索工具Scholar Labs,旨在回答详细研究问题。该工具使用AI识别查询中的主要话题和关系,目前仅对部分登录用户开放。与传统学术搜索不同,Scholar Labs不依赖引用次数或期刊影响因子等传统指标来筛选研究质量,而是通过分析文档全文、发表位置、作者信息及引用频次来排序。科学界对这种忽略传统质量评估方式的新方法持谨慎态度,认为研究者仍需保持对文献质量的最终判断权。
Meta公司FAIR实验室与UCLA合作开发了名为HoneyBee的超大规模视觉推理数据集,包含250万训练样本。研究揭示了构建高质量AI视觉推理训练数据的系统方法,发现数据质量比数量更重要,最佳数据源比最差数据源性能提升11.4%。关键创新包括"图片说明书"技术和文字-图片混合训练法,分别提升3.3%和7.5%准确率。HoneyBee训练的AI在多项测试中显著超越同规模模型,同时降低73%推理成本。
Meta发布第三代SAM(分割一切模型)系列AI模型,专注于视觉智能而非语言处理。该模型擅长物体检测,能够精确识别图像和视频中的特定对象。SAM 3在海量图像视频数据集上训练,可通过点击或文本描述准确标识目标物体。Meta将其应用于Instagram编辑工具和Facebook市场功能改进。在野生动物保护方面,SAM 3与保护组织合作分析超万台摄像头捕获的动物视频,成功识别百余种物种,为生态研究提供重要技术支持。
上海AI实验室团队提出ViCO训练策略,让多模态大语言模型能够根据图像语义复杂度智能分配计算资源。通过两阶段训练和视觉路由器,该方法在压缩50%视觉词汇的同时保持99.6%性能,推理速度提升近一倍,为AI效率优化提供了新思路。