8月31日,由中国电子质量管理协会及中国用户体验联盟指导、北京卓思天成数据咨询股份有限公司与《中国汽车市场》杂志联合发布“2024中国汽车行业客户体验指数(CXI)先导报告”。报告指出,客户的产品和销售服务体验较好,售后服务体验普遍较差;从行业趋势看,新能源汽车品牌的总体CXI已全面领先。
据介绍,“中国汽车行业客户体验指数(CXI)”以NPS为基础研究方法,总体CXI=产品CXI(50%)+销售CXI(25%)+售后CXI(25%),其指标体系以客户体验层次概念模型为基础,包括11个要素、57个场景、236个体验点。
“2024中国汽车行业客户体验指数(CXI)先导报告”的有效样本来自于探店工具类体验分享平台“探店宝”APP上超过4,000个真实探店样本,以及卓思客户体验语料库中的35万条真实有效语料,这些样本覆盖40个城市和60个汽车品牌,每个真实探店过程的采样时长均超过20分钟。对于回收的文本数据,卓思基于调研指标体系及客户反馈语料构建统一码框,并使用NLP语义分析系统进行编码统计,同步进行人工校准,最终实现客户反馈的精准识别与分析。
1、从整体来看,产品和销售服务体验较好,售后服务体验普遍较差。
在燃油车领域,部分自主品牌的产品、销售服务和售后服务表现已经超越豪华品牌。
在新能源汽车领域,以特斯拉、问界为代表的新势力品牌体验明显优于传统汽车厂商。
2、从行业趋势来看,新能源汽车品牌的整体体验已全面领先。
从总体CXI看,新能源阵营(49.4分)已经成为当前汽车品牌中的体验最佳,CXI总分TOP5中燃油车品牌仅占据一席且位居第五;燃油车阵营中豪华品牌(47.8分)相比合资(41.1分)与自主品牌(39.2分)仍保有较大的体验优势,合资与自主品牌的整体体验水平已经极为接近。
从产品CXI看,新能源品牌(63.6分)已处于明显领先地位,燃油车品牌的最高分仅能排到新能源阵营的第七名;燃油车阵营中豪华品牌(55.1分)的产品体验相比合资(53.7分)与自主品牌(53.0分)虽有优势但已差距不大,自主品牌的产品体验与合资品牌基本拉平。
从销售服务CXI看,豪华品牌(51.0分)依然处于行业领先地位,新能源品牌(50.4分)的销售服务体验已经十分接近豪华品牌,自主品牌(34.3分)的销售服务体验与其他品牌相比仍有较大差距。
从售后服务CXI看,豪华品牌(30.0分)处于明显领先地位;新能源品牌(19.8分)的售后服务体验已经超越合资品牌(18.1分),但显著落后于豪华品牌;自主品牌(16.4分)的售后服务体验与其他品牌相比仍有一定差距。
3、燃油车和新能源汽车的客户体验差异化驱动力分析。
报告研究发现,导致燃油车品牌CXI差异的主要原因在5个方面:配置、油耗、发动机质量、性价比和整车质量。CXI得分越高的品牌,在这5个方面表现越好,反之越差。燃油车通过增强配置、降低油耗、保证质量和性价比,是提高CXI表现的重要途径。
导致新能源汽车品牌CXI差异的主要原因是智能化、试乘试驾和自动/辅助驾驶。CXI得分越高的品牌,在智能化、试乘试驾和自动/辅助驾驶上越领先。在新能源赛道,提高整车智能化水平、开展灵活试驾模式、提供高阶自动驾驶功能,是提高CXI表现的关键。
据悉,“中国汽车行业客户体验指数(CXI)报告”将持续发布,力求准确、客观地反映汽车行业客户体验管理现状和发展趋势,共同探讨提升客户体验的破局之道,助力汽车行业的创新和高质量发展。
关于卓思
北京卓思天成数据咨询股份有限公司(简称“卓思”)成立于2010年,致力于以消费者洞察能力结合认知智能技术,挖掘客户体验价值,为企业提供全渠道客户之声实时监测分析、PaaS平台支撑的体验数字化解决方案、从体验设计到体验运营的体验全栈管理闭环业务,覆盖汽车、金融、房地产、零售、电商、O2O等多行业解决方案。
自2016年以来,卓思在核心技术研发、智能硬件架设、SaaS/PaaS产品开发等方面持续投入,完成了具有广泛覆盖和实时反馈特性的客户体验触点网络建设。同时,卓思基于海量的客户体验数据资源、先进的NLP和认知图谱技术以及深刻的行业洞见,搭建了以认知智能技术驱动的OCEM全渠道客户之声平台(Omini Channel Experience Management Platform)及NICE体验智造平台(New Inspiring Customer Experience Platform),为企业提供全客户、全渠道的实时体验监测、分析和改善。
卓思在北京、上海、广州、武汉、张家口、石家庄、德国慕尼黑、美国波士顿等地设有分支机构,拥有近400名员工,90%以上的客户为世界500强企业。
关于《中国汽车市场》杂志
《中国汽车市场》杂志创刊于1985年,是中国汽车行业早期的专业期刊之一,目前已经发展成为全媒体矩阵。
中国汽车市场全媒体通过行业观察、深度评论等方式,研究并解读中国汽车行业政策法规、重要事件,探索行业发展方向。通过整合行业专家资源,汇聚行业智慧,引领产业向上。通过举办中国汽车金扳手奖评选等专业评选,中国汽车市场全媒体构建行业评价体系,见证新时代中国汽车产业及企业的转型升级与创新,助推中国汽车产业整体向上和高质量发展。
好文章,需要你的鼓励
DeepResearchGym是一个创新的开源评估框架,专为深度研究系统设计,旨在解决当前依赖商业搜索API带来的透明度和可重复性挑战。该系统由卡内基梅隆大学研究团队开发,结合了基于ClueWeb22和FineWeb大型网络语料库的可重复搜索API与严格的评估协议。实验表明,使用DeepResearchGym的系统性能与使用商业API相当,且在评估指标间保持一致性。人类评估进一步证实了自动评估协议与人类偏好的一致性,验证了该框架评估深度研究系统的有效性。
这项研究介绍了FinTagging,首个面向大型语言模型的全面财务信息提取与结构化基准测试。不同于传统方法,它将XBRL标记分解为数值识别和概念链接两个子任务,能同时处理文本和表格数据。在零样本测试中,DeepSeek-V3和GPT-4o表现最佳,但在细粒度概念对齐方面仍面临挑战,揭示了当前大语言模型在自动化XBRL标记领域的局限性,为金融AI发展提供了新方向。
这项研究介绍了SweEval,一个新型基准测试,用于评估大型语言模型在企业环境中处理脏话的能力。研究团队从Oracle AI等多家机构的专家创建了一个包含八种语言的测试集,模拟不同语调和上下文的真实场景。实验结果显示,LLM在英语中较少使用脏话,但在印地语等低资源语言中更易受影响。研究还发现较大模型通常表现更好,且多语言模型如Llama系列在处理不当提示方面优于其他模型。这项工作对企业采用AI技术时的安全考量提供了重要参考。
这项研究提出了"VeriFree"——一种不需要验证器的方法,可以增强大型语言模型(LLM)的通用推理能力。传统方法如DeepSeek-R1-Zero需要验证答案正确性,限制了其在数学和编程以外领域的应用。VeriFree巧妙地计算正确答案在模型生成的推理过程后出现的概率,作为评估和训练信号。实验表明,这种方法不仅能匹配甚至超越基于验证器的方法,还大幅降低了计算资源需求,同时消除了"奖励黑客"问题。这一突破将有助于开发出在化学、医疗、法律等广泛领域具有更强推理能力的AI系统。