至顶网CIO与应用频道 06月11日 北京消息:近几年来,在国际产能合作、“一带一路”等政策推动下,以及中国企业经营能力的提升,“走出去”成为不少企业提升市场地位的战略选择。2018年,商务部录得中企的对外直接投资达到了1293.3亿美元,同比增长4.2%。在实现海外投资平稳增长的同时,如何更好地通过管控和规避风险,做好 “管理输出”,是目前中资企业普遍面临的一个发展课题。植根于企业内部,与人才计划和营商环境紧密结合的企业大学,已逐步推出并丰富不同面向的平台和课程模块,帮助企业乃至合作伙伴做好全球化战略蓄力。
全球联动 打造人才多维度能力
GE的克劳顿维尔领导力发展中心是美国第一所企业大学,发展至今,不仅起着企业自身人才培养中心的功能,更成为战略合作伙伴实现全球化战略,进行管理经验和行业知识交流的平台。今年三月份,在位于纽约的克劳顿维尔领导力发展中心举行的春季GE全球客户峰会,便是一个基于企业大学资源,服务于全球化商业环境的例子。在一周的峰会期间,来自GE全球各地市场的战略客户高管参与到一系列由GE董事长兼首席执行官、首席财务官及首席人力资源官、特邀行业专家、商学院教授等商界、学术界专家主持的主题演讲、小组讨论等活动,围绕全球化新形势下的行业趋势、战略与创新,企业文化,领导力变革,组织与人才发展、财务规划与分析、数字化转型及贸易政策等专题进行深入讨论。中国客户已连续12年参加GE全球客户峰会,来自于中国发电、航空、医疗、交通运输, 油气等各领域,且在近两年参与人数更达到总体参会人数的三分之一左右。由此可见,峰会已逐渐成为连接中国企业与全球同行、行业专家进行对话、交流、共享的桥梁。
克劳顿中国上海分部成立于2003年,是在纽约主校区以外海外最大的分校区。除了纽约主校区的全球客户峰会等年度活动,在全球各分区,克劳顿维尔领导力发展中心全年对内和对外开设适用于不同领域,以及企业不同职能部门的课程模块。比如针对GE内部员工的领导力综合开发课程体系、领导力技巧课程体系和专业职能技能课程,以及为战略客户开设的包括战略变革、组织效度、文化转型、绩效管理、领导力体系和人力资源课程项目等等。后者对于身处市场化改革不断深化的国内市场和多极化国际市场的中国企业来说,是其系统性地梳理、重审商业环境和管理机制的催化剂。
推陈出新 倾力企业人才梯队建设
随着GE全球网络的扩大和在各地市场运营的加深,克劳顿的课程日益强调全球化和本土化。目前的大多数课程,都以全球通用的准则来设计和授课,特别是领导力发展的核心课程。而在本土化方面,则是选取具有当地特色的案例融入到课程中,或是根据本土业务、合作伙伴的需求进行课程的开发和教授。比如中国上海校区,就有富于明显地域特色的企业财务、沟通技巧、项目管理等课程。针对“一带一路”的中国合作伙伴量身定制一系列涵盖领导力、项目管理、技术、项目执行、合规经营以及投融资等主题的培训课程,帮助合作伙伴提升出海的“软实力”,实现向“管理输出”的转变。除此之外,克劳顿依据航空、发电等领域的中国合作伙伴的需求进行定制化课程设计,其中最长的合作有近20年。据统计,克劳顿中国领导力发展中心年均培训战略合作伙伴500余人次,且已渗透到各个业务集团的发展中,成为GE实现全球客户串联,共享行业洞察和管理经验的独特优势。
全球化经济推动的不仅是行业的技术创新和运营模式的变革,也促使企业强化战略思维,组织文化,人才梯队建设等软实力以应对新的商业环境的要求。以企业战略和对营商环境应变力为教学导向的企业大学,正以其为受众提供持续学习和提升平台的宗旨,助力企业人才提升技能与见识,以在全球经济形势下抓住机遇、化解挑战,走赢全球化发展之路。
好文章,需要你的鼓励
DeepResearchGym是一个创新的开源评估框架,专为深度研究系统设计,旨在解决当前依赖商业搜索API带来的透明度和可重复性挑战。该系统由卡内基梅隆大学研究团队开发,结合了基于ClueWeb22和FineWeb大型网络语料库的可重复搜索API与严格的评估协议。实验表明,使用DeepResearchGym的系统性能与使用商业API相当,且在评估指标间保持一致性。人类评估进一步证实了自动评估协议与人类偏好的一致性,验证了该框架评估深度研究系统的有效性。
这项研究介绍了FinTagging,首个面向大型语言模型的全面财务信息提取与结构化基准测试。不同于传统方法,它将XBRL标记分解为数值识别和概念链接两个子任务,能同时处理文本和表格数据。在零样本测试中,DeepSeek-V3和GPT-4o表现最佳,但在细粒度概念对齐方面仍面临挑战,揭示了当前大语言模型在自动化XBRL标记领域的局限性,为金融AI发展提供了新方向。
这项研究介绍了SweEval,一个新型基准测试,用于评估大型语言模型在企业环境中处理脏话的能力。研究团队从Oracle AI等多家机构的专家创建了一个包含八种语言的测试集,模拟不同语调和上下文的真实场景。实验结果显示,LLM在英语中较少使用脏话,但在印地语等低资源语言中更易受影响。研究还发现较大模型通常表现更好,且多语言模型如Llama系列在处理不当提示方面优于其他模型。这项工作对企业采用AI技术时的安全考量提供了重要参考。
这项研究提出了"VeriFree"——一种不需要验证器的方法,可以增强大型语言模型(LLM)的通用推理能力。传统方法如DeepSeek-R1-Zero需要验证答案正确性,限制了其在数学和编程以外领域的应用。VeriFree巧妙地计算正确答案在模型生成的推理过程后出现的概率,作为评估和训练信号。实验表明,这种方法不仅能匹配甚至超越基于验证器的方法,还大幅降低了计算资源需求,同时消除了"奖励黑客"问题。这一突破将有助于开发出在化学、医疗、法律等广泛领域具有更强推理能力的AI系统。