ZD至顶网CIO与应用频道 02月16日 人物访谈(文/王聪彬):互联网从诞生那一天起的愿景就是让世界可以不再受地域限制,这也带动了跨境生意越来越红火。目前跨境电商已经成为我国整体贸易中的重要组成部分,其中B2B已占七成以上。
跨境就意味着要服务大量海外用户,我们知道中国的网络就相当复杂,在中国之外网络就更加不可控。所以客户体验也成为跨境B2B电子商务的首要问题,而CDN(内容分发网络)是一个破解之法,在网络加速、提升用户体验的同时,还对电商企业具有一定的网络安全防护。
跨境B2B电商潜力巨大
CNNIC发布2016年第38次中国互联网络发展状况统计报告中显示,截至2016年6月,中国网民规模达7.10亿,半年共计新增网民2132万人。互联网普及率为51.7%,较2015年底提升了1.3个百分点。
借助互联网可以创新出各种各样的商业模式,电子商务是互联网早期最为常见的形式。数据显示2016年上半年,中国电子商务交易额达10.5万亿元,同比增长37.6%,增幅上升7.2个百分点。其中B2B市场交易规模达7.9万亿元,网络零售市场交易规模2.3万亿元。
虽然大众网购的普及率很高,消费能力也不容小觑,但B2B交易还是占据了其中很大的市场份额。
尤其同消费者端火热的海淘一样,跨境B2B也在中国迅速兴起,以东部、南部地区最为明显,广东、浙江和福建三省在跨境电商规模指数中位列前三,订单数和交易额占比均超过90%以上的市场份额。
B2B电子商务从贸易出口国角度来看,目前以美国、加拿大及西班牙、澳大利亚及新西兰等为代表的发达国家,均以超过40%的年增速成为我国主要的贸易伙伴和出口国。在发展中国家中,东盟地区作为“一带一路”的重要组成部分,市场潜力巨大。
业务挑战就是网络挑战
成立于2004年的敦煌网就是中国一家B2B跨境电子商务平台,致力于帮助中国中小企业通过电子商务平台走向全球市场。敦煌网已经实现120多万国内供应商在线、3000多万种商品,遍布全球224个国家和地区以及1000万买家在线购买的规模。每小时有10万买家实时在线采购,每3秒产生一张订单!
从2004年1.0版系统上线,2008年升级到2.0版本,再到2012年更加优化的3.0版本,敦煌网经历了三次系统升级。其定位是从各个角度进行优化,像服务化拆分、分布式架构等。
尤其在底层技术架构上进行了提升和完善,比如外围CDN优化、网络加速、网络安全等性能。
这些都是敦煌网运维总监刘文涛的主要工作,因为敦煌网是面向全球用户的跨境生意,在网络速度上是一个巨大的挑战。他说因为受到网络基础设施等因素的影响,全球互联网的发展并不均衡,像南美、东南亚等地区网络环境发展并没有那么迅速,这也直接影响了我们的服务体验。
敦煌网运维总监刘文涛
电子商务网站是有海量的商品信息、图片、网站样式等静态资源组成,海外网络环境的好坏将直接影响网站的加载速度。另外再支付功能上还需要通过全球数据安全标准认证,并在网络安全传输上进行加密传输,保证了客户隐私不被第三方劫持。所以海外CDN的使用是一个保证业务体验的关键。
CDN打通用户的最后一公里
由于跨境电子商务的特性,海外CDN是一个必然选择。刘文涛在选择CDN时主要看中三方面,第一、带宽,边缘服务器承载流量能否满足促销时的访问量;第二、对于多种协议的支持,尤其是HTTPS加密协议;第三、成本,互联网公司在CDN上都有很大的支出,所以需要严格的预算控制。
Akamai是敦煌网海外CDN的选择,全球20多万台服务器,30TB带宽可以很好地承载不同网络环境和终端适配,用户可以就近访问Akamai的节点得到优质体验。同时在风险控制上Akamai可以对HTTPS加密进行优化,在网络安全上得以保证,契合了业务特性和成本需求。
当然互联网公司业务为了覆盖全球更多区域,也会使用多家CDN服务。
CDN技术本身并不太复杂,刘文涛认为,未来CDN会慢慢云化,因为企业越来越多的在使用云服务,甚至将DNS进行托管,所以云CDN的使用也就顺理成章,根据用户的需求轻松快速的扩容。
海外买家是CDN使用的最终受益方,敦煌网每小时有10万个买家在同时采购,为了提供遍布全球买家无缝的服务体验,CDN打通了用户的最后一公里。
好文章,需要你的鼓励
这项研究提出了ORV(占用中心机器人视频生成)框架,利用4D语义占用作为中间表示来生成高质量的机器人操作视频。与传统方法相比,ORV能提供更精确的语义和几何指导,实现更高的时间一致性和控制精度。该框架还支持多视角视频生成(ORV-MV)和模拟到真实的转换(ORV-S2R),有效弥合了虚拟与现实之间的差距。实验结果表明,ORV在多个数据集上的表现始终优于现有方法,为机器人学习和模拟提供了强大工具。
这项研究由Writer公司团队开发的"反思、重试、奖励"机制,通过强化学习教导大型语言模型生成更有效的自我反思内容。当模型回答错误时,它会生成反思并二次尝试,若成功则奖励反思过程。实验表明,该方法在函数调用和数学方程解题上带来显著提升,最高分别改善18.1%和34.7%。令人惊讶的是,经训练的小模型甚至超越了同家族10倍大的模型,且几乎不存在灾难性遗忘问题。这种自我改进技术为资源受限环境下的AI应用开辟了新方向。
FuseLIP是一项突破性研究,提出了通过早期融合离散标记实现多模态嵌入的新方法。与传统CLIP模型使用独立编码器不同,FuseLIP采用单一编码器同时处理图像和文本标记,实现了更自然的模态交互。研究证明,这种早期融合方法在多种多模态任务上表现优异,特别是在需要理解图像结构而非仅语义内容的任务上。研究还开发了创新的数据集和评估任务,为多模态嵌入研究提供了宝贵资源。
ByteDance与浙江大学合作开发的MERIT是首个专为多语言多条件语义检索设计的基准数据集,包含320,000条跨5种语言的查询和135,000个产品。研究发现现有模型在处理多条件查询时过度关注全局语义而忽略特定条件元素,为此提出CORAL框架,通过嵌入重建和对比学习相结合的方式,使检索性能提升45.9%。这项研究不仅识别了现有方法的关键局限性,还为多条件交错语义检索领域的未来研究奠定了基础。