至顶网CIO与应用频道 07月26日 北京消息(文/王聪彬):每年AWS技术峰会都会吸引大量的技术粉丝,他们最希望听到的是AWS有更多服务可以落地中国。北京光环新网科技股份有限公司总裁杨宇航谈到了为AWS进行本地化改造,以及构建运营服务体系。
北京光环新网科技股份有限公司总裁杨宇航
基础设施团队:负责AWS北京区域基础设施的运营管理,提供专线、专网及各类网络服务;
市场营销服务团队:全面负责AWS北京区域面向中国的市场销售和客户服务、将逐步建立覆盖全国的销售服务体系;
技术服务团队:为用户和合作伙伴提供基于AWS的云计算增值服务,技术咨询、系统设计及迁移、混合云构建、运营管理服务;
目前光环新网在北京已经拥有6个数据中心,完善基础设施布局,更好的满足客户需求。而AWS也在中国快速成长,亚马逊AWS全球副总裁,大中华区执行董事容永康指出,AWS在全球增长最迅速的亿级IT企业,也将为中国客户带来更新型的用户体验。
亚马逊AWS全球副总裁,大中华区执行董事容永康
AWS是一个拥有深度功能、广泛服务的基础设施平台,众多功能主要包括计算、数据库、安全性和访问权限、网络可用性几个方面。亚马逊公司首席技术官沃纳•威格尔说,AWS就像把手放在客户的脉搏上一样,我们会最快速度的响应客户的需求。
亚马逊公司首席技术官沃纳•威格尔
在2016年年底,AWS又将九个实例进行了7大升级,包括EC2 T2、M4、D2、R3、X1,I2、C4、G2、P2,同时还新增了虚拟机服务器VPS服务Lightsail和FPGAs硬件加速的F1。安全、性能、可靠性、成本控制是AWS可以给予企业用户的保障。
现在人工智能这么火,但企业完全不用再做低层次的AI开发,利用AWS的服务可以快速的将功能集成到自己的产品或服务中。
Amazon Rekognition深度学习图像分析服务,通过API连接相机就可以识别图像内容,以及脸部识别;
Amazon Polly可以将文本转换为语音,采用了深度学习技术。一旦提交了文本流,Polly就会输出mp3音频流。目前支持24种语言,47种声音的转换;
Amazon LEX提供由深度学习实现的理解自然语言和自动语音识别,通过使用语音、文本将对话式界面构建到任何应用程序中;
沃纳•威格尔认为,语音是最自然的人机交互方式,不要受数字化系统的局限。Echo音箱就是一个很好的例子,其就使用了Amazon LEX技术。
每年都会有用户来为AWS站台,今年明显变化是来了三个本地客户,而且是传统行业,他们来自宁夏大学、飞利浦、玫琳凯。
宁夏大学
宁夏大学建于1958年,目前在校生22000+,教职工2600+,是宁夏唯一的211高校。2015年7月,成立宁夏大学亚马逊云计算学院。并且加入了7门云计算大数据课程。
宁夏大学校长何建国表示,宁夏大学一直在思考如何让教与学更加对称,宁夏大学亚马逊云计算学院的成立看到了实现的可能,而且云计算是一个强大的基础,通过6个月建设了云端大学服务教学、科研,实现数据驱动的教学、科研和管理。
飞利浦
飞利浦希望通过有意义的创新,改善亿万人的生活。所以飞利浦将提供更好的医疗保障和医疗关护,创新的解决方案为消费者和医护人员提供支持。
飞利浦大中华区副总裁兼首席信息官表示,我们致力于健康的生活方式、预防、诊断、治疗、家庭护理五大战略重点,基于AWS建立数字健康平台实现物联网、数据分析、个人医疗数据、全程关护。
玫琳凯
玫琳凯是一家美资直销化妆品企业,1995年进入中国。玫琳凯已经100%通过在线渠道进行下单,日均订单超过10万张。
玫琳凯(中国)信息技术副总裁杜思远表示,目前核心系统大数据分析平台,以及电子商务系统、移动系统已经搭载在AWS上,可以实现全程无人干预,快速响应业务的高峰。
好文章,需要你的鼓励
这项研究由浙江大学、复旦大学等机构联合完成,提出了ReVisual-R1模型,通过创新的三阶段训练方法显著提升了多模态大语言模型的推理能力。研究发现优化的纯文本冷启动训练、解决强化学习中的梯度停滞问题、以及分阶段训练策略是关键因素。ReVisual-R1在各类推理基准测试中超越了现有开源模型,甚至在某些任务上超过了商业模型,为多模态推理研究开辟了新途径。
这项研究提出了一种名为"批评式微调"的创新方法,证明仅使用一个问题的批评数据就能显著提升大语言模型的推理能力。研究团队对Qwen和Llama系列模型进行实验,发现这种方法在数学和逻辑推理任务上都取得了显著提升,平均提高15-16个百分点,而且只需要强化学习方法1/20的计算资源。这种简单高效的方法为释放预训练模型的潜在推理能力提供了新途径。
新加坡国立大学研究团队开发了名为IEAP的图像编辑框架,它通过将复杂编辑指令分解为简单原子操作序列解决了当前AI图像编辑的核心难题。研究发现当前模型在处理不改变图像布局的简单编辑时表现出色,但在需要改变图像结构时效果差。IEAP框架定义了五种基本操作,并利用思维链推理技术智能分解用户指令,实验证明其性能显著超越现有方法,尤其在处理复杂多步骤编辑时。
Character AI的研究者开发出TalkingMachines系统,通过自回归扩散模型实现实时音频驱动视频生成。研究将预训练视频模型转变为能进行FaceTime风格对话的虚拟形象系统。核心创新包括:将18B参数的图像到视频DiT模型改造为音频驱动系统、通过蒸馏实现无错误累积的无限长视频生成、优化工程设计降低延迟。系统可让多种风格的虚拟角色与人进行自然对话,嘴型与语音同步,为实时数字人交互技术开辟了新可能。