“我们计划在长江三角洲地区(靠近上海)建造两个工厂,我们已经开始施工,”普渡科技创始人兼CEO张涛在深圳公司总部接受采访时表示。这两个工地的工作将在2024年至2025年之间完成,普渡的年产能将增加两倍。
自2016年成立至今,普渡已经发展成为一家独角兽企业,在2022年实现了约1亿美元的收入,客户包括中国火锅连锁店海底捞,以及欧洲的汉堡王和肯德基。在日本,普渡通过2022年底向餐厅运营商斯凯拉克控股交付了3000台机器人。它们服务于大约2100个地点。
普渡在中国东莞市的现有工厂年产能约为5万台,两个新工厂将使总产能达到约15万台。普渡通过从已投入使用的机器人获取大数据来不断提高机器人的运动精度。张涛表示,公司目前没有考虑在海外建厂。
海外需求是增加产能的主要原因。截至8月底,普渡累计交付了约7万台机器人,其中包括酒店客房服务机器人。自今年2月以来,普渡已交付的机器人超过1万台,海外客户占销售额的约80%。
普渡已经向日本交付了约7500台机器人,并被认为在机器人服务员市场占据了最高市场份额。韩国和美国也下了很多订单。普渡在德国、加拿大、阿拉伯联合酋长国和沙特阿拉伯等市场销售机器人。
普渡在日本、美国、新加坡和荷兰设有分支机构,并正准备在韩国建立一个新的单位。在总交付量方面,普渡没有给自己预设上限。“但我预计在未来几年内将超过10万台,”张涛表示,“我们是中国海外销售量最大的机器人服务员公司,很可能在未来能够保持这个位置,”他说。
这家初创企业除了酒店机器人外,还销售清洁机器人。根据中国研究公司AskCI的数据,全球服务机器人市场今年将增长33%,达到337亿美元。仅中国国内市场预计将增长36%,达到103亿美元。
中国机器人产业联盟执行董事长兼秘书长宋晓刚表示:“由于人口老龄化和劳动力短缺,对机器人的需求将增长。”在这个增长市场上争夺份额的竞争非常激烈。总部位于上海的科沃斯机器人在中国市场表现强劲,并准备加大海外扩张。
科沃斯在2022年底之前销售了大约3.5万台机器人,其中近1万台越过了国境。该公司计划到2025年底将累计销售量增加两到五倍。根据IDC的数据,科沃斯在2022年的中国餐厅机器人市场占有60.4%的份额,普渡以23.2%的份额位居第二。
在日本,软银机器人销售由一家美国初创公司制造的Servi机器人服务员。东京的创业公司Connected Robotics和TechMagic开发了烹饪机器人。但是,日本制造商在机器人服务员市场上一直难以获得市场份额,商品化使得开发者难以脱颖而出。
东京咨询公司QBIT Robotics的首席执行官中野浩也认为,普渡的机器人并没有压倒性的优势。“与科沃斯、Servi和类似产品相比,在服务能力上并没有很大的区别,”中野说,并补充说普渡的机器人“之所以销售得好,是因为斯凯拉克控股等知名公司使用它们给人一种安心感”。
2022年,普渡进行了张涛所称的“战略调整”,缩减了员工人数。公司没有公开解雇了多少员工,但目前员工人数约为500人。“业务已经恢复正常,我们正在盈利,”张涛表示,并保证不再计划裁员。
扩大销售将需要增加员工和资本支出。为实现可持续增长,筹集资金的方式,如上市,将是下一个挑战。“目前还没有计划上市,但我们保持这个选择的可能性,”张涛说。
好文章,需要你的鼓励
新加坡国立大学研究人员开发出名为AiSee的可穿戴辅助设备,利用Meta的Llama模型帮助视障人士"看见"周围世界。该设备采用耳机形态,配备摄像头作为AI伴侣处理视觉信息。通过集成大语言模型,设备从简单物体识别升级为对话助手,用户可进行追问。设备运行代理AI框架,使用量化技术将Llama模型压缩至10-30亿参数在安卓设备上高效运行,支持离线处理敏感文档,保护用户隐私。
阿里达摩院联合浙江大学推出VideoRefer套件,这是首个能够精确理解视频中特定物体的AI系统。该系统不仅能识别整体场景,更能针对用户指定的任何物体进行详细分析和跨时间追踪。研究团队构建了包含70万样本的高质量数据集VideoRefer-700K,并设计了全面的评估体系VideoRefer-Bench。实验显示该技术在专业视频理解任务中显著超越现有方法,在安防监控、自动驾驶、视频编辑等领域具有广阔应用前景。
OpenAI推出新AI模型GPT-5-Codex,能够在无用户协助下完成数小时的编程任务。该模型是GPT-5的改进版本,使用额外编码数据训练。测试显示,GPT-5-Codex可独立工作超过7小时,能自动发现并修复编码错误。在重构基准测试中得分51.3%,比GPT高出17%以上。模型可根据任务难度调整处理时间,简单请求处理速度显著提升。目前已在ChatGPT付费计划中提供。
Sa2VA是由UC默塞德等高校联合开发的突破性AI系统,首次实现图像视频的统一理解与精确分割。通过巧妙融合SAM-2视频分割技术和LLaVA多模态对话能力,Sa2VA能够同时进行自然对话和像素级物体标注。研究团队还构建了包含7万多个复杂视频表达式的Ref-SAV数据集,显著提升了AI在长文本描述和复杂场景下的表现。实验显示,Sa2VA在多个基准测试中达到业界领先水平,为视频编辑、医疗诊断、智能监控等领域带来新的应用可能性。