ZD至顶网CIO与应用频道 08月09日 人物访谈(文/孙博): 电梯停在十六楼,一眼望去整层都是本次采访公司的办公区域。走进其中,公司整体装修风格采用了多种明亮的颜色。茶水间、开放办公区、敏捷开发区、培训区,办公室也有着十分清晰的功能布局,每个小细节都别有用心。采访那天,云栖科技给我的第一印象是一家不呆板的技术公司 ,这也让我对接下来的采访产生了兴趣。
和很多工作时间不长的创业者不同,作为云栖科技的创始人和CTO,樊世祥在四年前回国创业的时候,已经在北美从事了十五年的IT工作了。如果真有一类人是属于有情怀的创业者,那么樊世祥应该是其中的一员,他不仅希望成功开创一番事业,还希望用一种“很理想”的方式开创这番事业。
不仅要创业,还要用正确的方式创业
为了践行这种“理想”,云栖内部用了很多严谨和前沿的理念。比如为了保障软件产品上的技术先进性,云栖科技非常注重软件架构的设计——能否支撑硬件、运维是否简易、系统的可扩展性、对象存储的容灾备份、安全策略、权限管控、和其他业务系统的对接等等。再比如在开发模式方面,他希望使用RAD模型(Rapid Application Develop,一种用软件来开发软件的快速开发理念),实现迅速建模,然后扩展开来,制作云栖的软件产品体系。
说到RAD模型,樊世祥还给记者讲了一个小故事,“有天早晨九点钟,公司最大的股东给了我一个信封,里面写了一个开发需求。他说为了了解RAD模型的厉害,决定让我们做一个有关体育赛事打赌的网站。结果在晚上八点钟我们就告诉他网站上线了。股东知道了这个模型的厉害之处,主动奖励了RAD开发团队1万美元的奖金。”
云栖科技CTO 樊世祥
除了从国外带回了技术模型,樊世祥还带回来了一些管理理念。云栖现在使用的组织架构,是一种称之为“合弄制”(Holacracy)的方式。作为硅谷创新型企业的一个管理潮流,“合弄制”的核心是通过弱化企业中的等级制度,分散CEO的权利,让职责与权力更透明、运作更高效、反应更敏捷、也最大程度挖掘员工的创新能力。
切入企业文档云是想解决移动互联时代给企业办公带来的挑战
云栖科技选择的创业方向,是基于文档管理的企业级文档云计算和云存储。当谈到为什么会涉足这一市场,樊世祥告诉记者,几年前在他们创业之初的时候,人们用手机进行办公的趋势已经很普遍了,这就意味着从不同设备间同步文档这样的需求一定会增长。再加上企业中产生的商务文档数量和增速都是前所未有的,而移动终端设备却无法存储海量的信息,此外其安全性也难以保障,所以在他看来这是一个需求很确定的市场。樊世祥说,”有价值的事情就一定有前途。”
与传统企业存储不同的是,云栖科技主要提供的是私有云存储服务——将企业自己的底层硬件通过云栖科技的技术手段,转化成文档云平台。此外,企业也可以用购买一体机的方式,直接安装在自己的机柜里,实现快速化部署。相比个人网盘服务,企业云盘更突出了企业级的特点:安全性高、存储量大、传输速度快,注重与企业现有系统的对接。
近期,云栖科技又推出了“文档云”,利用这个通用平台及其工具,可以制作符合企业特性的基于文档和通讯的企业应用,面对不同行业,衍生出更具针对性的解决方案。为国家档案局部署的档案管理系统就是一个例子,采用最新的第三代档案系统、基于云栖科技底层技术和文档云平台、利用数字化的手段,从收集、归档、管理、保存等方面保存国家档案局的“记忆”,避免价值资料的流失 。
据了解,云栖科技现已被中国档案学会定为档案类软件定点企业。同时,云栖科技的档案系统也被北京联合大学档案专业指定为教学和实习专属软件产品。 除此之外,目前云栖科技也已经推出了档案云、云客服、EMM,以及正在研发的云栖消息等面向不同场景的云服务。
做企业级市场,需要技术功底过硬
相比传统意义上的一般存储服务,云存储由于用户规模大、服务范围广、网络环境复杂,因此实现一个可以随时通过移动访问的高可用云存储服务,尤其是企业级云存储服务,在技术上也是一个不小的挑战。
采访过程中,云栖科技的底层技术多次被提及。樊世祥告诉记者,他们投入了相当多精力在底层对象存储以及介于底层存储和上层应用之间的EFSS技术(文件同步与共享)上,解决了跨不同数据中心、企业、部门、小组以及个人设备之间的数据的分享、同步等问题,而这也正是传统IT覆盖不到的方面。
对于企业级用户而言,文档作为一种重要数据,安全的重要性不言而喻。云栖科技使用了自己的一套文档切片和文件保险柜技术。当商务文档在上传和存储过程中,所传输的信息可以确保不被未经授权的第三方看到,紧接着数据要经过两层切片处理后再被保存。
截止到目前,除了上文提到关于安全的文档切片和底层的对象存储两个技术以外,云栖科技还在流量控制、元数据处理、传输加速以及智能路由等相关领域,共申请了9项技术专利。“就好比制造汽车,我们想先将汽车的引擎建好,产品才能更结实。”樊世祥感叹,企业在选型时通常会关注系统功能的多少,而背后的技术架构则往往被忽略。
和四年前相比,企业服务领域的创业公司数量增加了很多,面向云存储这个细分领域的公司也不少。不过樊世祥并没有过多的担心竞争问题,“云存储是一个很大的领域,现在没有一个云存储产品可以囊括所有功能。”樊世祥说。
好文章,需要你的鼓励
zip2zip是一项创新技术,通过引入动态自适应词汇表,让大语言模型在推理时能够自动组合常用词组,显著提高处理效率。由EPFL等机构研究团队开发的这一方法,基于LZW压缩算法,允许模型即时创建和使用"超级tokens",将输入和输出序列长度减少20-60%,大幅提升推理速度。实验表明,现有模型只需10个GPU小时的微调即可适配此框架,在保持基本性能的同时显著降低计算成本和响应时间,特别适用于专业领域和多语言场景。
这项研究创新性地利用大语言模型(LLM)代替人类标注者,创建了PARADEHATE数据集,用于仇恨言论的无毒化转换。研究团队首先验证LLM在无毒化任务中表现可与人类媲美,随后构建了包含8000多对仇恨/非仇恨文本的平行数据集。评估显示,在PARADEHATE上微调的模型如BART在风格准确性、内容保留和流畅性方面表现优异,证明LLM生成的数据可作为人工标注的高效替代方案,为创建更安全、更具包容性的在线环境提供了新途径。
这项研究由中国科学技术大学的研究团队提出了Pro3D-Editor,一种新型3D编辑框架,通过"渐进式视角"范式解决了现有3D编辑方法中的视角不一致问题。传统方法要么随机选择视角迭代编辑,要么同时编辑多个固定视角,都忽视了不同编辑任务对应不同的"编辑显著性视角"。Pro3D-Editor包含三个核心模块:主视角采样器自动选择最适合编辑的视角,关键视角渲染器通过创新的MoVE-LoRA技术将编辑信息传递到其他视角,全视角精修器修复并优化最终3D模型。实验证明该方法在编辑质量和准确性方面显著优于现有技术。
这项研究提出了ComposeAnything,一个无需重新训练的框架,可显著提升AI图像生成模型处理复杂空间关系的能力。该技术由INRIA、巴黎高师和CNRS的研究团队开发,通过三个创新步骤工作:首先利用大型语言模型创建包含深度信息的2.5D语义布局,然后生成粗略的场景合成图作为先验指导,最后通过物体先验强化和空间控制去噪引导扩散过程。在T2I-CompBench和NSR-1K基准测试中,该方法远超现有技术,特别是在处理复杂空间关系和多物体场景时表现卓越,为AI辅助创意设计开辟新可能。