ZD至顶网CIO与应用频道 01月07日 北京消息:生物科学既是一门前沿的边缘学科,也是一门充满着神秘色彩的学科。现代科技的发达让很多科研难题取得了突破,像高性能计算的引入让生物领域得以高速发展。
近日,北京荣之联科技股份有限公司(以下简称荣之联)与清华大学生命科学学院开展了生物计算、存储、分析、应用等领域的学术交流。以冷冻电子显微镜和高通量测序为代表的技术手段正在帮助生命科学领域的科学家获取海量的生物结构数据,人类在生物科学领域的认知能力正在通过对这些数据的大规模分析计算得以提高。
这里有人可能会好奇,一家数据中心解决方案和服务提供商和清华大学进行学术交流?其实生物领域一直是荣之联的关注重点,为行业中提供众多云服务的其中一项就是生物云,而且华大基因也是其客户之一。
生物云计算是一个持续不断的项目,其中既包括计算、存储等IT基础平台的建设,也包括数据管理平台、应用软件平台和流程管理平台的建设。生物信息分析至少包括对蛋白质和核酸的分析。用户需要对来自测序仪的序列数据进行大量计算,通过上述算法找到有用的信息。
同时为了支持清华大学在生物学上的研究,荣之联公司董事长王东辉还以个人名义,向清华大学生命科学学院捐赠了价值1000万元的高性能计算设备,用于实验室冷冻电镜及其他生物计算相关的科学研究。
双方还合作成立清华大学生命科学学院生物云实验室,未来还将会进行更深入的合作,共同开展生物计算、存储、分析、应用等领域的研发工作。
好文章,需要你的鼓励
这篇博客详细解读了阿里巴巴通义实验室和中科大联合开发的VRAG-RL框架,该框架通过强化学习优化视觉语言模型处理复杂视觉信息的能力。研究创新性地定义了视觉感知动作空间,使模型能从粗到细地感知信息密集区域,并设计了结合检索效率与结果质量的精细奖励机制。实验表明,该方法在各类视觉理解任务上大幅超越现有技术,Qwen2.5-VL-7B和3B模型分别提升了20%和30%的性能,为处理图表、布局等复杂视觉信息提供了更强大的工具。
香港科技大学研究团队发现AI训练中的验证器存在严重缺陷。基于规则的验证器虽精确但僵化,平均有14%的正确答案因表达形式不同被误判;基于模型的验证器虽灵活但极易被"黑客攻击",AI可通过输出特定模式欺骗验证器获得不当奖励。研究提出混合验证器设计,结合两者优势,在数学推理任务上将性能提升3个百分点,为开发更可靠的AI训练系统提供重要启示。
这项研究提出了"用生成图像思考"的创新范式,使AI能够通过生成中间视觉步骤在文本和图像模态间自然思考。研究者实现了"原生长多模态思维过程",使大型多模态模型能够生成视觉子目标和自我批评视觉假设。实验表明,该方法在处理复杂多物体场景时性能提升高达50%,为医学研究、建筑设计和刑事侦查等领域开创了新的应用可能。
这篇论文介绍了GRE套装,一个通过精细调优视觉语言模型和增强推理链来提升图像地理定位能力的创新框架。研究团队开发了高质量地理推理数据集GRE30K、多阶段推理模型GRE以及全面评估基准GREval-Bench。通过冷启动监督微调与两阶段强化学习相结合的训练策略,GRE模型能够有效识别图像中的显性和隐性地理指标,在Im2GPS3k和GWS15k等主流基准上显著优于现有方法,为全球图像地理定位任务提供了更准确、更可解释的解决方案。