扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
ZDNET至顶网CIO与应用频道 01月16日 人物访谈(文/丁慧茹): “我们在当年规划这个平台的时候,就想着什么技术可以解决大量的并发、海量的调阅应用带来的压力。那时候还没有出现大数据,但是我们后来采用的就是英特尔版的Hadoop技术来实现,因为在HBase的框架下检索效率可以很好的满足我们的要求。”这段话是日前记者采访上海市卫生局信息中心副主任谢维时,他提到的。
谢维提到的那个平台是已经上线的上海健康信息网(全称是基于健康档案的卫生信息化工程),关于说的时间是早在2010年。而最后的实现时间是在2012年,那年Apache Hadoop的英特尔发行版与英特尔至强的解决方案的日益成熟。上海市卫生局对这个平台的论证也经历了好几轮,最后与英特尔、集成商万达一拍即合,最后大数据为这个项目做了很好的嫁衣。
上海市卫生局信息中心副主任谢维
上海卫生信息互联互通形成“1+19”框架
早在2013年10月底的时候,上海健康信息网正式上线,平台上囊括了上海500家公立医院的健康档案和电子病历信息,实现了这些信息的互联互通和共享。同时,也对所有医生工作站上部署了后台监管,以监管和智能提示医生开药中可能存在的不当或过量行为。
其实关于卫生信息互联互通、共享,从国家政策在医院十二五规划中有着很重要的说明,也是各地医院信息化建设的参考。
谢维告诉记者,整个上海市的卫生信息化建设在最开始也是大家比较熟悉的,分“点”状和“条”状来进行。“点”上的相关系统建设是指医院内部的信息系统,诸如HIS(医院信息系统)、RIS(放射信息系统)等;而“条”上信息系统主要横穿所有相关医疗机构的信息系统,诸如肿瘤报告系统、糖尿病管理系统等。
而经历了点、条两个维度的建设之后,上海就开始斯洛区域卫生信息化建设的下一步了,而这个计划是在国家政策出台十二五规划之前。
关于起点,谢维说得追溯到2003年出现的SARS期间。“SARS期间,因为信息不对称、信息滞后、信息缺位等使当时的防御应急工作产生了很大的被动。”因此,在那之后。上海市启动了覆盖全市的“9870”工程,也就是发生公共卫生事件应急信息系统的建设。
“9870”工程的完成给之后的区域信息共享提供了很好的基础。
据介绍,上海的区域卫生信息化的深化是从医联体开始的。也就是以医联网为代表的上海市所有的三级甲等医院基于电子病历的互联互通。
在医联体的基础上,上海市进行了第二阶段的建设,也就是刚上线的上海健康信息网。
谢维说现在基本形成了“1+19”的框架:“1”是指上海市的主中心,“19”是指17个区中心+1个医疗医联体+1个公共卫生数据中心。“
“目前整个的市级数据中心实现了了500家公立医院进行数据共享,形成后台数据库现在每天入库1600万笔,累计数据是43亿多笔。”谢维总结道。
3+1关键词实现互联互通
当这么多数据进行共享必然会面临着很多的挑战。一方面各医院的数据标准不一样,一方面这样的数据抽取本来对于技术都是很大的挑战。
谢维说首先建这个平台的初衷是希望从服务角度出发,“以人的ID为核心,来集成健康档案、串起所有的业务服务。”因此在建立这个平台中,会从几个方向考虑。
一是生产性系统的强化,也就是医院原本的HIS、RIS系统、医生工作站等的建设,这才有基本的数据来源。二是以共享为准则,各家医院的相应的数据信息是互相能看见的。三是协同服务。四是综合管理何综合监管。
“从整体布局来说就是底下强劲的生产性系统,然后想办法使标准统一,数据整合,然后再考虑数据共享,最后是深化数据利用。”谢维补充道。
在之前,记者也和一些医院的CIO讨论过关于区域医疗的建设,会发现明显的特征是区域医疗对于单个的医院来说是个挑战。因此谢维也用了“3+1”个词来总结其中的门道,即整合、共享、协同和交换。
关于其中的数据标准化会占据很大的精力。据了解,目前上海市参考了国家的标准、结合上海的实际情况形成了一套标准,目前是1.0版。
而说服医院的过程中,上海市卫生局也得到了政策的支持,包括给各家医院的补贴等。
达成一致之后,这些数据又会如何进行汇总呢?
谢维说一般是要求医院将生产性系统产生的数据扔到前置机上,这样市的综合平台会以天为单位去调取这些数据。同时在这个过程中,也需要做到数据保护等工作。
Hadoop来做嫁衣
上海市采用依托传统+新技术的的总体路线,即包括传统的数据库技术等作为基础,在此情况下通过新技术的引用,保障可持续发展。“在这个过程中,我们面临着很多的压力。在技术层面,我们必须经过各种论证,以保证系统能扛住海量数据并发的压力。”谢维在提到新技术问题时,如我们开头所说经过了各层论证实验性选择了用40台虚拟机(后期为40台物理机)作为主要的分布式存储和分布式计算的节点,利用Hadoop的核心技术来完善调阅问题。
“我们的论证是在2010年开始的,当时大数据这个词儿还没出来,但是技术模型已经有一些了。所以当时我们也是和英特尔这样的原厂商一起讨论可能性。”谢维说如今,“整个这样的投入大概是百万级的,大概能做到I/O这个层面来说,5000并发下可以一秒内全部响应。”
另外谢维说Hadoop的框架所承载的东西很多,其核心数据库在查询的效率上表现优异。另一方面,在后期的规划中,这个框架也可以支撑分析统计等。
据介绍,上海市的区域卫生信息化接下一个阶段的目标是会重点围绕涉及医药卫生全领域的整合。同时在原有平台上积累的数据,利用平台的分布式存储、分布式计算的能力,来围绕综合管理、数据挖掘、数据探索等进一步深化。
总结:
目前很多地方都在积极开展区域医疗,也都在围绕着国家“4631工程”的准则来进行。上海是践行者,同时在大数据技术使用上也是先行者。
利用大数据做嫁衣,可以让区域卫生信息数据做的更多。
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。