基于HIS查询系统的数据仓库构建与实现基于HIS查询系统的数据仓库构建与实现孙新宋中山(中南民族大学计算机科学学院,湖北武汉)摘要:随着信息技术和计算机技术在各医院的广泛应用,医院信息化,计算机网络化已成为医院现代化管理的核心。本HIs系统中的一个查询系统模块为例,对数据仓库的设计和实现过程进行详细的探讨。采用~\司的为开发平台,实现系统的查询需求的收集,临时表,汇总表和各个功能子构件的设计,为决策分析提供支持。关键词:数据仓库;多维模型;医院信息系统,。shan(nce,South。,,China):。
。,。l。´,s,,。,。:;l;HIS引言企业的发展,使得需要处理的数据量和数据类型越来越多,利用计算机实现历史数据的信息化管理,成了企业的必选。
如何从大量的数据中提取_仃用的信息进行组织,存储和统计分析,了解业务发展的现状,挖掘业务发展的规律,掌握业务发展趋势,成为数据管理技术领域的新问题。数据管理技术类型繁多,主要是针对不同的业务需求,研究,采}}j适合企业数据管理要求特点的相关数据库技术。数据仓库由于支持高层决策分析的优势,得到很多管理者的重视和较为』泛的应用。数据仓库就足一个面向主题的,集成的,不可更新的,随时间不断变化的数据集合,用以支持企业或组织的决策分析处理。数据仓库的最根本的特点是物理的存放数据。数{辑仓库中的数据是按一定的主题域进行组织的,他的建立小是取代数据库,相反的,它是支持高层决策分析的数据库的一个新的应用。本文基_r查询系统需求,研究医院收费数据的特点,采用数据仓库技术,给出查询系统的设计方法。查询系统的总体需求及收费数据特点分析2。1HIS简述HIS(ystem,医院信息系统)美国该领域的着名教授。曾作如下定义:利用电子计算机和通讯设备,为医院所属各部门提供对病人诊疗信息和行政管理信息的收集,存储,处理,提取及数据交换的能力,并满足所有授权用户的功能需求。
HIS般由门诊挂号收费系统,药库系统,门诊药房系统,出入院管理系统,病区护士站管理系统,后勤仓库管理系统及院长查询系统等组成。各系统既独立完成各自的工作,又相互牵制,构成医院完整的计算机网络化体系。2。2总体需求查询系统是针对目前医院管理的需求开发的,茛目标方面,查询系统通过对各种原始业务数据的汇总析取,为数据挖掘,多维数据分析提供支持。支持统计型查询:系统提供各种日报月报的自动生成功能,将结果保存至对应的统计结果表中;当统计型查询需求到达后,如果相应的统计结果表中可以获得数据,则直接返回数据,完成查询;如果统计结果表中没有,则从相应的汇总表中汇总f{_}所需数据,完成查询。支持业务结果明细型查询:直接从对应的结果明细表中按照需求获得数据,完成查询。2。3查询系统的数据特点查询系统,目的就是为医院主要领导提供许多每日,每月报表,使院长对全院的综合情况了如指掌。利用计算机对日报,月报及数据信息综合分析,给各主管部门及院长提供决策数据。数据仓库就提供了多维分析和决策支持,很适合用于查询系统的构建。。首先,星型模型可以根据设定的维度进行预处理,例如:预先的统计或者排序等,这样,系统就可以迅速的给出基于某一个维得的报表。
比如要查询院的营业额时,可以从时间,收费员,收费项目等方面来查询,这些方面就是维,营业额就是事实。系统可以按照各个维预先统计,生成相应的报表。收稿日期:2009—05—07修回日期:2009—06—09作者简介:孙新(1986一),女,汉族HIS系统库房业务,河南商丘籍,硕士研究生,主要研究方向为数据挖掘,计算机网络。宋中山(1963一),男,湖北省武汉籍,副教授,主要研究方向为数据挖掘,计算机网络。13中国西部科技2009月(中旬)第08卷第17期总第178其次,大量的数据才能支持科学的决策。对海量数据进行存储统计就是数据库的一个新的应用,数据在仓库巾围绕主题以星型模式存放,通过OLAPH~务器,可以转换为多维的数据立方体(),为决策支持服务。数据仓库的构建与实现3。1数据模型选择数据模型是数据仓库研究的重点问题之一,由于本系统的功能是对大量历史数据的查询HIS系统库房业务,对查询速度要求较高,而且需要建立起多维的数据模型,进行多维分析操作,所以用到多维分析模型设计数据仓库。数据仓库的多维分析模型设计结构主要有星型模型,雪花模型和混合模型。由于星型模型针对各个维都做了预处理,所以查询速度比较快,存本系统中采用此模型。
利用多维模型设计数据仓库分为几下几个步骤:需求收集;概念模型设计;设计结果可以用信息包图表示;总体逻辑模型设计;即设计数据仓库的总线结构一一统一的事实和统一的维,设计结果可以用总线矩阵表示;某个主题的逻辑模型设计;即设计结果可以用星形图表示;物理模型设计;设计结果是数据仓库的物理存储,即关系数据库中的事实维度链表。多维数据模型设计数据仓库步骤图3。2概念模型的设计数据仓库中的数据是按照主题进行组织。因此,数据仓库概念模型设计的主要任务就是界定系统的边界和确定系统的主题域及其内容。所谓主题,存逻辑意义上对应业中某一宏观分析领域所涉及的分析对象。对于操作员来说只要把握好收费项目明细和时间,就能把握住查询系统的焦点,只有这样才能把握门诊收费系统的动态。概念模型的具体设计如下: 主题的确定:奉系统足以门诊收费杏询为主体,利用 数据仓库~IOLAP 等技术对收费项目中的一级项目数据和二 级项目数据,进行整合和处理。其主旨是查询出所需数 据,并能从多个侧面对收费项目,项目类别,时间等主题 进行分析。为门诊科室更好的进行科室设置和数据分析和 统计提供参考。 维度的建立:维度定义了一个完整的主题分类或数据 14 分类,是用户访问数据信息的途径。
本次设计确定了操作 员维表,时间维表,收费明细维表三个维表。 3。3 逻辑模型的设计 逻辑模型的设计是在概念模型的基础上,主要进行粒 度的划分,表中数据的提炼和逻辑关系模式的定义。具体 设计如下: 粒度的划分:粒度是指数据仓库的数据单位中保存数 据的细化或综合程度的级别。不同粒度级别的数据用于不 同类型的分析处理,粒度划分是影响到数据库性能的一个 重要方面。数据越详细,粒度越小,级别就越低;数据综 合度越高,粒度越大,级别就越高。根据门诊收费查询的 具体情况来进行粒度层次的划分。由于查询系统中的数据 是汇总数据,是没有进行分类的数据因此要按操作员, 项目类别,时间进行一级汇总;按项目类别下的类别名和 时间下的月,曰进行二级汇总。逻辑结构的设计:根据上 面主题的属性描述,以及粒度的划分层次,以及主题所要 的表,以门诊收费查询系统事实表为中心,以与事实表相 联接的操作员维表,时间维表和收费明细维表共同构建了 查询系统的星型模型(见图2)。 操作员号 操作员名 操作员维衰 收费项目类{5j 事实表类jj4 收费项目类剐编号 项目类别 名称 收费朗细维表 查询系统星型模式示意图3。4 物理模型的设计 数据存放位置涉及存储设备的存取速度。
由于目前高 速存储设备较为便宜,性能/价格比较高。这里采用以硬盘 为丰要媒介的存储方式,根据分析主题构建各种事实表和 维表,采用 公司的 为数据仓库开 发平台,这样在物理模型设计阶段,大部分工作将由SQL 自动完成,对于建立索引策略可以为各表的主 码和外码,建立聚簇索,然后根据实际的运行情况。通过 RDBMS 提供的数据库监控工具,建立一些合适的非聚簇索 引,从而获得更好的查询性能。 查询系统的实现数据收集:获得中央服务器上的各种所需原始数据 (存入临时表),可以通过导入/导出向导来完成。 数据存储:将获得的各种所需原始数据(临时表)保 存至对应的结果明细表中,可以通过导入/导出向导来完 数据析取机制:针对获得的各种所需原始数据(临时表),按照各种需求,结合维度设计,将数据初步汇总保 存入各种´『L 总表。 (下转第10 月(中旬)第08卷第17 期总第178 高松山矿区成矿温度主要分布在2360C~246之fnJ,成矿深度在0。2~1Km;流体包裹体中的盐度分布范围为 0。71%~7。31%之间,平均盐度2。238%左右,标准差为 1。
374,盐度值主要集中在1~3%之间;石英流体包裹体中 H,OM位素特征6O 的含量在2。7~4。1%o 之问,平均为 3。34,标准差为0。503;5D 的含量在一l29~117%o 之间,平 均为-121。6%o,标准差为4。93,反映以大气降水为主。 高松山金矿为典型的浅成低温热液型金矿。 找矿标志(1)地层找矿标志。矿区赋矿火山岩系的金的丰度一 般较高,为地壳丰度的2~3 倍,反映在岩浆活动晚期,在 火山热液系统中金的丰度较高,从而有利于成矿。在高松 山矿区与金矿有关的火III 一次火『Ill 岩组合为:安山岩一英 安岩一流纹岩的岩石组合。 (2)构造标志。矿区内的北西向断裂是主要的导矿构 造,其伴生的北西西向,北东东向,东西向断裂是矿区主 要的容矿构造。矿区内发现的矿体均赋存于此三组构造之 中,因此,三组构造以及构造破碎蚀变带是重要的找矿标 志之一。 (3)遥感标志。断裂构造标志:区域南北向线性构造 与东西向构造交汇部位,以及与北西,北东向构造交´『r 环形构造标志:环状构造与南北向及北西向断裂相交或相切的部位火山机构发育地区,特别是在火山具有明显 多期次发育地区。 (4)物探标志。
整个测区的异常明显地分为两大部 分一正异常,负异常。负异常呈半环状展布于测区中部, 正异常分布在测区南端和北端,整个测区异常走向为东西 向,负异常变化梯度较小,正异常变化梯度较大。在测区 南部的零值线附近,等值线密集,正负异常变化梯度人。 异常均由磁性小同的地质体引起,异常走向为东西向,与 地质体走向和矿脉走向基本吻合。在零值线附近是金矿体 主要集中区。 (上接第l4 页)生成的数据仓库就可以进行多维分析和 决策支持。 总结查询系统是管理大量的,持久的可靠的,共享数据的 工具,对各种原始业务数据的´j 厂总析取,为数据挖掘,多 维数据分析提供支持而数据仓库改变了传统的以支持查询 为主的事务型处理,变成以面向主题为主的分析型处理,并 在此基础上建立了联机分析处理和数据挖掘应用,以适应快 速的访问和支持决策分析操作。本文基于医院收费数据的 特点,用星型模型构建了数据仓库,实现了门诊收费的信 息化管理,提供了多维分析和决策支持。 参考文献: 10 由于矿体赋存于构造破碎带中硅化较强部位,矿体抗风化能力较强,电阻率高,阻值高,而矿体的主要围岩安 山岩抗风化能力低,孑L 隙度大,电阻率低。所以利用视电 阻率异常可追索产状较陡沿走向延伸很长的石英脉型矿 (5)化探标志。
该区圈出水系沉积物异常21处,土壤 地球化学异常34 处。从化探测量成果看,矿区内金的高背 景区以及高值区总体上呈北东东向展布,并在交叉部位得 到加强,形成强度高,规模大的异常群。高值区的分布与 容矿构造走向…致,且吻合较好。 1:1 万土壤测量结果看,矿区Au 与低温元素As,Sb, Ag,Bi,Hg 等关系密切。Au+Ag+As+sb+Hg 异常为地球化学 找矿标志。 (6)砂金标志:支队在沙阿其河开展了砂金普查,砂 金成色较高,以粒状为主,其次为板状,条状,浑圆状, 主要分布在沙阿其河以及三支沟,四支沟等,提交了砂金 储景301kg。矿区残坡积有含明金转石,对岩会找矿有较好 的指示作用。砂金,含明金转石是矿区直接的找矿标志之 (7)矿化蚀变标志。矿化蚀变主要为黄铁矿化,硅化,绢云母化,高岭上,绿泥石化,碳酸盐化。矿化蚀变 是矿区的间接找矿标志之一?。 参考文献: [1]陈修沁。黑龙江省逊克县富强矿区及外围水系沉积物测量报告 书。1991。 [2]陈修沁。黑龙江省逊克县富强矿区Hs9 异常查证报告,1992。 [3]陈桂虎。黑龙江省逊克县富强矿区IJ 号矿体详查报告,2002。 [4]任忠良。
黑龙江省逊克县高松山矿区外围1/5 万水系沉积物测量 报告。2005。 [5]毋瑞身。低温浅成热液金矿若干问题讨论[J]。贵金属地质,1993。 [6]黑龙江省地质局。黑龙江省区域地质志[M]。北京:地质出版 社,1994。 [7]赵洪海,等。黑龙江省逊克县高松山矿区及外围岩金普查报告 [R]。2007。 [I]萨师煊,王珊,数据库系统概论[螂。高等教育出版社,2003。[2]李妍。数据仓库的数据建模技术[I『]。科技和产业,2005,5(11):l9~ 21。 [3]俞杏娟。浅谈医院信息管理系统(HIS)及其作用[J]。消费导 刊,2007,(3):61。 [4]牛莉。中小型企业数据仓库的构建和应用[J]。华南师范大学 ,2007,(1):37~42。 [5]谭昕。数据仓库及其设计[J]。安徽电力职工大学学 报,2003,8(1):73~77。 [6]陆吕辉,刘青宝,邓苏,张维明。多维数据概念模型的形式化描 述[J]。计算机科学,2006,33(7)。