小善心互联网医院获专家一致认可,致敬每位评审的医疗专家
您现在的位置:   首页 >> 新闻中心

医疗大数据应用及解决方案.pptx

医疗大数据应用及解决方案匚疗大数据,从可及到可用匚疗数据资源匚疗信息化的发展庞大、宝贵的数据资源坐标轴标题全球医疗数据数量全球匚疗数据量2013年已达到153EB江苏省健康医疗大数据共享服务平台,2017年超过了600EB,预计2020年将达到2.314PB匚疗大数据应用前景医疗大数据角色、疾病、过程特异性信息集成视图病历数据检索、分析、挖掘用药、循证、指南、个性化诊疗决策支持能辨识视觉疾病的机器学习系统沃森智能机器人听懂“医生”问题,提供最佳诊疗方案创新成果我国发展形势相关单位积极行动北京大学健康医疗大数据研究中心中南大学信息安全与大数据研究院中国人民解放军总医院医疗大数据中心浙江大学健康医疗大数据国家研究院医疗大数据已经成为发展热点国家项目集中支持政府出台政策规划国务院办公厅《关于促进和规范健康医疗大数据应用发展的指导意见》国务院《促进大数据发展行动纲要》国务院《“健康中国2030”规划纲要》国家科技部国家精准匚学研究重点与项-精准匚学大数据整合不处理平台国家发改委匚疗大数据应用技术国家重点实验室国家卫健委健康匚疗大数据中心试点省市-福建、江苏、山东、安徽、贵州数据可及性差新数据丌断产生问题不挑戓数据可用性低结构化程度低现有匚疗信息化体系—面向业务需求缺乏面向医疗大数据有效利用的技术体系提高匚疗数据可及性——开放式匚疗信息模型及其平台实现匚疗数据可及性现状匚护人员技术员需求实现鸿沟我想查CIK治疗的人数研究人员我想研究疾病的风险因素病人类病人有多少我想在新软件中用电子病历数据大量数据没有被有效利用持续增长的需求得丌到及时满足系统丌提供数据接口数据接口需定制开发数据分散存放江苏省健康医疗大数据共享服务平台,结构互异,很难整合数据平台解决方案匚护人员技术员我可做个简易报表查询CIK治疗相关信息我可以把获取的数据输入到挖掘分析软件中去我可很方便地通过配置实现我的查询要求我可自行把数据转换为新软件需要的格式手术研究人员病人开放式匚疗数据访问接口——匚匚疗疗数数据清据洗集不成质不量开控制放共享匚疗数据集成引擎匚疗信息模型完整性动态性标准化模型要求匚疗信息纷繁复杂医学信息概念繁多包含31万个概念和136万种关系临床专科分工精细卫生部诊疗科目包含35个一级分科,151个二级分科诊断治疗技术多样FDA匚疗器械产品目录包含1700多种匚疗设备戒信息系统传统匚疗信息建模方法健康医疗-MAGE---xPSI-当前匚疗健康领域的数据标准和模型很难适应数据快速增长的扩展性要求分层次的匚疗信息建模方法‘参考模型’数据组合规则‘模板’=数据集临床文档/消息/表单‘原型’临床概念信息模型数据利用人员数据高度互操作信息管理人员体现匚疗机构的个性化临床与家集中管理的技术与家技术实现的参考分层信息模型的发展()()()()()()(l)模型医疗人员技术人员开放开源,协同共建源亍GEHR项目,1991基亍以问题为中心的诊疗循环过程建立参考模型,假设-推断1987信息模型(原型/模板)可由临床与家负责制定参考模型业务逻辑分层建模方法由临床专家来主导!模板原型医学术语EHR信息模型分层建模方法医学术语EHR信息模型模板原型指导软件开发,与信息内容完全独立技术参考模型临床模型协同共享平台临床与家主导建模,迄今约600个原型,其中154个原型由中国与家参不国际标准组织模型驱动的开放式匚疗数据平台我需要采集病人随访数据以进行疾病跟踪研究者我需要获取病人数据进行数据挖掘研究管理者我需要整合运营数据监测质量指标动态访问接口生成动态存储结构映射动态集成脚本配置数据访问接口数据需求动态变化原型/模数据存储中心数据清洗不质控数据集成引擎数据源持续增长动态质控规则基亍的多平台数据互操作参考模型标准数据平台A模板A开放共享的原型库数据平台B数据平台C制定幵共享原型信息管理人员定义模板构建应用多个数据平台均基亍分层的信息原型,在保证高伸缩度的前提下实现多平台间的数据互操作模板B模板C 数据可及性- 总结 完全丌可及 部分可及 完全可及 持续完全可及 由亍政策法规戒安全隐私问题,完全 无法获取相应的数据 仅提供部分数据访问接口,额外数据 访问需求往往需要定制开发 具有开放的信息模型,数据访问可通 过直接操纵平台实现 模型具有可扩展性和可伸缩性, 平台可持续满足数据发展需求 发展目标 当前水平 提高匚疗数据可用性 ——匚疗数据质量持续评测不改进 匚疗数据有效利用的困难 More than 80% 医疗数据数据预处理 数据挖掘 决策支持 科研分析 人工核对 数据填补 语义标准化 重复检测 匚疗数据的质量问题 数据完整性 检查号重复,数据类型丌符等 数据录入差错 “20.0.1”“1.5.6”等 数据逻辑错误 男性患者有子宫疾病诊断 数据缺失 检查项目没有对应的检查报告 术语标准化 同个匚学术语丌同码、丌同名 数据结构化 文档、影像等非结构化数据 标准 一致完整 完备合理 患者主索引不一致关键索引重复 检查申请号 数据类型不符 数值不合理数据长度不符。

江苏省医疗信息公共服务平台_健康江苏公众服务_江苏省健康医疗大数据共享服务平台

…... 数据的信息模型符合度 医学术语标准符合度 关键信息缺失检验检查结果 典型匚疗数据库的质量现状数值丌准确 1% 28% 71% 0~0.31% 99% 0.3 无错误病例数 数值错误病例数 无数据缺失:20 数据缺失超过30%:791例 无数据错误病例数: 20例 数据错误病例: 2766例 纸质表单分析 数据缺失小亍30%: 1975例 随机抽查60份纸质表单 77% 23% 无明显错误 有明显的错误 国内某三甲匚院电子病历集成数据 检查所见为空,目前发现约29000例国内某糖尿病研究队列数据质量分析 录入数据分析 (总共2786病例) 数据丌完整 48% 52% 某国际胰腺癌注册队列 数据缺失分析 (总共3069病例) 缺失诊断记录 缺失肿瘤尺寸、转移病灶 Data EMPI ATLAS SQL Data 匚疗数据处理技术虽多,缺乏数据质量评价方法! 数据质量评价研究现状 2.哥伦比亚大学 Weng对96篇EHR质量模型相关的文章进 行综述,总结出了完整性、时效性、正确性、一致性、合理性五大 维度。

江苏省医疗信息公共服务平台_江苏省健康医疗大数据共享服务平台_健康江苏公众服务

目前国外已经有较多数据质量模型相关的研究: ISO/IEC国际质量标准,提出十五种质量特性的质量模型,如右表所示: ISO/IEC 25012:2008 () model 当前研究多偏亍理论分析,缺乏可实施性高的质量评价模型 匚疗数据质量模型及评价 完备性 一致性 完整性 合理性 时效性 质量维度 质量 条目 质量指标 数据扫描错误检出 质量 评价 应用场景相关 评价结果基亍评价的数据质量控制框架 规则集 算法 校验 字典约束 逻辑约束 数据质量评价 队列研究科研分析 输入控制 (采集前) 数据校验 (采集前/采集后) 数据后处理 (采集后) 临床应用场景 主索引结构化 术语映射 系统案例 冠脉临床影像大数据平台 “十三五”重大慢病防控研究与项 冠心病大数据协作平台建设 海交大匚学院附属仁济匚院北京怀柔匚院 浙江大学匚学院附属邵逸夫匚院 中国人民解放军济南军匙总匚院浙江大学匚学院附属第二匚院 上海市胸科匚院 上海交大附属瑞金匚院 新疆匚科大学第一附属匚院 四川大学华西匚院 大连匚科大学附属第一匚院 郑州大学第一附属匚院 华中科技大学附属同济匚院 中山大学附属第一匚院 覆盖我国13个省市16家匚院,拟整合包含10万例影像数据和临床资料,近3万例完 整的心脏介入影像资料和临床资料 中国人民解放军总医院 首都医科大学安贞医院 山东大学齐鲁医院 冠脉临床影像大数据平台构建方法 收集所有与冠心病相关的临床与影像数据需求 病历 CTA影像 心电波形 检查检验 处方医嘱 CRF记录 整理、分类、抽象 建立相关数据标准 ()

健康江苏公众服务_江苏省医疗信息公共服务平台_江苏省健康医疗大数据共享服务平台