将数据作为一个新的生产要素使用时,需要解决数据安全和数据价值流通二者间的矛盾,隐私安全计算技术就是解决这个矛盾的灵丹妙药。
隐私安全计算强调不分享原始数据,只分享数据的价值。即提供一个环境,在这个环境中通过计算数据获取想要的结果,也就是数据的价值。
整个计算过程始终保证原始数据的安全,保证使用者获取数据的价值。
隐私安全计算领域包含很多技术,既有大家耳熟能详的区块链、云计算,也有最近云峰会中被反复提及的多方安全计算、同态加密、联邦学习、安全沙箱、可信环境等。
这些都是隐私安全计算中的核心技术,使用这些技术手段能够保证数据在计算和使用过程中的安全。
打造全流程、多方参与的安全计算环境
了解隐私数据平台,首先要了解医疗信息化历程。
从信息时代到数字时代再到智能时代,医疗信息化不断演变。从院内信息互联互通到建设数据中心,再到互联网医疗线上线下打通和阿里提出的数据中台概念,医疗信息化进程经历了基础阶段、完善阶段和应用阶段。
如今我们提出“隐私数据平台”的新概念,是在中台的基础上加入隐私安全计算的技术,使数据中台里的数据能从原始状态转变为数据资产,实现更好更安全地管理、使用与价值共享。
何为隐私数据平台?
隐私安全计算技术只是其中一部分核心技术,隐私数据平台是一个系统工程。
在这个系统工程中,首先要保证的是全流程的通畅。从数据的汇集到数据的治理,以及归一、结构化、标准化等。
数据汇集后,还要对数据做最小单元的管理、确权。只有完成确权后,才能在需要做数据授权使用时,知道找谁去授权,谁有权利进行授权。
然后是使用数据,从数据的查询、探测开始,找到想要的数据,并向相关数据拥有管理权限的管理方,申请授权后才能开始使用数据。
在使用数据时,还需要引入自己的解决方案,或是借用第三方的服务或应用工具进行数据计算,当所有的计算在安全环境中完成后,即可得到想要的结果,也就是数据的价值。
最后的工作是考虑如何下载计算结果,如何分配数据价值,以及对前面工作做出贡献的参与方如何分配利益。
以上工作全部完成后才是一个完整的隐私数据平台。
数据价值分享的第一步就是数据治理。
翼方健数具有自己的数据治理平台,能够对数据进行清洗医疗 数据安全 场景,将各系统提供的原始数据转换为可供使用的数据资源。
经过数据治理后,我们就有了可供使用的数据资产,之后就是数据共享环节。做数据共享时,要遵循FAIR原则,即可发现、可访问、可互操作和可重用。
以数据为核心的数字产业化解决方案
翼方健数目前最核心是围绕XDP平台的相关产品,包括医院使用的科研平台、药厂使用的药研平台、保险公司使用的医保平台以及用于公共卫生领域的疾控平台。
我们在医院端也有一些AI应用,即智慧病案管理的系列解决方案,包括智能分级诊疗、智能哨点、辅助书写、辅助决策、病历质控、首页质控、DRG/DIP费控等一系列的医院院端应用解决方案。
最后,我们也在隐私安全计算保护的前提下,为保险公司、药厂等提供数据使用的服务。
我们的理念是用技术解锁数据的价值。将数据从原始状态通过隐私安全计算、数据治理、建模、应用等一系列的技术和工具进行加工,转化为数据价值,再回馈到应用中去,形成从原始数据到数据价值再到数据资产的闭环,在闭环当中反复使用。
只有医疗隐私计算技术是无法真正发挥数据的价值,必须具备全栈的技术,多方合作一起完成闭环,推动数据价值的流动。
接下来为大家介绍我们实施完成的三个医院案例与两个区域案例:
第一个医院案例是瑞金医院自主学习型智能化电子病历。
我们利用在瑞金医院通过隐私安全计算拿到的数据进行建模后,再通过模型引导电子病历的智能书写。
目前,已经完成了门诊和住院的两个科室的落地和应用,平均病历书写时间缩短了70%,正在推广全院的门诊、急诊电子病历书写的智能辅助。
第二个医院案例是上海九院全息全病例智能内涵质控。
我们与九院合作,通过对病历数据按病种分类,并按各科室进行数据建模,采用深度学习人工智能技术进行病历数据质量校验和内涵质控,有效保证病历质量。
系统可参照知识库中质控规则以及诊疗路径中前后文书的涵义做出对比,找出其中不符合规则或前后不一致的地方,在秒级内给出建议并提示,实现近实时的、自动化的、从事中到终末的门急诊、住院数据质量控制体系。
第三个医院案例是翼方健数与中山大学肿瘤防治中心胡丹旦教授合作的项目。
我们在院内搭建了科研大数据平台,将基因影像、文本病历等多模态的数据融合,建立一个专科专病库。
项目应用了通过隐私安全计算融合来源于不同渠道的数据源的数据。
第一个区域案例是长三角生物医学产业大数据联盟。
该项目是由中科院营养所牵头,翼方健数与上海生物信息学会、福建省生物信息学学会等单位联合组建的大数据联盟。
大数据联盟中使用了翼方健数的平台,通过技术将长三角不同医院、不同学校的数据汇集在平台上,由数据提供方管理数据的授权与使用,构建生物医学产业全新的数据协作共享生态。
第二个区域案例是我们刚刚完成的宜昌市多点触发疾控大数据平台。
该项目包括两个平台,一个是宜昌市卫健委的医疗数据隐私安全计算平台,另一个是宜昌市大数据中心的政务数据隐私安全计算平台。
我们利用隐私安全计算将两个平台之间的数据通过授权共享,而非传统的原始数据互联互通。
此外,该项目不仅完成了政府和政府数据之间连通,也做到了政企数据的融合。
政企数据融合是近年来非常热门的话题,政府想要用企业的数据医疗 数据安全 场景,企业也想用政府的数据,但是因为种种原因无法实现。
在这个案例中,我们利用隐私安全计算技术实现了宜昌市两个政府平台与外部两个企业的数据的联通使用。
在结束之前,我们用两个问题总结一下今天的内容。
第一个问题是你的数据能用吗?
这个问题有两个内涵,一方面是指数据是否是可用的状态,如果不可用,则可以通过数据汇集治理后实现。
另一方面是指治理好的数据是否敢用,如果没有隐私安全计算的保护,无法充分保证数据在使用过程中的安全,大多数人都无法放心地使用数据,所以我们希望通过一系列的技术解锁医疗数据的价值,将医疗数据用起来。
第二个问题是你的数据用了吗?
当我们拥有可用、敢用的数据后,应该将数据用在什么地方呢?可以自己使用,可以和同行共享,也可以跨区域、跨平台、跨行业使用。
在隐私安全计算的保障下,我们期待共同探讨数据使用的途径,寻找更多的合作伙伴,一起将数据用起来,让医疗数据为人民服务。