基于大數(shù)據(jù)架構(gòu)的醫(yī)院數(shù)據(jù)中心管理

溫煜 唐丹 徐雙平 宋薇
溫煜 唐丹 徐雙平 宋薇
建立數(shù)據(jù)中心管理,規(guī)范數(shù)據(jù)中心設(shè)計(jì),管理采集來源,將醫(yī)院各業(yè)務(wù)系統(tǒng)數(shù)據(jù)有序有量的加載到數(shù)據(jù)中心庫中,為數(shù)據(jù)類應(yīng)用服務(wù)提供相應(yīng)基礎(chǔ),該平臺(tái)利用大數(shù)據(jù)技術(shù)[3]Hadoop中的分布式文件存儲(chǔ)(HDFS)系統(tǒng)保存數(shù)據(jù)以及分布式實(shí)時(shí)處理框架(Spark)計(jì)算平臺(tái)來實(shí)現(xiàn)。

導(dǎo)讀:主要以基于大數(shù)據(jù)架構(gòu)的醫(yī)院數(shù)據(jù)中心管理為目標(biāo),建立統(tǒng)一的數(shù)據(jù)管理平臺(tái),以數(shù)據(jù)存儲(chǔ)、管理、治理及分析為主,不牽涉業(yè)務(wù)流程,將數(shù)據(jù)從入口、出口、數(shù)據(jù)的準(zhǔn)確性、權(quán)限、安全等智能化管理起來,形成龐大的數(shù)據(jù)資源庫,讓數(shù)據(jù)有秩序進(jìn)來,分門別類給到需要的用戶使用。

醫(yī)療數(shù)據(jù)較為復(fù)雜,以醫(yī)院來說建設(shè)的業(yè)務(wù)系統(tǒng)接近百來個(gè),例如HIS系統(tǒng)、急診系統(tǒng)、護(hù)理系統(tǒng)、電子病歷系統(tǒng)、檢驗(yàn)系統(tǒng)、檢查系統(tǒng)、輸血系統(tǒng)、生殖中心系統(tǒng)、體檢系統(tǒng)等,每個(gè)業(yè)務(wù)廠家不同,設(shè)計(jì)不同,盡管醫(yī)院都依照不同的主題建立部分分析型數(shù)據(jù)應(yīng)用,但還是較為孤立的系統(tǒng),醫(yī)院也建立了集成平臺(tái),從業(yè)務(wù)的角度規(guī)范業(yè)務(wù)傳輸,同時(shí)在集成平臺(tái)基礎(chǔ)上了建立了臨床數(shù)據(jù)中心,但都不是從醫(yī)院整體數(shù)據(jù)中心管理為出發(fā)點(diǎn),都是從數(shù)據(jù)應(yīng)用為出發(fā)點(diǎn)。

現(xiàn)大數(shù)據(jù)技術(shù)已逐漸趨于成熟,衛(wèi)生信息化建設(shè)也不斷加快,醫(yī)療數(shù)據(jù)類型、標(biāo)準(zhǔn)和規(guī)模也日益增長,醫(yī)療已全面進(jìn)入“大數(shù)據(jù)時(shí)代”,怎樣結(jié)合大數(shù)據(jù)技術(shù)對(duì)醫(yī)院數(shù)據(jù)進(jìn)行治理、管理及應(yīng)用成為關(guān)鍵話題,數(shù)據(jù)中心管理不局限于某個(gè)分析主題、科研主題,而不是手工或是后臺(tái)數(shù)據(jù)庫呈現(xiàn)方式,而是利用系統(tǒng)將數(shù)據(jù)標(biāo)準(zhǔn)、數(shù)據(jù)中心建立、數(shù)據(jù)采集、數(shù)據(jù)校驗(yàn)、數(shù)據(jù)分類、管理及應(yīng)用智能管理起來。

數(shù)據(jù)中心管理系統(tǒng)建設(shè)

建立數(shù)據(jù)中心管理,規(guī)范數(shù)據(jù)中心設(shè)計(jì),管理采集來源,將醫(yī)院各業(yè)務(wù)系統(tǒng)數(shù)據(jù)有序有量的加載到數(shù)據(jù)中心庫中,為數(shù)據(jù)類應(yīng)用服務(wù)提供相應(yīng)基礎(chǔ),該平臺(tái)利用大數(shù)據(jù)技術(shù)[3]Hadoop中的分布式文件存儲(chǔ)(HDFS)系統(tǒng)保存數(shù)據(jù)以及分布式實(shí)時(shí)處理框架(Spark)計(jì)算平臺(tái)來實(shí)現(xiàn)。

系統(tǒng)架構(gòu)數(shù)據(jù)中心管理系統(tǒng)架構(gòu)見圖1。

圖1 數(shù)據(jù)中心管理系統(tǒng)架構(gòu)

基礎(chǔ)層:基礎(chǔ)層是指與醫(yī)院數(shù)據(jù)決策支持平臺(tái)有數(shù)據(jù)交互的系統(tǒng)中的數(shù)據(jù),主要是HIS、EMR、PACS、LIS等醫(yī)院業(yè)務(wù)系統(tǒng)。從業(yè)務(wù)系統(tǒng)抽取、轉(zhuǎn)換等過程后加載到數(shù)據(jù)中心;交換層:將kettle封裝到該中心管理系統(tǒng)中,將數(shù)據(jù)采集到數(shù)據(jù)中心,將整個(gè)采集過程及數(shù)據(jù)校驗(yàn)可視化;數(shù)據(jù)中心管理層:建立標(biāo)準(zhǔn)化管理,數(shù)據(jù)中心自由構(gòu)建,將采集方式、數(shù)據(jù)模型等進(jìn)行統(tǒng)一管理,建立智能化數(shù)據(jù)管理平臺(tái),利用分布式存儲(chǔ)技術(shù)將數(shù)據(jù)分為不同的數(shù)據(jù)中心存儲(chǔ)hbase數(shù)據(jù)庫中;數(shù)據(jù)門戶:統(tǒng)一數(shù)據(jù)輸出管理,針對(duì)前端應(yīng)用的需求,根據(jù)不同的需求類型、需求操作范圍、需求的數(shù)據(jù)范圍、需求操作流程進(jìn)行管理,對(duì)數(shù)據(jù)實(shí)現(xiàn)智能檢索功能;交互層:可將數(shù)據(jù)放到不同的媒介進(jìn)行展現(xiàn),同時(shí)可對(duì)接醫(yī)院公有云或區(qū)域公有云等。

數(shù)據(jù)中心管理組件建立數(shù)據(jù)中心管理組件,包括基礎(chǔ)資源庫、元數(shù)據(jù)管理組件、值域代碼管理組件、數(shù)據(jù)集管理組件、數(shù)據(jù)抽取及監(jiān)控組件、數(shù)據(jù)檢驗(yàn)組件、模型管理組件、指標(biāo)管理組件等,為數(shù)據(jù)中心的各種重要功能提供可視化統(tǒng)一管理工具。

基礎(chǔ)資源庫包括整個(gè)平臺(tái)從各個(gè)業(yè)務(wù)系統(tǒng)(HIS、EMR、LIS、PACS)中抽取并集成的各類標(biāo)準(zhǔn)數(shù)據(jù)信息,例如運(yùn)營數(shù)據(jù)中心、臨床數(shù)據(jù)中心、科研數(shù)據(jù)中心,采用NoSQL數(shù)據(jù)庫存儲(chǔ)方式。

元數(shù)據(jù)管理元數(shù)據(jù)是數(shù)據(jù)中心數(shù)據(jù)管理功能的基本,是提供數(shù)據(jù)追溯的最基本單位。元數(shù)據(jù)管理模塊需要按照標(biāo)準(zhǔn)去制定,有版本管理,所有的數(shù)據(jù)中心的建立都依賴于標(biāo)準(zhǔn)的元數(shù)據(jù)。用于定義字段名、字段內(nèi)部ID,字段類型等,可內(nèi)置國家標(biāo)準(zhǔn)、省標(biāo)準(zhǔn)或是建立醫(yī)院內(nèi)部標(biāo)準(zhǔn),用戶整個(gè)數(shù)據(jù)中心設(shè)計(jì)的統(tǒng)一管理,同時(shí)為互聯(lián)互通提供數(shù)據(jù)標(biāo)準(zhǔn)。

數(shù)據(jù)集管理數(shù)據(jù)集管理主要是管理由元數(shù)據(jù)組成的不同數(shù)據(jù)集,例如病人基礎(chǔ)信息、病人醫(yī)囑、病人收費(fèi)等,主要應(yīng)用于國家、省等標(biāo)準(zhǔn)集管理,管理相應(yīng)的版本、與元數(shù)據(jù)的關(guān)系等。

數(shù)據(jù)中心管理可通過數(shù)據(jù)集或數(shù)據(jù)元自動(dòng)建立數(shù)據(jù)中心表,同時(shí)對(duì)表中元數(shù)據(jù)的標(biāo)準(zhǔn)、數(shù)據(jù)類型、來源、來源表、來源字段和目標(biāo)、目標(biāo)表、目標(biāo)字段等進(jìn)行管理,方便用戶追溯數(shù)據(jù)的來源及自定義表單。醫(yī)院可通過數(shù)據(jù)中心管理查詢到醫(yī)院數(shù)據(jù)標(biāo)準(zhǔn)化程度,同時(shí)為數(shù)據(jù)模型提供來源。

標(biāo)準(zhǔn)字典管理值域是標(biāo)準(zhǔn)字典允許值的集合,一個(gè)允許值是某個(gè)值和該值的含義的組合,值的含義稱為值含義。例如,“患者病情狀態(tài)”數(shù)據(jù)字典的值域是:①危急,②嚴(yán)重,③一般。其中①、②和③是值,其值含義分別是危急、嚴(yán)重和一般。

標(biāo)準(zhǔn)字典表的基本信息管理包括:類別、元數(shù)據(jù)類型、值域名稱、值域標(biāo)識(shí)符、定義等,用戶可建立醫(yī)院內(nèi)部標(biāo)準(zhǔn)字典,或是內(nèi)置國家頒布,在管理過程中建立標(biāo)準(zhǔn)對(duì)照功能主要是將醫(yī)院業(yè)務(wù)系統(tǒng)與數(shù)據(jù)中心定義標(biāo)準(zhǔn)進(jìn)行值的對(duì)照,亦可通過該平臺(tái)發(fā)布同步機(jī)制,影響業(yè)務(wù)系統(tǒng)按照規(guī)定的字典標(biāo)準(zhǔn)統(tǒng)一更新。

數(shù)據(jù)采集管理將kettle的采集過程進(jìn)行可視化管理,主要目的是為了能了解后臺(tái)數(shù)據(jù)抽取邏輯業(yè)務(wù)狀態(tài),如:業(yè)務(wù)邏輯的執(zhí)行是否成功、業(yè)務(wù)邏輯的執(zhí)行日志信息詳情等,本功能可以通過作業(yè)名稱、關(guān)聯(lián)的分析主題、執(zhí)行時(shí)間、完成時(shí)間、執(zhí)行狀態(tài)來過濾數(shù)據(jù);可以停止/開啟執(zhí)行數(shù)據(jù)抽取作業(yè);可以手動(dòng)直接作業(yè),篩選作業(yè)抽取的時(shí)間;還可以直接進(jìn)行數(shù)據(jù)校驗(yàn)功能。

數(shù)據(jù)校驗(yàn)管理 數(shù)據(jù)校驗(yàn)主要是對(duì)抽取過來的數(shù)據(jù)進(jìn)行一致性及準(zhǔn)確性的校驗(yàn)。

創(chuàng)建數(shù)據(jù)校驗(yàn)時(shí)維護(hù)字段包括:數(shù)據(jù)校驗(yàn)名稱、校驗(yàn)數(shù)據(jù)庫ID、校驗(yàn)語句、源數(shù)據(jù)庫ID、源數(shù)據(jù)校驗(yàn)語句。

具體功能實(shí)現(xiàn):可以點(diǎn)擊校驗(yàn),篩選校驗(yàn)開始時(shí)間、結(jié)束時(shí)間;可以停止/開啟執(zhí)行數(shù)據(jù)抽取作業(yè);可以手動(dòng)直接作業(yè),篩選作業(yè)抽取的時(shí)間,點(diǎn)擊數(shù)據(jù)校驗(yàn),還可以跳轉(zhuǎn)到數(shù)據(jù)校驗(yàn)。

可自動(dòng)校驗(yàn)、手動(dòng)校驗(yàn);自動(dòng)校驗(yàn)是設(shè)定固定時(shí)間校驗(yàn)、校驗(yàn)時(shí)間段(可配置)、如若校驗(yàn)不一致可自動(dòng)回退校驗(yàn)期間的數(shù)值進(jìn)行數(shù)據(jù)重抽功能。

數(shù)據(jù)模型管理利用Saliku在數(shù)據(jù)中心基礎(chǔ)上建立多個(gè)數(shù)據(jù)應(yīng)用模型,同時(shí)將其模型管理起來,管理模型的關(guān)聯(lián)關(guān)系,模型內(nèi)部指標(biāo)集,定義指標(biāo)來源、出處、規(guī)則、含義等,為規(guī)劃指標(biāo)統(tǒng)計(jì)規(guī)則,為規(guī)范指標(biāo)的統(tǒng)計(jì)規(guī)則及含義,對(duì)指標(biāo)統(tǒng)計(jì)進(jìn)行流程化管理,可在該平臺(tái)上申請指標(biāo)定義及統(tǒng)計(jì)規(guī)則,由專人負(fù)責(zé)審核,完成整個(gè)數(shù)據(jù)流的管理工作,用戶在通過數(shù)據(jù)模型自由構(gòu)建報(bào)表時(shí)可查詢該指標(biāo)列規(guī)則、出處、內(nèi)容,同時(shí)可點(diǎn)擊校驗(yàn)該指標(biāo)數(shù)據(jù)是否抽取完整。

數(shù)據(jù)檢索功能建立可視化數(shù)據(jù)檢索功能,在數(shù)據(jù)模型的基礎(chǔ)上,根據(jù)用戶權(quán)限分配不同的數(shù)據(jù)權(quán)限,用戶可以自由配置篩選條件及所需展現(xiàn)內(nèi)容。

數(shù)據(jù)統(tǒng)一管理門戶為提供統(tǒng)一的數(shù)據(jù)管理門戶,用戶可在自身的權(quán)限范圍內(nèi),享受平臺(tái)提供的各項(xiàng)應(yīng)用功能。

權(quán)限設(shè)置與用戶認(rèn)證:平臺(tái)對(duì)用戶應(yīng)用訪問進(jìn)行控制,只有包含在受控的用戶列表中的用戶才能瀏覽系統(tǒng)應(yīng)用,系統(tǒng)根據(jù)不同的用戶權(quán)限展示允許范圍內(nèi)的報(bào)表信息;用戶類型分組:為了控制平臺(tái)應(yīng)用服務(wù)的訪問權(quán)限,將系統(tǒng)用戶劃分為不同的類型,如:管理員、科研人員、管理者等。不同的用戶類型享用不同的應(yīng)用服務(wù),也就是對(duì)查詢信息擁有不同的訪問權(quán)限;數(shù)據(jù)對(duì)外管理:當(dāng)其他系統(tǒng)調(diào)用數(shù)據(jù)中心時(shí),[請確認(rèn)修改]管理其數(shù)據(jù)去向、數(shù)據(jù)權(quán)限、數(shù)據(jù)安全;數(shù)據(jù)日志管理:對(duì)數(shù)據(jù)訪問痕跡,數(shù)據(jù)日志,數(shù)據(jù)修改,數(shù)據(jù)報(bào)表建立等進(jìn)行相應(yīng)管理;數(shù)據(jù)應(yīng)用類系統(tǒng):將數(shù)據(jù)相關(guān)應(yīng)用類產(chǎn)品實(shí)現(xiàn)統(tǒng)一的單點(diǎn)登錄,如科研管理、院長平臺(tái)、藥學(xué)管理、醫(yī)??刭M(fèi)、單病種管理等;首頁個(gè)性化設(shè)定:用戶可根據(jù)修改系統(tǒng)膚色及、可自由配置首頁、組合所關(guān)注的特定報(bào)表、特定功能菜單。

文章來源:《中國數(shù)字醫(yī)學(xué)》雜志2018年第12期,作者及單位:溫煜 唐丹 徐雙平 宋薇,梅州市人民醫(yī)院 廣州醫(yī)博信息技術(shù)有限公司。

THEEND

最新評(píng)論(評(píng)論僅代表用戶觀點(diǎn))

更多
暫無評(píng)論