五年前,大數據這個詞才剛在醫(yī)療圈興起,而如今已落實到醫(yī)院的方方面面。在醫(yī)、教、研、管等領域,大數據技術逐漸成為科學決策的依據,精細化管理和內涵式發(fā)展理念深入人心。西京醫(yī)院數字化中心主任蔣昆表示,信息科是信息技術在醫(yī)院落地的引導者,保持對新興技術的敏銳觸覺非常必要。
臨床科研的壓力是促進醫(yī)院大數據快速發(fā)展的關鍵因素,這源于科研對數據整合分析的高需求。西京醫(yī)院近年來圍繞研究型醫(yī)院的建設目標,統(tǒng)籌布局學科建設,以科創(chuàng)促進醫(yī)療進步。醫(yī)院高度重視科研創(chuàng)新,將其定義為未來發(fā)展的源動力和行業(yè)競爭的差異點,可在探究過程發(fā)現,大量依靠人力的傳統(tǒng)科研工作方式效率相當低下。
哈爾濱醫(yī)科大學放療科劉暉教授提到一些案例,稱過去做科研是和醫(yī)院病案室進行對接,需求病歷數大,光是調取病案號都費時甚久,且還不能保證患者信息的完善。科研過程要經過發(fā)掘問題、提出假設、設計實驗、收集數據、統(tǒng)計分析、總結歸納等多個步驟,這就要求大量臨床數據做支撐。另外,要使數據采集、處理和分析的效率提高,還得依靠醫(yī)院信息化程度的提高,包括電子病歷數據、影像數據和基金組學數據等信息資料的豐富完善。
從“大量數據”到“大數據”
借助大數據技術,可以從海量數據中快速提取有用信息,進行分析處理,這對科研效率的提高有很大幫助。
2013年,西京醫(yī)院建立CDR,嘗試整合臨床數據,為臨床做集中信息展現。前后共經歷了三個階段:第一階段,整合不成熟,數據不完整;第二階段,建立索引,但體驗不佳;第三階段,探索建立醫(yī)療大數據科研平臺。
經過5年探索,蔣昆頗有心得,總結了醫(yī)療大數據在臨床科研領域發(fā)揮作用的關鍵環(huán)節(jié):
1.數據采集和eCRF。科研數據通常有兩個來源,一是從電子病歷、檢查報告等醫(yī)院信息系統(tǒng)中獲得的數據,而是科研量表、患者隨訪數據等后期錄入的數據??蒲腥藛T需要整合這兩個來源的數據,為臨床科研提供服務。
2. 數據清洗、后結構化和脫敏。數據雜質多,有效利用率的高低有可能直接決定科研項目的成敗。因此,設計數據清洗邏輯,把控數據質量,完成后結構化和脫敏處理,可為科研人員節(jié)省時間,提高科研效果。
3. 數據檢索和調閱。按需查詢、分組收藏,對于高效捕捉有用的科研數據幫助很大。
4. 數據統(tǒng)計和分析。把常用的統(tǒng)計分析功能嵌到平臺里,可以一站式、一次性完成數據采集、實驗設計和統(tǒng)計分析的操作,且數據越多,做研究的參考性就越大。西京醫(yī)院為了納入更多的數據,將所有電子化儲存的病歷都做了后結構處理。NLP技術加持,使得數據湖不斷擴大,適應醫(yī)院需求,快速迭代臨床科研大數據應用體系。
科研創(chuàng)新是所有研究型醫(yī)院共同追逐的目標。低效、低質的科研已逐漸被淘汰,加大科研績效力度,進一步挖掘臨床科研人員潛力才是主流。在愈演愈烈的醫(yī)療科研競爭大環(huán)境中,大數據將起到至關重要的作用,能很大程度為臨床科研爭取優(yōu)勢。
精準醫(yī)學的發(fā)展,基因組學、生物信息日漸豐富,注定了傳統(tǒng)人工方式沒落的宿命。而大數據技術手段,可以幫助科研人員獲取各類數據,提供必要工具,及時分析,作出假設,在各個方面為科研提速。雖然如此,醫(yī)療大數據的發(fā)展仍然存在問題,并沒有形成完整的產業(yè)鏈條,其中,企業(yè)沒有從更高的站位考慮醫(yī)療大數據的發(fā)展是問題關鍵。蔣昆補充道,企業(yè)關注點放在眼前的獨立項目,鮮少關心上下游生態(tài)以及客戶的需求變化,這不利于打通數據壁壘,實現跨學科、跨領域的結合,科技惠民的終極愿景實現還需要一段時間。





