一、國家大數據戰(zhàn)略
數據是國家基礎性戰(zhàn)略資源,是21世紀的“鉆石礦”。黨的十八屆五中全會提出“實施國家大數據戰(zhàn)略”,國務院印發(fā)《促進大數據發(fā)展行動綱要》、工信部印發(fā)《大數據產業(yè)發(fā)展規(guī)劃(2016-2020年)》,全面推進大數據發(fā)展,加快建設數據強國。
2016年6月,國務院辦公廳印發(fā)《國務院辦公廳關于促進和規(guī)范健康醫(yī)療大數據應用發(fā)展的指導意見》,文件指出健康醫(yī)療大數據應用發(fā)展將帶來健康醫(yī)療模式的深刻變化,有利于提升健康醫(yī)療服務效率和質量。
生物醫(yī)藥產業(yè)鏈主要包括原料藥供應、生產研發(fā)、外包服務、醫(yī)藥商業(yè)、醫(yī)療服務、產業(yè)服務、金融服務、會展服務、數據服務、產業(yè)媒體等。
圖 生物醫(yī)藥產業(yè)鏈圖譜;
現階段,生物醫(yī)藥大數據主要來源于生產研發(fā)、醫(yī)療服務、產業(yè)服務三個版塊:
研發(fā)數據:主要指藥企或科研機構進行研發(fā)獲得的數據,包括從先導化合物篩選、臨床前、I-III期臨床、IV期臨床、上市后療效副作用跟蹤等數據;
醫(yī)療服務數據:主要指患者就醫(yī)產生的數據,如病例數據、檢查數據、用藥選擇等;還包括患者行為和感官數據,如家族病史及可穿戴設備、即時監(jiān)控設備采集的健康數據;健康醫(yī)療行業(yè)數據,如監(jiān)管數據、醫(yī)院評價數據、公共衛(wèi)生數據等;
產業(yè)數據:主要是指生物醫(yī)藥產業(yè)企業(yè)、人才、藥品器械、投融資等數據。
1.生物醫(yī)藥研發(fā)大數據應用
(1)蛋白質組數據分析研究:基于大數據技術的發(fā)展與應用,已有許多具有創(chuàng)新性的數據分析方法得以廣泛運用,為保證蛋白質組學研究的健康、持續(xù)、高效發(fā)展,需加強不同層面組學數據的綜合分析能力;
(2)單細胞數據分析研究:在當前階段,能夠實現單細胞基因組數據分析的高效、簡潔的方法較少,在單細胞異化分析領域甚至存在大量的分析技術空白;
(3)基因組數據分析研究:通過系統(tǒng)化的數據分析模型建設,實現了對基因組、轉錄組數據的綜合性分析,最終實現生物系統(tǒng)研究向著標準化、深入化方向有效發(fā)展;
(4)宏基因組數據分析研究:生物醫(yī)學方面的宏基因組項目呈現出井噴態(tài)勢,如何通過科學、高效、準確的數據分析進行結果測算是廣大科研人員需面對的首要問題;
(5)生物醫(yī)學圖像數據分析:隨著光學成像儀器和高精度細胞操作技術的進步,生物醫(yī)學圖像相關數據急劇積累,但還缺乏公認的、標準化的生物醫(yī)學圖像存儲和處理平臺;
(6)基因生物學大數據應用:致病基因通路分析,利用大數據分析技術可發(fā)現不同階段、不同位置的遺傳控制因素,從而進行有針對性的治療;序列相似性分析,使用非線性相關統(tǒng)計法、神經網絡、分類及聚類算法進行相似性分析可以發(fā)現核酸序列之間的異同點。
2.臨床醫(yī)學大數據應用
(1)致病因素關聯分析:通過檢索病案數據庫中大量的病人病情信息以及病人的個人信息,使用聚類分析算法進行分析,以發(fā)現某疾病與外在環(huán)境因素的潛在關系,指導患者關注這些致病因素,有效預測疾病,降低疾病發(fā)生率;
(2)提高診斷準確率:疾病的致病因素錯綜復雜,而且不同階段癥狀各不相同,不同疾病之間有時會具有高度相似的病癥特征,大數據分析技術可應用于疾病快速高效的病情診斷。Kusiak等使用大數據處理的相關算法對實體性肺結節(jié)進行診斷,準確率高達100%;
(3)疾病預測應用:診療大數據可為某種疾病的發(fā)病史以地區(qū)分布性提供線索;可對疾病的遺傳性和非遺傳性進行分析,為治療人員提供相應防治措施;可對某些疾病發(fā)展趨勢進行預測;還是對傳染性疾病進行預測、預警的利器;
(4)醫(yī)學影像應用:在醫(yī)學領域的影像(如CT、MRI)分析中,采用大數據分析技術能夠對所得出的影像結果進行分析,進而對病人的疾病做出正確的診斷;
(5)藥物副作用分析應用:采用大數據分析技術,通過互聯網對各家醫(yī)院所出現的藥物不良反應進行挖掘,使醫(yī)護人員在用藥時提高警惕,保證病人合理用藥。
3.健康醫(yī)療行業(yè)/生物醫(yī)藥產業(yè)大數據應用
(1)健康醫(yī)療行業(yè)治理大數據:居民健康狀況等重要數據的精準統(tǒng)計和預測評價,有力支撐健康中國建設規(guī)劃和決策;醫(yī)院評價體系,完善現代醫(yī)院管理制度,優(yōu)化醫(yī)療衛(wèi)生資源布局;對醫(yī)療、藥品、耗材等收入構成及變化趨勢的監(jiān)測機制;
(2)公共衛(wèi)生大數據應用:公共衛(wèi)生業(yè)務信息系統(tǒng)建設;疾病敏感信息預警機制,提高突發(fā)公共衛(wèi)生事件預警與應急響應能力;集成多方監(jiān)測數據有效評價影響健康的社會因素;開展重點傳染病、職業(yè)病和醫(yī)學媒介生物監(jiān)測,有效預防控制重大疾??;
(3)生物醫(yī)藥產業(yè)大數據:準確把脈生物醫(yī)藥產業(yè)發(fā)展狀況,為產業(yè)規(guī)劃制定、引導產業(yè)集聚式發(fā)展提供支撐;為園區(qū)或區(qū)域提供精準招商服務,降低招商成本、提升招商效率;為產業(yè)企業(yè)提供專家人才評估、流動監(jiān)測與預警服務;基于供需精準匹配的創(chuàng)新資源一站式服務,促進生物醫(yī)藥產業(yè)創(chuàng)新服務發(fā)展。
在產業(yè)互聯網快速發(fā)展基礎之上,大數據中臺建設將加速產業(yè)鏈各環(huán)節(jié)數據積累與集聚,大數據應用也將有更多的需求場景,為企業(yè)提升效率、降低成本、縮短周期等提供更有效的措施。同時,基于大數據,結合云計算、人工智能、區(qū)塊鏈等新一代信息技術,可進一步促進生物醫(yī)藥產業(yè)發(fā)展與突破。
一、國家大數據戰(zhàn)略
數據是國家基礎性戰(zhàn)略資源,是21世紀的“鉆石礦”。黨的十八屆五中全會提出“實施國家大數據戰(zhàn)略”,國務院印發(fā)《促進大數據發(fā)展行動綱要》、工信部印發(fā)《大數據產業(yè)發(fā)展規(guī)劃(2016-2020年)》,全面推進大數據發(fā)展,加快建設數據強國。
2016年6月,國務院辦公廳印發(fā)《國務院辦公廳關于促進和規(guī)范健康醫(yī)療大數據應用發(fā)展的指導意見》,文件指出健康醫(yī)療大數據應用發(fā)展將帶來健康醫(yī)療模式的深刻變化,有利于提升健康醫(yī)療服務效率和質量。
生物醫(yī)藥產業(yè)鏈主要包括原料藥供應、生產研發(fā)、外包服務、醫(yī)藥商業(yè)、醫(yī)療服務、產業(yè)服務、金融服務、會展服務、數據服務、產業(yè)媒體等。
圖 生物醫(yī)藥產業(yè)鏈圖譜;
現階段,生物醫(yī)藥大數據主要來源于生產研發(fā)、醫(yī)療服務、產業(yè)服務三個版塊:
研發(fā)數據:主要指藥企或科研機構進行研發(fā)獲得的數據,包括從先導化合物篩選、臨床前、I-III期臨床、IV期臨床、上市后療效副作用跟蹤等數據;
醫(yī)療服務數據:主要指患者就醫(yī)產生的數據,如病例數據、檢查數據、用藥選擇等;還包括患者行為和感官數據,如家族病史及可穿戴設備、即時監(jiān)控設備采集的健康數據;健康醫(yī)療行業(yè)數據,如監(jiān)管數據、醫(yī)院評價數據、公共衛(wèi)生數據等;
產業(yè)數據:主要是指生物醫(yī)藥產業(yè)企業(yè)、人才、藥品器械、投融資等數據。
1.生物醫(yī)藥研發(fā)大數據應用
(1)蛋白質組數據分析研究:基于大數據技術的發(fā)展與應用,已有許多具有創(chuàng)新性的數據分析方法得以廣泛運用,為保證蛋白質組學研究的健康、持續(xù)、高效發(fā)展,需加強不同層面組學數據的綜合分析能力;
(2)單細胞數據分析研究:在當前階段,能夠實現單細胞基因組數據分析的高效、簡潔的方法較少,在單細胞異化分析領域甚至存在大量的分析技術空白;
(3)基因組數據分析研究:通過系統(tǒng)化的數據分析模型建設,實現了對基因組、轉錄組數據的綜合性分析,最終實現生物系統(tǒng)研究向著標準化、深入化方向有效發(fā)展;
(4)宏基因組數據分析研究:生物醫(yī)學方面的宏基因組項目呈現出井噴態(tài)勢,如何通過科學、高效、準確的數據分析進行結果測算是廣大科研人員需面對的首要問題;
(5)生物醫(yī)學圖像數據分析:隨著光學成像儀器和高精度細胞操作技術的進步,生物醫(yī)學圖像相關數據急劇積累,但還缺乏公認的、標準化的生物醫(yī)學圖像存儲和處理平臺;
(6)基因生物學大數據應用:致病基因通路分析,利用大數據分析技術可發(fā)現不同階段、不同位置的遺傳控制因素,從而進行有針對性的治療;序列相似性分析,使用非線性相關統(tǒng)計法、神經網絡、分類及聚類算法進行相似性分析可以發(fā)現核酸序列之間的異同點。
2.臨床醫(yī)學大數據應用
(1)致病因素關聯分析:通過檢索病案數據庫中大量的病人病情信息以及病人的個人信息,使用聚類分析算法進行分析,以發(fā)現某疾病與外在環(huán)境因素的潛在關系,指導患者關注這些致病因素,有效預測疾病,降低疾病發(fā)生率;
(2)提高診斷準確率:疾病的致病因素錯綜復雜,而且不同階段癥狀各不相同,不同疾病之間有時會具有高度相似的病癥特征,大數據分析技術可應用于疾病快速高效的病情診斷。Kusiak等使用大數據處理的相關算法對實體性肺結節(jié)進行診斷,準確率高達100%;
(3)疾病預測應用:診療大數據可為某種疾病的發(fā)病史以地區(qū)分布性提供線索;可對疾病的遺傳性和非遺傳性進行分析,為治療人員提供相應防治措施;可對某些疾病發(fā)展趨勢進行預測;還是對傳染性疾病進行預測、預警的利器;
(4)醫(yī)學影像應用:在醫(yī)學領域的影像(如CT、MRI)分析中,采用大數據分析技術能夠對所得出的影像結果進行分析,進而對病人的疾病做出正確的診斷;
(5)藥物副作用分析應用:采用大數據分析技術,通過互聯網對各家醫(yī)院所出現的藥物不良反應進行挖掘,使醫(yī)護人員在用藥時提高警惕,保證病人合理用藥。
3.健康醫(yī)療行業(yè)/生物醫(yī)藥產業(yè)大數據應用
(1)健康醫(yī)療行業(yè)治理大數據:居民健康狀況等重要數據的精準統(tǒng)計和預測評價,有力支撐健康中國建設規(guī)劃和決策;醫(yī)院評價體系,完善現代醫(yī)院管理制度,優(yōu)化醫(yī)療衛(wèi)生資源布局;對醫(yī)療、藥品、耗材等收入構成及變化趨勢的監(jiān)測機制;
(2)公共衛(wèi)生大數據應用:公共衛(wèi)生業(yè)務信息系統(tǒng)建設;疾病敏感信息預警機制,提高突發(fā)公共衛(wèi)生事件預警與應急響應能力;集成多方監(jiān)測數據有效評價影響健康的社會因素;開展重點傳染病、職業(yè)病和醫(yī)學媒介生物監(jiān)測,有效預防控制重大疾?。?/p>
(3)生物醫(yī)藥產業(yè)大數據:準確把脈生物醫(yī)藥產業(yè)發(fā)展狀況,為產業(yè)規(guī)劃制定、引導產業(yè)集聚式發(fā)展提供支撐;為園區(qū)或區(qū)域提供精準招商服務,降低招商成本、提升招商效率;為產業(yè)企業(yè)提供專家人才評估、流動監(jiān)測與預警服務;基于供需精準匹配的創(chuàng)新資源一站式服務,促進生物醫(yī)藥產業(yè)創(chuàng)新服務發(fā)展。
在產業(yè)互聯網快速發(fā)展基礎之上,大數據中臺建設將加速產業(yè)鏈各環(huán)節(jié)數據積累與集聚,大數據應用也將有更多的需求場景,為企業(yè)提升效率、降低成本、縮短周期等提供更有效的措施。同時,基于大數據,結合云計算、人工智能、區(qū)塊鏈等新一代信息技術,可進一步促進生物醫(yī)藥產業(yè)發(fā)展與突破。