醫(yī)療與健康應(yīng)該放在同樣重要的位置,。事實上,,疾病防治關(guān)口前移,能大大節(jié)省對醫(yī)療資源的消耗,。數(shù)據(jù)分析有助于對老百姓進行健康教育,,提升疾病預(yù)防效果。盡管在醫(yī)療領(lǐng)域,,國內(nèi)還處于數(shù)據(jù)原始積累階段,,但嘗試著用數(shù)據(jù)挖掘開發(fā)項目和產(chǎn)品來占領(lǐng)先機也未嘗不可。 2009年,,谷歌曾因成功預(yù)測冬季流感的傳播,,從而刮起了一陣大數(shù)據(jù)變革公共衛(wèi)生的浪潮。近來,谷歌公布消息,,Google X最新孵化了一個名為Baseline的醫(yī)療健康項目,,用大數(shù)據(jù)來預(yù)防癌癥。該項目被認為可能是谷歌有史以來最具野心,,也是最困難的項目,。 收集健康數(shù)據(jù)預(yù)防疾病 根據(jù)《華爾街日報》的報道,谷歌認為,,多數(shù)已經(jīng)發(fā)現(xiàn)的生物標簽都與晚期疾病有關(guān),,因為這種研究普遍集中于病人。但是,,利用現(xiàn)有數(shù)據(jù)盡早判斷疾病的效果不佳,。而Baseline旨在幫助研究人員更早地發(fā)現(xiàn)心臟病和癌癥的各種跡象,進而推廣預(yù)防措施,,并不僅僅把精力放在治療上,。 為了完成這一項目,谷歌將從175人那里匿名搜集基因和分子信息,,之后還會再搜集數(shù)千人的相關(guān)數(shù)據(jù),。目的在于全面描繪健康人的身體究竟應(yīng)該是何模樣。 收集的內(nèi)容包括尿液,、血液,、唾液和眼淚等體液,數(shù)據(jù)將包括參與者的整個基因組,、父母的遺傳史信息,,以及他們?nèi)绾未x食物、營養(yǎng)和藥物,,在壓力之下他們心跳速度,,化學(xué)反應(yīng)如何改變他們的基因行為。這項研究還將創(chuàng)建一個參與者組織樣本的知識庫,。 之后,,谷歌便會利用其龐大的計算能力來尋找這些信息中隱藏的“生物標記”,從而幫助醫(yī)療研究人員提前發(fā)現(xiàn)疾病,。 例如,,該研究可能會發(fā)現(xiàn)一些能夠幫助人們分解高脂肪食物的生物標記。擁有這些生物標記的人,,可以將患上高膽固醇和心臟病的時間延后,,而沒有這類生物標記的人則可能更早患上心臟病。一旦Baseline發(fā)現(xiàn)了這一標記后,,研究人員便可通過檢查了解哪些人缺乏這類標記,,并幫助他們糾正習(xí)慣,,或者開發(fā)出新的治療方法,幫助其更好地分解高脂肪食物,。 如何定義“健康” 在醫(yī)療領(lǐng)域,,主流的科學(xué)研究旨在精確定位與某種疾病相對應(yīng)的生物標記,從而作為疾病預(yù)測,、診斷的依據(jù),。在中國科學(xué)院北京基因組研究所副研究員聶凌虎看來,Baseline放棄了傳統(tǒng)醫(yī)學(xué)精確“打擊”的思路,,而是利用海量儲存和計算能力對人體內(nèi)所有的基因和分子信息進行轟炸式搜索,。依據(jù)數(shù)據(jù)統(tǒng)計,得到健康人群的人體結(jié)構(gòu)數(shù)據(jù),,進而找出比對個體所有分子層面的異常,。 他告訴《中國科學(xué)報》記者,與已知疾病相關(guān)的生物標記只是異常中的一小部分,,如果將關(guān)注的異常參數(shù)范圍擴大,,或許就可以找到病灶出現(xiàn)前的蛛絲馬跡。 “過去,,醫(yī)學(xué)往往關(guān)注的是疾病患者為什么患病,,而谷歌想做的是,搞清楚健康人群究竟是如何保持健康的,,并想方設(shè)法讓那些非健康狀態(tài)的人群(不一定是疾病患者)調(diào)整到健康狀態(tài)?!?/P> 聶凌虎認為,,谷歌有全球最大的計算機和數(shù)據(jù)中心,可以迅速提供搜索結(jié)果,、運行大量數(shù)據(jù)的服務(wù),,龐大的數(shù)據(jù)網(wǎng)絡(luò)有能力用于存儲和計算醫(yī)療信息,可以為該項目運行提供支持,。 目前,,Baseline項目研究還處于探索階段,但它首先面臨如何定義“健康”的問題,。 “一個唐氏綜合征患兒的母親可能認為她的孩子是健康的,,一個人致殘后可能會適應(yīng)生活并重新定義健康。Baseline定義健康也會面臨同樣的問題,。目前與Baseline相關(guān)的報道尚沒有足夠信息顯示谷歌是如何定義健康的,。”芝加哥大學(xué)衛(wèi)生促進研究中心博士后,、衛(wèi)生經(jīng)濟學(xué)者陳茁在接受《中國科學(xué)報》記者采訪時表示,。 “另一個問題是數(shù)據(jù)的代表性和不同人群的差異,。”陳茁說道,,“幾千個參試個體難以代表所有人群,,特別是不同人群對環(huán)境、氣候有著不同的生理上的適應(yīng)反應(yīng),。比如藏區(qū)原住民攜帶EPAS1基因的一種變異從而能夠應(yīng)對相對低氧的環(huán)境,;鐮刀型紅血球疾病的出現(xiàn)在某種程度上是人群對瘧疾的應(yīng)對?!?/P> 此外,,他還表示,基因,、分子層面的缺陷只是疾病發(fā)生的一部分,,行為和環(huán)境因素對健康的影響也相當(dāng)重要。當(dāng)下人體各項參數(shù)正常,,并不代表未來一定不會得病,,反之亦然。因此,,當(dāng)前,,疾病預(yù)測、預(yù)防還無法做到準確可靠,。 “谷歌流感趨勢”缺陷 事實上,,谷歌在醫(yī)療大數(shù)據(jù)預(yù)測方面的嘗試早在2009年就開始了,“谷歌流感趨勢”項目準確預(yù)測了2009年的流感流行,,反響巨大,。但人們有所不知的是,“谷歌流感趨勢”之后的表現(xiàn)并不盡如人意,。在2011 年至2013 年間,,該項目多數(shù)高估了類流感發(fā)病率。陳茁曾撰文分析了其中的原因,。 該項目背后的原理似乎很簡單:如果某地流感開始流行,,那么相關(guān)疾病的谷歌搜索就會增多。但現(xiàn)實遠比原理復(fù)雜,。 陳茁解釋,,谷歌搜索的結(jié)果和使用者人群“自我估計”的流感發(fā)病率相關(guān)。但在現(xiàn)實中,,普通感冒在不同個體身上的嚴重程度上會有差別,,有些患者因為擔(dān)心,便搜索了相關(guān)信息,。這些搜索構(gòu)成了類流感“自我估計”中的“噪聲”,。如果只用“谷歌流感趨勢”預(yù)測流感發(fā)病率就會存在問題,。 他認為“谷歌流感趨勢”項目失誤的另外一個原因是在數(shù)據(jù)分析方面存在欠缺。哈佛大學(xué)GaryKing和搭檔的研究就指出了谷歌項目在分析上的不足,。首先,,這個項目沒有盡可能利用傳統(tǒng)的統(tǒng)計分析手段來剔除系統(tǒng)誤差,比如殘差的自相關(guān)性和季節(jié)性,;其次,,“谷歌流感趨勢”忽略了其他數(shù)據(jù)的作用。如果結(jié)合美國疾控中心的數(shù)據(jù),,谷歌的預(yù)測其實有可能被大大改善,。 隱私安全風(fēng)險 盡管這些項目還存在缺陷,陳茁認為這并不足以否定大數(shù)據(jù)對國民健康的潛在貢獻,。美國卡羅來那醫(yī)療系統(tǒng)(Carolinas Healthcare System)已經(jīng)嘗試用信用卡數(shù)據(jù)輔助其他數(shù)據(jù)預(yù)測急診使用概率,,以及用臨床數(shù)據(jù)預(yù)測再入院率?!爸皇?,任何新生事物都有一個發(fā)展的過程。大數(shù)據(jù)預(yù)測功能在醫(yī)療上的價值想要達到人們理想中的要求恐怕還需假以時日,?!?/P> 但也有觀點指出,目前國內(nèi)醫(yī)療問題還沒有解決,,談健康顯得有點“奢侈”,,還是應(yīng)該把焦點放在醫(yī)療上。 聶凌虎并不這么認為,?!搬t(yī)療與健康應(yīng)該放在同樣重要的位置。事實上,,疾病防治關(guān)口前移,能大大節(jié)省對醫(yī)療資源的消耗,?!甭櫫杌⒄f,“數(shù)據(jù)分析有助于對老百姓進行健康教育,,提升疾病預(yù)防效果,。” 陳茁也表示,,雖然在醫(yī)療領(lǐng)域國內(nèi)還處于數(shù)據(jù)原始積累階段,,但嘗試著用數(shù)據(jù)挖掘開發(fā)項目和產(chǎn)品來占領(lǐng)先機也未嘗不可,當(dāng)然,,具體項目需要具體評估,。不僅如此,,他還提到,政府和行業(yè)組織在標準化方面應(yīng)該先行一步,,吸收國外的經(jīng)驗和教訓(xùn),,以免將來面臨多個數(shù)據(jù)標準互不兼容的問題。 此外,,陳茁強調(diào),,在醫(yī)療大數(shù)據(jù)領(lǐng)域需要格外注意隱私及附帶的數(shù)據(jù)安全問題。 谷歌掌握上千人的身體結(jié)構(gòu),,小到細胞內(nèi)部的分子,,未來,這些數(shù)據(jù)對于保險公司而言非常寶貴,,它們可以利用這些數(shù)據(jù)降低風(fēng)險,。 對此,谷歌表示,,Baseline采用的是匿名方式,,搜集的數(shù)據(jù)也僅限于醫(yī)療目的。這些數(shù)據(jù)不會與保險公司分享,。Baseline還將由機構(gòu)審查委員會進行監(jiān)測,,監(jiān)督所有涉及人類的醫(yī)學(xué)研究行為。一旦開啟全面研究,,委員會將由杜克大學(xué)和斯坦福大學(xué)醫(yī)學(xué)院組成,,監(jiān)控如何使用這些信息。 “即便如谷歌所言,,項目參與人群的社會安全號和其他可能確定個人身份的信息不會被傳送到谷歌,,Baseline測量的大量的生物標記也使確定個人身份成為可能?!痹陉愖驴磥?,為保證個人身份安全,對數(shù)據(jù)安全也將提出更高要求,。
|
【打印本頁】 |