<noscript id="wwww0"><dd id="wwww0"></dd></noscript>
<nav id="wwww0"><code id="wwww0"></code></nav>
      • <small id="wwww0"></small><sup id="wwww0"><cite id="wwww0"></cite></sup>
      • <sup id="wwww0"></sup>

        911国产在线专区,国产精品亚洲片在线va,亚洲欧美国产天堂,按摩喷潮在线播放无码,国产口爆吞精视频网站,比较有韵味的熟妇无码

         
         

        生物醫(yī)學大數(shù)據(jù)發(fā)展的新挑戰(zhàn)與趨勢

        發(fā)布時間:2018-09-07 11:49:40  |  來源:中國網(wǎng)·中國發(fā)展門戶網(wǎng)  |  作者:張國慶 李亦學 王澤峰 趙國屏  |  責任編輯:趙斌宇
        關鍵詞:生物醫(yī)學,大數(shù)據(jù),整合,交互,數(shù)據(jù)挖掘

        數(shù)據(jù)標準與質量控制

        生物醫(yī)學大數(shù)據(jù)的數(shù)據(jù)標準包括術語集、數(shù)據(jù)標準、綜合標準等。典型的術語集包括基因本體?GO、人類表型本體?HPO等,序列最簡描述信息標準集包括?MIxS?與?MIGS以及?ICD10、SNOMED-CT等醫(yī)學數(shù)據(jù)標準。生命科學領域的數(shù)據(jù)標準大多由有國際影響力的機構或協(xié)會率先提出,伴隨配套的數(shù)據(jù)解析或分析軟件,逐步得到學術界的認可。例如:由國際核酸序列數(shù)據(jù)庫協(xié)會(INSDC)定義的“The DDBJ/ENA/GenBank Feature Table Definition”是?NCBI、EBI?等數(shù)據(jù)中心最早的核酸序列數(shù)據(jù)標準,以及基因組拼接數(shù)據(jù)標準;EBI?和?NCBI?等定義的基因芯片實驗數(shù)據(jù)標準?MIAME、GEO,F(xiàn)GED?定義的二代測序數(shù)據(jù)標準?MINSEQE,以及拼接文件格式?BAM、變異文件格式?VCF、遺傳特征描述格式?GFF3等,醫(yī)學領域得到最為廣泛認可的數(shù)據(jù)標準是醫(yī)學影像標準?DICOM。醫(yī)學領域的標準比生命科學領域的數(shù)據(jù)標準要復雜得多,規(guī)范化程度也更高。醫(yī)學領域的標準大多需要經(jīng)過立項、草案、發(fā)布等階段,得到了更為廣泛的認可,如國際標準化組織健康信息學標準化技術委員會的?ISO/TC 215?系列標準、HL7(衛(wèi)生信息用戶層,ISO?定義的信息交換7層協(xié)議規(guī)范中的第七層)、臨床數(shù)據(jù)交換標準協(xié)會?CDISC等;標準的范圍也遠比生命科學領域的數(shù)據(jù)標準復雜,包括詞匯術語、數(shù)據(jù)描述、技術操作、應用服務和醫(yī)療管理等。

        生命科學的標準主要集中在術語集和數(shù)據(jù)標準,不同的標準之間相對獨立,對數(shù)據(jù)產(chǎn)出過程、分析過程的規(guī)范性表述較少。醫(yī)學的數(shù)據(jù)標準更強調(diào)互操作、互聯(lián)互通等,不同的標準自成體系,但是對支撐科研的數(shù)據(jù)標準的描述反而較少。因此,生物醫(yī)學大數(shù)據(jù)亟待加強臨床科研的數(shù)據(jù)標準體系的建設,以及數(shù)據(jù)分析過程的操作相關的標準的建設。

        數(shù)據(jù)質量控制受到數(shù)據(jù)產(chǎn)出、數(shù)據(jù)分析的影響,不同的數(shù)據(jù)質控有所差別。芯片、基因組數(shù)以美國食品藥品監(jiān)督管理局(FDA)主導的?MAQC、MAQC-II、MAQC-III?等,由于獨立于技術系統(tǒng)之前,得到了較為廣泛的認可。蛋白質組的數(shù)據(jù)質控,缺少與?MAQC?相匹配的大項目,而是主要通過?PRIDE、iPROX?等數(shù)據(jù)匯交平臺的質控工具來體現(xiàn)。數(shù)據(jù)質量控制需要提供參考數(shù)據(jù)集作為基準,包括實驗方法產(chǎn)出的原始數(shù)據(jù)與參考數(shù)據(jù)集的吻合情況,以及數(shù)據(jù)分析形成的分析結果與參考數(shù)據(jù)集的吻合情況。因此,針對有廣泛用途或者重要用途的數(shù)據(jù)類型,建設參考數(shù)據(jù)集、參考數(shù)據(jù)分析流程,是數(shù)據(jù)質量控制的關鍵環(huán)節(jié),也是生物醫(yī)學大數(shù)據(jù)平臺的重要建設內(nèi)容。

        我們正在建設以組學數(shù)據(jù)百科全書——NODE為代表的開放式基礎性平臺,并達到了一定的數(shù)據(jù)規(guī)模。其中,在整合存儲方面,數(shù)據(jù)平臺與數(shù)據(jù)庫包括以微生物組大數(shù)據(jù)平臺為代表的領域示范平臺,以駱駝基因組變異數(shù)據(jù)庫、可翻譯轉錄組?RNA?數(shù)據(jù)庫等為代表的專題數(shù)據(jù)庫。在交互共享方面,正在向?NODE?系統(tǒng)集成全基因組、外顯子組、轉錄組等常規(guī)組學數(shù)據(jù)分析流程,微生物?16S?RNA、宏基因組、微生物功能注釋等領域組學數(shù)據(jù)分析流程。在前沿信息技術方面,利用?GPU?技術對轉錄組、宏基因組等組學數(shù)據(jù)拼接、映射等高資源消耗的環(huán)節(jié)進行優(yōu)化。在標準質控方面,開展了包括描述信息和原始數(shù)據(jù)在內(nèi)的質量控制,并建立了自動化的質控流程,將實現(xiàn)數(shù)據(jù)匯交時就自動完成質控評估的功能。

        面對生物醫(yī)學大數(shù)據(jù)的挑戰(zhàn),建立全面支撐生命科學研究數(shù)據(jù)與健康醫(yī)學大數(shù)據(jù)的匯交、管理、共享與挖掘的技術與資源體系,形成以遞交為基礎、以整合為導向的數(shù)據(jù)存儲中心,以主題為基礎、以交互為導向的數(shù)據(jù)共享中心,以及以傳統(tǒng)信息技術為基礎、以前沿信息技術為導向的下一代生命科學數(shù)據(jù)轉化中心,將有效地支撐生物醫(yī)學、健康醫(yī)療等領域的基礎研究、應用研究和產(chǎn)業(yè)示范。(作者:張國慶 李亦學 王澤峰 趙國屏 中國科學院計算生物學重點實驗室生物醫(yī)學大數(shù)據(jù)中心 中國科學院-馬普學會計算生物學伙伴研究所 中國科學院上海生命科學研究院(上海營養(yǎng)與健康研究院)中國科學院大學 上海 上海生物信息技術研究中心 上海。《中國科學院院刊》供稿)

         

        <  1  2  3  


        返回頂部
        911国产在线专区
        <noscript id="wwww0"><dd id="wwww0"></dd></noscript>
        <nav id="wwww0"><code id="wwww0"></code></nav>
          • <small id="wwww0"></small><sup id="wwww0"><cite id="wwww0"></cite></sup>
          • <sup id="wwww0"></sup>