首頁(yè)> 中國(guó)發(fā)展門(mén)戶網(wǎng)> 本網(wǎng)獨(dú)家>

人工智能驅(qū)動(dòng)的科學(xué)研究新范式：從?AI4S到智能科學(xué)

2023-05-11 15:21

來(lái)源：中國(guó)網(wǎng)·中國(guó)發(fā)展門(mén)戶網(wǎng)

分享到：

鏈接已復(fù)制

字體：小大

中國(guó)網(wǎng)/中國(guó)發(fā)展門(mén)戶網(wǎng)訊在全球迎來(lái)前所未有之大變局的時(shí)代背景之下， ChatGPT在2022年底一經(jīng)推出便掀起新一輪人工智能（AI）浪潮。以?ChatGPT?為代表的大模型技術(shù)影響空前深遠(yuǎn)，正推動(dòng)?AI技術(shù)從特定應(yīng)用和游戲等領(lǐng)域進(jìn)入人們?nèi)粘Ｉ睿蔀榍星袑?shí)實(shí)的生產(chǎn)力工具，人類社會(huì)的智能化革命已經(jīng)拉開(kāi)帷幕。

圖靈獎(jiǎng)得主?Jim Gary?認(rèn)為科學(xué)研究經(jīng)歷了經(jīng)驗(yàn)范式、理論范式、計(jì)算范式、數(shù)據(jù)驅(qū)動(dòng)范式等?4種范式。當(dāng)前，許多科學(xué)家認(rèn)為科學(xué)研究正在迎來(lái)新的范式，即第五范式。第五范式以虛實(shí)交互、平行驅(qū)動(dòng)的?AI技術(shù)為核心，以智聯(lián)網(wǎng)和區(qū)塊鏈構(gòu)建基礎(chǔ)，考慮人的價(jià)值和知識(shí)的融入。在產(chǎn)業(yè)方面，第五范式也稱為工業(yè)?5.0。而?AI?驅(qū)動(dòng)的科學(xué)研究（AI for Science，AI4S），更是新范式在基礎(chǔ)科研的深度體現(xiàn)。

近期，科學(xué)技術(shù)部會(huì)同國(guó)家自然科學(xué)基金委員會(huì)啟動(dòng)“人工智能驅(qū)動(dòng)的科學(xué)研究”（AI for Science）專項(xiàng)部署。本文通過(guò)概述?AI4S?發(fā)展現(xiàn)狀、分析典型?AI?應(yīng)用范例，進(jìn)一步探討?AI4S范式創(chuàng)新之路。

AI4S發(fā)展現(xiàn)狀簡(jiǎn)述

近幾年來(lái)，在深度學(xué)習(xí)等?AI?技術(shù)的推動(dòng)下，AI4S?在數(shù)學(xué)、物理學(xué)、生物醫(yī)學(xué)、材料科學(xué)等領(lǐng)域取得了許多令人矚目的成績(jī)。

數(shù)學(xué)領(lǐng)域。2017?年以來(lái)，科學(xué)家嘗試使用機(jī)器學(xué)習(xí)、ResNet、seq2seq?模型等技術(shù)求解偏微分方程，獲得了更快更準(zhǔn)的結(jié)果。2021?年，DeepMind開(kāi)發(fā)了啟發(fā)數(shù)學(xué)家直覺(jué)靈感的機(jī)器學(xué)習(xí)框架，幫助數(shù)學(xué)家和?AI?研究人員在?Knots?理論方面發(fā)現(xiàn)新定理，證明了已提出?40?年之久的?Kazhdan-Lusztig?多項(xiàng)式。2022?年?10?月，同樣是?DeepMind?在?Nature?發(fā)文，推出在?AlphaZero（前身是著名的?AlphaGo）基礎(chǔ)上開(kāi)發(fā)的AlphaTensor，并通過(guò)強(qiáng)化學(xué)習(xí)找到了矩陣相乘的最快算法。DeepMind?的系列工作，為?AI?驅(qū)動(dòng)的數(shù)學(xué)研究（AI for Math）提供了可供參考的新范式。

物理領(lǐng)域。AI?方法除了用于實(shí)驗(yàn)數(shù)據(jù)處理和分析之外，還幫助科學(xué)家設(shè)計(jì)實(shí)驗(yàn)、優(yōu)化參數(shù)。20世紀(jì)?90?年代，高能與核物理學(xué)界就使用神經(jīng)網(wǎng)絡(luò)和符號(hào)?AI?輔助研究。2014?年，人工神經(jīng)網(wǎng)絡(luò)贏得了?ATLAS?實(shí)驗(yàn)中識(shí)別希格斯玻色子的挑戰(zhàn)。2015?年，歐洲核子研究組織?CERN?成立了機(jī)器學(xué)習(xí)工作組來(lái)處理大型強(qiáng)子對(duì)撞機(jī)（LHC）產(chǎn)生的海量數(shù)據(jù)。2022?年2?月，DeepMind?在?Nature?上發(fā)表了其工作：通過(guò)深度強(qiáng)化學(xué)習(xí)對(duì)托卡馬克等離子體進(jìn)行磁控。2022?年?8?月，物理學(xué)家使用人工神經(jīng)網(wǎng)絡(luò)找到了質(zhì)子中存在隱性內(nèi)含粲夸克（intrinsic charm quarks）的證據(jù)，這一發(fā)現(xiàn)可能會(huì)改寫(xiě)量子色動(dòng)力學(xué)的教科書(shū)。

生物醫(yī)學(xué)領(lǐng)域。AlphaFold?是?AI4S?領(lǐng)域最成功的代表。從?2016?年開(kāi)始，DeepMind?構(gòu)建?AI?系統(tǒng)來(lái)挑戰(zhàn)蛋白質(zhì)三維結(jié)構(gòu)預(yù)測(cè)任務(wù)。AlphaFold?將預(yù)測(cè)誤差縮小到原子尺度，而計(jì)算時(shí)間從數(shù)年縮減到數(shù)分鐘，顯著提升了效率。DeepMind?宣布其?2?億個(gè)蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)向世界各地的科學(xué)家提供開(kāi)放訪問(wèn)，這對(duì)加速藥物研究具有重大意義。除?AlphaFold?外，華盛頓大學(xué)開(kāi)發(fā)的?RoseTTAFold、中國(guó)科學(xué)技術(shù)大學(xué)研發(fā)的?SCUBA等模型，也在該領(lǐng)域不斷突破。

材料科學(xué)領(lǐng)域。2011?年，美國(guó)提出“材料基因組計(jì)劃”（MGI），旨在解碼材料的不同組成成分和性能的對(duì)應(yīng)關(guān)系，借助高通量計(jì)算、大數(shù)據(jù)、AI等技術(shù)，有效縮短了材料研發(fā)周期、降低了研發(fā)成本。2016?年?Nature?發(fā)布了美國(guó)哈弗福德學(xué)院和普渡大學(xué)的研究成果，科研人員利用機(jī)器學(xué)習(xí)算法，用“失敗”的實(shí)驗(yàn)數(shù)據(jù)預(yù)測(cè)了新材料合成，這啟示機(jī)器學(xué)習(xí)等?AI?技術(shù)成為材料科學(xué)的重要研究方式。

正如我們所見(jiàn)，AI?在科學(xué)研究中的角色隨著深度學(xué)習(xí)的繁榮而發(fā)生了變化。早期，AI?方法只是作為輔助工具，幫助分析實(shí)驗(yàn)數(shù)據(jù)。如今，AI?方法已成為更復(fù)雜任務(wù)（如定理證明、結(jié)構(gòu)設(shè)計(jì)和知識(shí)發(fā)現(xiàn)）實(shí)現(xiàn)過(guò)程中的關(guān)鍵技術(shù)。AI?還在不斷拓展學(xué)科領(lǐng)域，“人工智能驅(qū)動(dòng)的科學(xué)研究”專項(xiàng)部署重點(diǎn)面向數(shù)學(xué)、物理學(xué)、化學(xué)、天文學(xué)等基礎(chǔ)學(xué)科，必將為這些學(xué)科快速發(fā)展帶來(lái)新契機(jī)。

熱點(diǎn)背后的AI范式分析

在算法、數(shù)據(jù)、算力三大引擎的驅(qū)動(dòng)下，深度學(xué)習(xí)時(shí)代下的?AI?研究進(jìn)展迅速，AlphaGo、AlphaFold、ChatGPT?等成為?AI?發(fā)展歷史上一座座里程碑。分析這些案例特點(diǎn)，總結(jié)成功經(jīng)驗(yàn)，對(duì)于?AI?后續(xù)的創(chuàng)新和應(yīng)用具有十分重要的啟發(fā)意義。

AlphaFold?研究范式

DeepMind?推出的?AlphaFold?系列是?AI4S?的最成功的代表之一，尤其是第二代?AlphaFold2?在?2020?年全球蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)比賽（CASP14）中拔得頭籌，蛋白質(zhì)三維結(jié)構(gòu)預(yù)測(cè)準(zhǔn)確性接近實(shí)驗(yàn)結(jié)果。AlphaFold2?的目標(biāo)是根據(jù)輸入的一維氨基酸序列預(yù)測(cè)蛋白質(zhì)的三維結(jié)構(gòu)，其成功可以歸因于領(lǐng)域知識(shí)與深度學(xué)習(xí)前沿技術(shù)的融合。

從深度學(xué)習(xí)的角度來(lái)看，AphaFold?2?有?3?個(gè)亮點(diǎn)。① AlphaFold?2?淘汰了第一代所采用的卷積神經(jīng)網(wǎng)絡(luò)（CNN）特征提取結(jié)構(gòu)，替換為基于注意力機(jī)制的性能更強(qiáng)的Evoformer。② AlphaFold?2?不是簡(jiǎn)單的單向處理流程，而是采用了循環(huán)迭代優(yōu)化。③ AlphaFold?2?同時(shí)使用帶標(biāo)簽和未帶標(biāo)簽的數(shù)據(jù)進(jìn)行網(wǎng)絡(luò)訓(xùn)練，并融入含噪自蒸餾處理。整體來(lái)看，AlphaFold?2?是一個(gè)包含多種算法和學(xué)習(xí)策略的系統(tǒng)化方法。

從知識(shí)融合的角度來(lái)看，相對(duì)于神經(jīng)網(wǎng)絡(luò)模型層面的創(chuàng)新，多元知識(shí)的表示和融合在?AphaFold?2?中扮演著更為關(guān)鍵的角色。①蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)是一個(gè)專業(yè)方向，科學(xué)家通過(guò)數(shù)十年的研究積累了寶貴的知識(shí)和數(shù)據(jù)。ApphaFold?2?使用了?2?種類型的數(shù)據(jù)集：一種是序列數(shù)據(jù)集，如?UniRef?90、BFD、MGnify?等。基于“同一位置的氨基酸在物種間是不變的，2?個(gè)不同位置的氨基酸同步變化”這一領(lǐng)域知識(shí)，AlphaFold?2?從遺傳序列數(shù)據(jù)庫(kù)中搜索并構(gòu)建多序列比對(duì)（MSAs），而?MSA?的質(zhì)量決定了 ApphaFold?2?的預(yù)測(cè)準(zhǔn)確性；另一種是結(jié)構(gòu)數(shù)據(jù)集，如?PDB?和?PDB70?等。ApphaFold?2?從這些結(jié)構(gòu)數(shù)據(jù)集中搜索并構(gòu)建殘基之間關(guān)系的配對(duì)（pair）表示。通過(guò)這種方式，一維氨基酸序列通過(guò)領(lǐng)域知識(shí)和數(shù)據(jù)集進(jìn)行擴(kuò)充，形成?2?個(gè)二維關(guān)系表示。② Evoformer?接收?MSA?和?Pair?表示，在行、列?2?個(gè)維度進(jìn)行注意力計(jì)算，完成?2?種表示的交叉融合。需要注意的是，在配對(duì)（pair）表示的注意力計(jì)算中引入了幾何知識(shí)，即氨基酸之間的距離要滿足三角不等式約束。③在結(jié)構(gòu)預(yù)測(cè)模塊中，利用三維空間結(jié)構(gòu)平移和旋轉(zhuǎn)等變的知識(shí)，ApphaFold?2?引入了不動(dòng)點(diǎn)注意力（IPA）計(jì)算。根據(jù)?IPA?輸出的殘基相對(duì)位移和旋轉(zhuǎn)，AlphaFold?2?進(jìn)一步預(yù)測(cè)原子的空間位置。④引入?OpenMM?中的?Amber?力場(chǎng)優(yōu)化工具，以確保輸出的三維結(jié)構(gòu)滿足立體化學(xué)約束。

從對(duì)?AphaFold?2?研究范式的分析可以看出，其特點(diǎn)是深度學(xué)習(xí)技術(shù)與各類知識(shí)的有機(jī)融合，涵蓋了知識(shí)、數(shù)據(jù)、算法、算力這?4?種第三代?AI?的核心要素。因此，圍繞深度學(xué)習(xí)，研究知識(shí)獲取、知識(shí)表示、知識(shí)集成、知識(shí)利用，即知識(shí)自動(dòng)化方法，探索“知識(shí)-學(xué)習(xí)”協(xié)同組織形式，開(kāi)發(fā)協(xié)助?AI4S?研究的系統(tǒng)化基礎(chǔ)框架，應(yīng)當(dāng)?shù)玫?AI?界和科學(xué)界的共同重視和大力投入。

ChatGPT?研發(fā)范式

自?2022?年?11?月起，ChatGPT?掀起新一輪?AI?全球浪潮。ChatGPT?因其能夠進(jìn)行多輪對(duì)話、承認(rèn)錯(cuò)誤、反駁錯(cuò)誤前提和拒絕回答不恰當(dāng)?shù)膯?wèn)題而享有盛譽(yù)。ChatGPT?在回答問(wèn)題的準(zhǔn)確性和邏輯完整性方面超越了現(xiàn)有的聊天機(jī)器人，在遵守道德、倫理、法律方面也有很好的表現(xiàn)。ChatGPT?是?OpenAI?近年來(lái)研發(fā)的一系列?GPT?模型在對(duì)話場(chǎng)景的實(shí)例，有?3?個(gè)技術(shù)特征。

ChatGPT?基于大規(guī)模預(yù)訓(xùn)練語(yǔ)言模型，即著名的?GPT-3?系列（GPT-3.5）。在過(guò)去的幾年里，大規(guī)模的預(yù)訓(xùn)練模型發(fā)展迅速。大規(guī)模預(yù)訓(xùn)練模型通過(guò)學(xué)習(xí)大量的公開(kāi)數(shù)據(jù)，將學(xué)習(xí)到的知識(shí)存儲(chǔ)在大規(guī)模參數(shù)之中，不斷刷新多個(gè)領(lǐng)域中多數(shù)任務(wù)的最高性能紀(jì)錄，是通向通用人工智能的可行路徑。

ChatGPT?使用人類反饋強(qiáng)化學(xué)習(xí)（RLHF）在?GPT-3.5?上進(jìn)行微調(diào)。微調(diào)是包含?2?個(gè)數(shù)據(jù)集的過(guò)程，共有?3?步：第一步，由?2?個(gè)?AI?訓(xùn)練師基于給定采樣提示（prompt）通過(guò)對(duì)話生成人類演示數(shù)據(jù)集，用于?GPT-3.5?微調(diào)訓(xùn)練，結(jié)果稱為有監(jiān)督微調(diào)模型（SFT）。第二步，通過(guò)?AI?培訓(xùn)師和聊天機(jī)器人之間的對(duì)話收集比較數(shù)據(jù)集，對(duì)?SFT?模型輸出的多個(gè)結(jié)果，由?AI?培訓(xùn)師給出從最好到最差的打分排序。之后，用這個(gè)排序數(shù)據(jù)集訓(xùn)練強(qiáng)化學(xué)習(xí)的獎(jiǎng)勵(lì)模型，此過(guò)程也是有監(jiān)督的方式。第三步，使用近端策略優(yōu)化（PPO）算法，由獎(jiǎng)勵(lì)模型生成?reward，通過(guò)強(qiáng)化學(xué)習(xí)進(jìn)一步微調(diào)?SFT?模型。第二步和第三步重復(fù)多次，最后得到?PPO?模型，即?ChatGPT。

GPT?模型按照“開(kāi)發(fā)-部署”的理念迭代完善。將初步開(kāi)發(fā)完成的模型部署上線，為用戶提供測(cè)試服務(wù)，由此收集用戶與模型的交互數(shù)據(jù)作為進(jìn)一步優(yōu)化模型的基礎(chǔ)。開(kāi)發(fā)（學(xué)習(xí)）和部署（應(yīng)用）形成閉環(huán)，這種迭代優(yōu)化策略在降低語(yǔ)言模型誤用風(fēng)險(xiǎn)方面起著至關(guān)重要的作用。

ChatGPT?范式再次展示了預(yù)訓(xùn)練大型模型的強(qiáng)大功能，凸顯了人類在引導(dǎo)大模型遵循人類規(guī)則方面的重要作用。由此可見(jiàn)，針對(duì)大模型的微調(diào)、上下文學(xué)習(xí)、指示學(xué)習(xí)、提示學(xué)習(xí)是?AI?的重要研究方向。

探索AI4S研究新范式

AI?本身的研究范式也在不斷轉(zhuǎn)變。自?AI?誕生之初，人們基于幾個(gè)基本假設(shè)（如獨(dú)立同分布、Markov屬性等），使用初級(jí)方法（如?Perceptron等）解決簡(jiǎn)單的問(wèn)題（如簡(jiǎn)單的二元分類、回歸等），并由此產(chǎn)生了?3?種基本范式——監(jiān)督學(xué)習(xí)、無(wú)監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí)。但面對(duì)復(fù)雜問(wèn)題時(shí)，這些基本范式存在局限性。因此，隨著新的算法（BP?算法、分層訓(xùn)練等）和模型（CNN、長(zhǎng)短期記憶人工神經(jīng)網(wǎng)絡(luò)?LSTM?等）的出現(xiàn)，AI?逐漸發(fā)展出主動(dòng)學(xué)習(xí)、遷移學(xué)習(xí)、終身學(xué)習(xí)等新范式。近年來(lái)，AlphaGo?和?ChatGPT?等前沿進(jìn)展以其革命性的成就引領(lǐng)了新一輪的范式轉(zhuǎn)變。從范式轉(zhuǎn)變的角度看待人工智能的發(fā)展，對(duì)促進(jìn)探索?AI4S?創(chuàng)新應(yīng)用具有重要價(jià)值，為此，以下從算法、模型、數(shù)據(jù)、知識(shí)、人的角色等方面進(jìn)行分析。

算法

算法是人工智能的基石。典型?AI?新范式中使用的算法不僅限于機(jī)器學(xué)習(xí)，還涉及整個(gè)人工智能領(lǐng)域，包括搜索和推理。例如，AlphaGo?的主干是蒙特卡洛樹(shù)搜索（MCTS）算法。近年來(lái)出現(xiàn)的新算法，例如受熱力學(xué)啟發(fā)的擴(kuò)散模型（Diffusion Model），在AI生成內(nèi)容（AIGC）領(lǐng)域顯示出巨大潛力。由此可以看出，Science for AI?對(duì)?AI?算法創(chuàng)新也具有重要意義，應(yīng)得到同?AI4S?一樣的重視。

模型

機(jī)器學(xué)習(xí)模型的創(chuàng)新是推動(dòng)人工智能發(fā)展的核心要素。尤其是神經(jīng)網(wǎng)絡(luò)新架構(gòu)：從?M-P?模型到?Perceptron，從?LeNet?到?ResNet，從?LSTM?到?Transformer。AlphaGo?以?CNN?為主干網(wǎng)絡(luò)，用于提取棋局特征、輔助走棋決策和棋局評(píng)估。AlphaFold?2?用Transformer（EvoFormer）替換?CNN?模型，這是其性能相比第一代有巨大提升的主要原因之一。ChatGPT?建立在基礎(chǔ)模型（GPT-3）之上，充分利用了大規(guī)模預(yù)訓(xùn)練語(yǔ)言模型的力量。利用大模型的規(guī)模效應(yīng)，研究利用?prompt?等方法引導(dǎo)大模型釋放內(nèi)在能力，是?AI4S?重要方向之一。

數(shù)據(jù)

數(shù)據(jù)是深度學(xué)習(xí)的三大核心驅(qū)動(dòng)力之一，但存在標(biāo)簽數(shù)量少、標(biāo)注成本高、分布不平衡、隱私保護(hù)等問(wèn)題。主動(dòng)學(xué)習(xí)、溯因?qū)W習(xí)、對(duì)比學(xué)習(xí)、平行學(xué)習(xí)和遷移學(xué)習(xí)等學(xué)習(xí)范式，能夠在一定程度上克服數(shù)據(jù)標(biāo)注的不足；而多任務(wù)學(xué)習(xí)、遷移學(xué)習(xí)、元學(xué)習(xí)和終身學(xué)習(xí)，在一定程度上能克服不同任務(wù)之間存在數(shù)據(jù)不平衡問(wèn)題；聯(lián)邦學(xué)習(xí)可用來(lái)解決數(shù)據(jù)安全和隱私問(wèn)題。

新范式在數(shù)據(jù)的使用方面有更多亮點(diǎn)，Syn2Real和?Sim2Real?等數(shù)據(jù)生成方法得到越來(lái)越多的重視。例如，AlphaGo?首先在人類棋局上訓(xùn)練策略，通過(guò)自我對(duì)弈產(chǎn)生更多的數(shù)據(jù)來(lái)訓(xùn)練更強(qiáng)大的策略網(wǎng)絡(luò)，進(jìn)而產(chǎn)生更多的數(shù)據(jù)來(lái)訓(xùn)練強(qiáng)大的價(jià)值網(wǎng)絡(luò)。AlphaFold?充分利用遺傳數(shù)據(jù)和結(jié)構(gòu)數(shù)據(jù)，還通過(guò)自蒸餾的方式使用未標(biāo)注數(shù)據(jù)來(lái)彌補(bǔ)標(biāo)注數(shù)據(jù)的不足。ChatGPT?使用人類的演示數(shù)據(jù)來(lái)微調(diào)?GPT-3.5，并通過(guò)?prompt?在聊天機(jī)器人和?AI?訓(xùn)練師之間生成更多的數(shù)據(jù)，進(jìn)一步訓(xùn)練獎(jiǎng)勵(lì)模型將數(shù)據(jù)生成過(guò)程自動(dòng)化。這些范式具有一個(gè)共同特征，即它們?cè)谌狈?biāo)記數(shù)據(jù)時(shí)嘗試生成數(shù)據(jù)以提高性能。

知識(shí)

AI?基本范式很少顯式引入知識(shí)，但在模型設(shè)計(jì)（如?CNN）時(shí)引入的偏差（bias）也可以看作是先驗(yàn)知識(shí)。中級(jí)范式通常有?3?種引入知識(shí)的方式：①直接（如主動(dòng)學(xué)習(xí)）或間接（如課程學(xué)習(xí)）通過(guò)學(xué)習(xí)策略的設(shè)計(jì)來(lái)提高學(xué)習(xí)性能；②使用從先前任務(wù)或其他任務(wù)（數(shù)據(jù)）中學(xué)到的知識(shí)來(lái)幫助新的學(xué)習(xí)任務(wù)。例如，多任務(wù)學(xué)習(xí)、遷移學(xué)習(xí)、元學(xué)習(xí)、平行學(xué)習(xí)等；③整合上述?2種方法，設(shè)計(jì)并維護(hù)一個(gè)專門(mén)的知識(shí)庫(kù)來(lái)輔助學(xué)習(xí)過(guò)程。例如，終身學(xué)習(xí)和溯因?qū)W習(xí)等。

目前，大多數(shù)機(jī)器學(xué)習(xí)范式都采用知識(shí)的嵌入表示，以便將知識(shí)融合到學(xué)習(xí)過(guò)程中；但其中有?2個(gè)例外，即終身學(xué)習(xí)和歸納學(xué)習(xí)，它們具有獨(dú)立的知識(shí)庫(kù)。我們還發(fā)現(xiàn)反饋對(duì)于學(xué)習(xí)中的知識(shí)獲取、整合和自動(dòng)化至關(guān)重要。高級(jí)范式高度依賴知識(shí)，例如，AlphaGo?首先利用人類棋手的經(jīng)驗(yàn)（可看作一種知識(shí)）訓(xùn)練策略網(wǎng)絡(luò)，然后利用圍棋規(guī)則（也是一種知識(shí)）通過(guò)強(qiáng)化學(xué)習(xí)改進(jìn)策略，進(jìn)一步通過(guò)自我對(duì)弈生成大量棋局。AlphaFold?整合了生物學(xué)家的發(fā)現(xiàn)，以及來(lái)自遺傳學(xué)、數(shù)學(xué)和化學(xué)領(lǐng)域的知識(shí)，這種高級(jí)范式是知識(shí)密集型的代表，為?AI4S?的進(jìn)一步研究提供重要參考。ChatGPT?的基礎(chǔ)是大規(guī)模預(yù)訓(xùn)練語(yǔ)言模型（GPT3），可以看作是從海量數(shù)據(jù)中提煉出來(lái)的隱性知識(shí)庫(kù)，而提示工程（prompt engineering）是引導(dǎo)大模型生成內(nèi)容并對(duì)齊到人類會(huì)話風(fēng)格、倫理和規(guī)范的過(guò)程。

運(yùn)用知識(shí)的能力很大程度上決定了學(xué)習(xí)能力。然而，將知識(shí)整合到機(jī)器學(xué)習(xí)的過(guò)程中具有很大挑戰(zhàn)，知識(shí)的獲取、表示、集成、利用等環(huán)節(jié)通常需要人類的參與。“人工智能驅(qū)動(dòng)的科學(xué)研究”專項(xiàng)部署強(qiáng)調(diào)圍繞藥物研發(fā)、基因研究、生物育種、新材料研發(fā)等需求，而知識(shí)融入這些專業(yè)性強(qiáng)的?AI4S?領(lǐng)域中尤為突出。為此，將大模型打造為知識(shí)工廠，研究服務(wù)于科學(xué)家的知識(shí)自動(dòng)化方法，將是推動(dòng)高效?AI4S?的重要保障。

人的因素

在深度學(xué)習(xí)之前，依賴于人類的特征工程在?AI?研究中起著決定性的作用。特征工程既費(fèi)時(shí)又低效，而深度學(xué)習(xí)解決了這個(gè)問(wèn)題。深度神經(jīng)網(wǎng)絡(luò)能夠自動(dòng)、準(zhǔn)確、高效地提取特征，由此，端到端學(xué)習(xí)模型越來(lái)越受歡迎。然而，在某些應(yīng)用中，人扮演著重要的角色，如提出要求、設(shè)定目標(biāo)、提供知識(shí)、實(shí)施控制、執(zhí)行評(píng)估等。因此，端到端學(xué)習(xí)不是最終目標(biāo)，不能簡(jiǎn)單地將人類從機(jī)器學(xué)習(xí)過(guò)程中移除。人類在環(huán)（human-in-loop）模式的價(jià)值在?ChatGPT?的成功中顯而易見(jiàn)，其中來(lái)自人類反饋的強(qiáng)化學(xué)習(xí)（RLHF）發(fā)揮了關(guān)鍵作用。

除以上因素之外，開(kāi)展?AI4S?研究的組織方式也是不可回避的重要問(wèn)題。當(dāng)前，國(guó)際上多種針對(duì)產(chǎn)品開(kāi)發(fā)的?DAO（分布式開(kāi)放自主組織）和針對(duì)基礎(chǔ)研究的?DeSci（分布式開(kāi)放科學(xué)運(yùn)動(dòng)）正蓬勃興起，特色就是利用智能科學(xué)與技術(shù)（IST），基于區(qū)塊鏈和智能合約的數(shù)字組織和數(shù)字治理。ChatGPT?的誕生本質(zhì)上也是得益于這種模式，DeSci?和?DAO?也值得我們關(guān)注。

（作者：王飛躍，中國(guó)科學(xué)院自動(dòng)化研究所；繆青海，中國(guó)科學(xué)院大學(xué)人工智能學(xué)院；編審：楊柳春，《中國(guó)科學(xué)院院刊》供稿）

【責(zé)任編輯：殷曉霞】

911国产在线专区,国产精品亚洲片在线va,亚洲欧美国产天堂,按摩喷潮在线播放无码,国产口爆吞精视频网站,比较有韵味的熟妇无码

LANGUAGES

新聞

財(cái)經(jīng)

觀點(diǎn)

文化

國(guó)情

承建網(wǎng)站

專業(yè)平臺(tái)

外宣平臺(tái)

人工智能驅(qū)動(dòng)的科學(xué)研究新范式：從?AI4S到智能科學(xué)