數(shù)據(jù)科學(xué)與計(jì)算智能：內(nèi)涵、范式與機(jī)遇

發(fā)布時(shí)間：2021-01-07 14:35:39 | 來(lái)源：中國(guó)網(wǎng)·中國(guó)發(fā)展門戶網(wǎng) | 作者：程學(xué)旗、沈華偉等 | 責(zé)任編輯：張蔚藍(lán)

關(guān)鍵詞：數(shù)據(jù)科學(xué),計(jì)算智能,大數(shù)據(jù),智能系統(tǒng),范式

中國(guó)網(wǎng)／中國(guó)發(fā)展門戶網(wǎng)訊大數(shù)據(jù)已成為信息社會(huì)的普遍現(xiàn)象，是數(shù)字經(jīng)濟(jì)的關(guān)鍵資源。以深度學(xué)習(xí)為代表的大數(shù)據(jù)驅(qū)動(dòng)的人工智能技術(shù)在很多行業(yè)和領(lǐng)域獲得了成功，這類人工智能本質(zhì)上源于計(jì)算能力，故可將其歸為計(jì)算智能?。與此同時(shí)，大數(shù)據(jù)是這類人工智能成功的重要因素，這類智能也被稱為數(shù)據(jù)驅(qū)動(dòng)的計(jì)算智能，從這個(gè)意義上講，當(dāng)前數(shù)據(jù)和智能是一體兩面的關(guān)系。雖然大數(shù)據(jù)與計(jì)算智能技術(shù)在大規(guī)模工程化應(yīng)用方面取得了長(zhǎng)足進(jìn)步，但支撐技術(shù)進(jìn)步的理論基礎(chǔ)和技術(shù)體系尚處于早期階段。當(dāng)前，大數(shù)據(jù)“紅利”效應(yīng)在逐漸減弱，計(jì)算智能技術(shù)的單點(diǎn)突破難以為大數(shù)據(jù)驅(qū)動(dòng)的智能應(yīng)用提供持續(xù)支撐，亟待對(duì)數(shù)據(jù)科學(xué)和計(jì)算智能的基礎(chǔ)問(wèn)題進(jìn)行深入思考，重構(gòu)其理論基石，從而推動(dòng)技術(shù)與工程應(yīng)用持續(xù)進(jìn)步和跨越式發(fā)展。

本文基于香山科學(xué)會(huì)議第?667?次學(xué)術(shù)討論會(huì)與會(huì)專家學(xué)者的集體智慧，探討并總結(jié)了?4?個(gè)方面的問(wèn)題：在數(shù)據(jù)科學(xué)的內(nèi)涵和外延尚缺乏嚴(yán)謹(jǐn)定義和學(xué)界共識(shí)的情況下，如何深入認(rèn)知反映客觀世界的數(shù)據(jù)空間的共性規(guī)律？數(shù)據(jù)科學(xué)在本體論和方法論?2?個(gè)層面上需要回答的基礎(chǔ)問(wèn)題是什么？如何理解、測(cè)試并評(píng)估現(xiàn)有計(jì)算智能的能力邊界？人腦、復(fù)雜社會(huì)系統(tǒng)、自然進(jìn)化系統(tǒng)等自然智能，往往具備比現(xiàn)有計(jì)算智能更加高效的“計(jì)算思維”和更加簡(jiǎn)潔優(yōu)美的智能推演與決策能力，是否可以借鑒這些自然智能探索新的人工智能范式？在探討數(shù)據(jù)科學(xué)和計(jì)算智能的同時(shí)，有哪些值得關(guān)注的牽引性應(yīng)用？新的智能范式對(duì)解決復(fù)雜的社會(huì)問(wèn)題是否是一個(gè)很好的機(jī)遇？在未來(lái)的發(fā)展中，我們?cè)撊绾伟盐諘r(shí)代機(jī)遇，重點(diǎn)關(guān)注哪些關(guān)鍵科學(xué)挑戰(zhàn)，優(yōu)先解決哪些關(guān)鍵問(wèn)題？

數(shù)據(jù)科學(xué)的內(nèi)涵

基于方法論視角的數(shù)據(jù)科學(xué)內(nèi)涵

關(guān)于數(shù)據(jù)科學(xué)的內(nèi)涵，一種流行的看法認(rèn)為數(shù)據(jù)科學(xué)就是圖靈獎(jiǎng)得主吉姆·格雷（Jim Gray）提出的第四范式（the fourth paradigm），即在實(shí)驗(yàn)觀測(cè)、理論推演、計(jì)算仿真之后的數(shù)據(jù)驅(qū)動(dòng)的科學(xué)研究范式。第四范式的基本思想是把數(shù)據(jù)看成現(xiàn)實(shí)世界的事物、現(xiàn)象和行為在數(shù)字空間的映射，認(rèn)為數(shù)據(jù)自然蘊(yùn)含了現(xiàn)實(shí)世界的運(yùn)行規(guī)律；進(jìn)而以數(shù)據(jù)作為媒介，利用數(shù)據(jù)驅(qū)動(dòng)及數(shù)據(jù)分析方法揭示物理世界現(xiàn)象所蘊(yùn)含的科學(xué)規(guī)律。這是一種類似方法論視角來(lái)定義的數(shù)據(jù)科學(xué)的內(nèi)涵，即數(shù)據(jù)驅(qū)動(dòng)科學(xué)發(fā)現(xiàn)。

第四范式將數(shù)據(jù)科學(xué)從其前的?3?個(gè)科學(xué)研究范式中分離出來(lái)，帶來(lái)了科學(xué)發(fā)現(xiàn)和思維方式的革命性改變。借用美國(guó)谷歌公司研究部主任皮特·諾維格（Peter Norvig）的話來(lái)說(shuō)，“所有的模型都是錯(cuò)誤的，進(jìn)一步說(shuō)，沒(méi)有模型你也可以成功（all models are wrong, and increasingly you can succeed without them）”。海量的數(shù)據(jù)使得我們可以在不依靠模型和假設(shè)的情況下，直接通過(guò)對(duì)數(shù)據(jù)進(jìn)行分析發(fā)現(xiàn)過(guò)去的科學(xué)研究方法發(fā)現(xiàn)不了的新模式、新知識(shí)甚至新規(guī)律。第四范式的一個(gè)典型研究案例是關(guān)于帕金森病的起因研究。通過(guò)對(duì)?160?萬(wàn)份病歷的大數(shù)據(jù)分析，研究人員發(fā)現(xiàn)帕金森病的起因與人的闌尾有關(guān)。這是基于大數(shù)據(jù)統(tǒng)計(jì)帕金森病患病率與切除闌尾的相關(guān)性得出的結(jié)論。

第四范式通過(guò)大數(shù)據(jù)分析能夠發(fā)現(xiàn)數(shù)據(jù)中蘊(yùn)含的大量相關(guān)關(guān)系，為科學(xué)發(fā)現(xiàn)提供了新視野。但是，第四范式本身無(wú)法從大量的相關(guān)關(guān)系中甄別出事物的本質(zhì)規(guī)律。在發(fā)現(xiàn)了帕金森病和闌尾的相關(guān)性后，有些對(duì)第四范式十分執(zhí)著的學(xué)者召集了更大量的帕金森病患者，以徹查他們的基因，調(diào)查他們的生活環(huán)境和生活習(xí)慣，以期從中發(fā)現(xiàn)一些共性；然后去找那些也有這些共性但是沒(méi)有得帕金森病的人，看他們做了什么，有什么共性；如果這種共性存在，可能就是防治帕金森病的解決方案。但是，其結(jié)論卻不盡人意。可以想象，人體的器官何止一個(gè)闌尾，且帕金森病患者的生活習(xí)慣何其繁雜，單獨(dú)靠第四范式的數(shù)據(jù)驅(qū)動(dòng)方法做漫無(wú)邊際的相關(guān)性分析，不僅要消耗大量的計(jì)算資源，也難以真正預(yù)測(cè)未來(lái)的趨勢(shì)與變化。因此，從方法論來(lái)看，第四范式在揭示事物本質(zhì)規(guī)律方面存在固有的局限性，數(shù)據(jù)科學(xué)需要在方法論上突破第四范式。

基于本體論視角的數(shù)據(jù)科學(xué)內(nèi)涵

數(shù)據(jù)科學(xué)另外一種值得探討的內(nèi)涵是基于“本體論”視角，認(rèn)為數(shù)據(jù)是反映自然世界的符號(hào)化表示。既然自然世界是客觀存在并具備共性科學(xué)規(guī)律的，那么反映自然世界的數(shù)據(jù)空間也可能具有獨(dú)立于各個(gè)領(lǐng)域的一般性規(guī)律。因而，數(shù)據(jù)科學(xué)應(yīng)該是“用科學(xué)方法來(lái)研究數(shù)據(jù)”，數(shù)據(jù)科學(xué)也應(yīng)該有類似“信息論”這樣的學(xué)科基礎(chǔ)理論。更具體來(lái)看，當(dāng)我們把世界看成是由物理世界、機(jī)器世界和人類社會(huì)組成的三元世界時(shí)，新型的“感知、計(jì)算、通信、控制”等信息技術(shù)使三元世界相互影響和融合，形成了一個(gè)平行化（孿生）的復(fù)雜數(shù)據(jù)空間。這樣的數(shù)據(jù)空間，除了映射物理世界，其本身是否具有獨(dú)特的一般性規(guī)律？如何用科學(xué)的方法來(lái)研究數(shù)據(jù)的一般性規(guī)律，揭示其內(nèi)在機(jī)理？這些是數(shù)據(jù)科學(xué)更基本的問(wèn)題。例如，數(shù)據(jù)科學(xué)中的一些常數(shù)規(guī)律（對(duì)稱性、黃金分割、長(zhǎng)尾分布等）和更廣意義上的大數(shù)據(jù)非確定性、數(shù)據(jù)廣義關(guān)聯(lián)、時(shí)空演化、數(shù)據(jù)復(fù)雜性等。

數(shù)據(jù)科學(xué)是方法論和本體論在數(shù)據(jù)價(jià)值實(shí)現(xiàn)目標(biāo)下的統(tǒng)一

數(shù)據(jù)科學(xué)到底應(yīng)該從哪些視角來(lái)定義其獨(dú)有的內(nèi)涵與特征？一般認(rèn)為，作為一門學(xué)科的定義，至少應(yīng)該從其研究對(duì)象、方法論和學(xué)科目標(biāo)?3?個(gè)維度去界定。數(shù)據(jù)科學(xué)的內(nèi)涵應(yīng)該既包括本體論內(nèi)容和方法論內(nèi)容，還包括其獨(dú)特的價(jià)值實(shí)現(xiàn)目標(biāo)（圖?1）。基于這一認(rèn)知，可以定義“數(shù)據(jù)科學(xué)是有關(guān)數(shù)據(jù)價(jià)值鏈實(shí)現(xiàn)過(guò)程的基礎(chǔ)理論和方法學(xué)，它運(yùn)用基于分析、建模、計(jì)算和學(xué)習(xí)雜糅的方法，研究從數(shù)據(jù)到信息、從信息到知識(shí)、從知識(shí)到?jīng)Q策的轉(zhuǎn)換，并實(shí)現(xiàn)對(duì)現(xiàn)實(shí)世界的認(rèn)知和操控”。這“三個(gè)轉(zhuǎn)換、一個(gè)實(shí)現(xiàn)”是數(shù)據(jù)科學(xué)的學(xué)科目標(biāo)。而實(shí)現(xiàn)這一目標(biāo)的方法論來(lái)自多個(gè)學(xué)科方法的融合，包括數(shù)學(xué)（特別是統(tǒng)計(jì)學(xué)）、計(jì)算機(jī)科學(xué)（特別是人工智能）、社會(huì)科學(xué)（特別是管理學(xué)）等。

數(shù)據(jù)科學(xué)與相關(guān)學(xué)科的關(guān)系

目前，關(guān)于數(shù)據(jù)科學(xué)的基本內(nèi)涵和基礎(chǔ)問(wèn)題還沒(méi)有像數(shù)學(xué)、物理學(xué)和計(jì)算機(jī)科學(xué)那樣成體系、有共識(shí)。但是，數(shù)據(jù)科學(xué)的多學(xué)科交叉特征及大數(shù)據(jù)自身的價(jià)值特性已經(jīng)成為共識(shí)。我們可以借助相關(guān)學(xué)科來(lái)探討當(dāng)前數(shù)據(jù)科學(xué)研究需要關(guān)注的基礎(chǔ)問(wèn)題。

數(shù)據(jù)科學(xué)與統(tǒng)計(jì)學(xué)。統(tǒng)計(jì)學(xué)將數(shù)據(jù)作為研究對(duì)象，致力于收集、描述、分析和解釋數(shù)據(jù)，其為數(shù)據(jù)科學(xué)提供了重要基礎(chǔ)和工具。然而，在大數(shù)據(jù)面前，統(tǒng)計(jì)學(xué)也面臨著諸多問(wèn)題和挑戰(zhàn)。例如：統(tǒng)計(jì)假設(shè)在復(fù)雜大數(shù)據(jù)分析中難以滿足、數(shù)據(jù)自身及分析結(jié)果的真?zhèn)坞y以判定、端到端的大數(shù)據(jù)推斷缺乏基礎(chǔ)理論支撐等。統(tǒng)計(jì)學(xué)針對(duì)這些問(wèn)題目前基本上是束手無(wú)策的；而統(tǒng)計(jì)學(xué)所依賴的一些傳統(tǒng)強(qiáng)假設(shè)（如獨(dú)立同分布假設(shè)、低維假設(shè)等），也都無(wú)法適用于目前多源異質(zhì)的真實(shí)數(shù)據(jù)。因此，數(shù)據(jù)科學(xué)雖然在研究對(duì)象上和統(tǒng)計(jì)學(xué)是相同的，但在研究問(wèn)題的范疇上卻是超越統(tǒng)計(jì)學(xué)的。譬如：數(shù)據(jù)科學(xué)該如何深入認(rèn)識(shí)數(shù)據(jù)固有的共性規(guī)律？是否能建立一套數(shù)據(jù)復(fù)雜性理論體系？數(shù)據(jù)規(guī)模、數(shù)據(jù)質(zhì)量和數(shù)據(jù)價(jià)值有什么定量關(guān)系？如何刻畫(huà)大數(shù)據(jù)所表現(xiàn)出來(lái)的多層面的非確定性特征？

數(shù)據(jù)科學(xué)與網(wǎng)絡(luò)科學(xué)。數(shù)據(jù)科學(xué)的發(fā)展可以借鑒網(wǎng)絡(luò)科學(xué)的發(fā)展歷程，以類似的方法尋找研究對(duì)象的共性規(guī)律。網(wǎng)絡(luò)科學(xué)發(fā)現(xiàn)了物理世界中廣泛存在的網(wǎng)絡(luò)所呈現(xiàn)出的共性規(guī)律（如冪率分布、小世界現(xiàn)象等），從而促進(jìn)了其從圖論和隨機(jī)圖論中分離出來(lái)獨(dú)立發(fā)展，實(shí)現(xiàn)了其研究對(duì)象從作為數(shù)學(xué)工具的圖到作為物理對(duì)象的網(wǎng)絡(luò)的轉(zhuǎn)變。那么在數(shù)據(jù)科學(xué)中，數(shù)據(jù)的共性規(guī)律是什么？在現(xiàn)實(shí)世界中是否有完全不同的兩個(gè)數(shù)據(jù)集之間存在某種共性？一方面，一下子找到所有領(lǐng)域的共性規(guī)律可能是不現(xiàn)實(shí)的，因而可以先從幾個(gè)關(guān)鍵領(lǐng)域出發(fā)，尋找部分領(lǐng)域的共性規(guī)律；另一方面，尋找數(shù)據(jù)的共性規(guī)律需要能夠問(wèn)出合適的基礎(chǔ)性問(wèn)題，類似網(wǎng)絡(luò)科學(xué)中關(guān)于度分布、聚集系數(shù)、網(wǎng)絡(luò)直徑、網(wǎng)絡(luò)脆弱性、網(wǎng)絡(luò)適航性等方面的問(wèn)題。目前，尚不明確各個(gè)領(lǐng)域的數(shù)據(jù)是否存在統(tǒng)一的規(guī)律。因此，數(shù)據(jù)科學(xué)還需要在應(yīng)用領(lǐng)域進(jìn)行一定時(shí)間的探索，從領(lǐng)域知識(shí)中汲取養(yǎng)分，并逐步發(fā)現(xiàn)規(guī)律、尋找共性。

數(shù)據(jù)科學(xué)與計(jì)算機(jī)科學(xué)。數(shù)據(jù)科學(xué)的起源與發(fā)展離不開(kāi)計(jì)算機(jī)科學(xué)，但這兩個(gè)學(xué)科由于研究對(duì)象和研究方法的不同，未來(lái)也許會(huì)平行發(fā)展。簡(jiǎn)單而言，從研究對(duì)象的角度來(lái)說(shuō)，計(jì)算機(jī)科學(xué)是關(guān)于算法的科學(xué)，而數(shù)據(jù)科學(xué)是關(guān)于數(shù)據(jù)的科學(xué)。從計(jì)算機(jī)科學(xué)到數(shù)據(jù)科學(xué)，研究手段從傳統(tǒng)計(jì)算機(jī)領(lǐng)域的算法復(fù)雜性分析，轉(zhuǎn)變?yōu)閷?duì)數(shù)據(jù)的復(fù)雜性和非確定性等特性進(jìn)行分析研究。如何對(duì)非確定邊界的數(shù)據(jù)，在有限時(shí)間空間下進(jìn)行計(jì)算？數(shù)據(jù)復(fù)雜性、模型復(fù)雜性與模型性能之間是什么關(guān)系？解決某個(gè)問(wèn)題所需要的大數(shù)據(jù)的量的邊界如何確定？是否能發(fā)展一套理論，為基于大數(shù)據(jù)的計(jì)算模型提供其能力上、下界的保證？這些都是數(shù)據(jù)科學(xué)獨(dú)立于計(jì)算機(jī)科學(xué)之外所需要解決的問(wèn)題。

數(shù)據(jù)科學(xué)目前尚處于發(fā)展的早期階段，其研究方法也應(yīng)該與傳統(tǒng)科學(xué)有所區(qū)分。數(shù)據(jù)科學(xué)，正處于“無(wú)知”到“科學(xué)”的中間狀態(tài)。它目前還沒(méi)有形成一門完整的學(xué)科——信息是不完備的，環(huán)境也是非確定的。因此，不能完全按照傳統(tǒng)學(xué)科來(lái)思考和要求數(shù)據(jù)科學(xué)；而應(yīng)該在這樣不完備、非確定的環(huán)境下，重新思考和定義數(shù)據(jù)科學(xué)及數(shù)據(jù)科學(xué)亟待關(guān)注的基礎(chǔ)問(wèn)題。

計(jì)算智能的發(fā)展與新型智能范式的探索

計(jì)算智能的發(fā)展

人工智能（AI）概念在1956年由麥卡錫等學(xué)者提出，其發(fā)展幾經(jīng)浮沉。基于對(duì)智能產(chǎn)生機(jī)制的不同理解，人工智能發(fā)展至今學(xué)派眾多，且相互借鑒，形成了一系列代表性成果。無(wú)論是早期符號(hào)計(jì)算（以數(shù)理邏輯為基礎(chǔ)）、進(jìn)化計(jì)算、支持向量機(jī)、貝葉斯網(wǎng)絡(luò)，還是當(dāng)前在工業(yè)界獲得巨大成功的基于多層神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)方法，從模型的本質(zhì)上來(lái)看都是建立在圖靈機(jī)的基礎(chǔ)上，基本都符合邱奇-圖靈論題（Church-Turing thesis），即“任何在算法上可計(jì)算的問(wèn)題同樣可由圖靈機(jī)計(jì)算”。換句話說(shuō)，現(xiàn)有的人工智能模型本質(zhì)上都是與圖靈計(jì)算模型等價(jià)的，故可歸為計(jì)算智能。計(jì)算智能一般以計(jì)算機(jī)為中心，以算法理論為基礎(chǔ)，充分利用現(xiàn)代計(jì)算機(jī)的計(jì)算特性，給出了解決實(shí)際問(wèn)題的形式化模型和算法。

近?10?多年以來(lái)，大數(shù)據(jù)的使用、算力的提升和深度模型的發(fā)展，為計(jì)算智能帶來(lái)了新的契機(jī)。大數(shù)據(jù)、大算力、大模型三者結(jié)合，極大地推動(dòng)了計(jì)算智能的工業(yè)化應(yīng)用。例如，計(jì)算智能在以圍棋為代表的人機(jī)對(duì)弈、機(jī)器翻譯、人臉識(shí)別、語(yǔ)音識(shí)別、人機(jī)對(duì)話、自動(dòng)駕駛等應(yīng)用中均取得了巨大的成功。值得注意的是，大數(shù)據(jù)在給計(jì)算智能帶來(lái)發(fā)展的同時(shí)，其復(fù)雜性和非確定性也給計(jì)算智能帶來(lái)了非常大的挑戰(zhàn)。現(xiàn)有的計(jì)算智能在面臨大數(shù)據(jù)環(huán)境下的復(fù)雜問(wèn)題和復(fù)雜系統(tǒng)時(shí)，依然很難給出滿意的答案。我們需要探索當(dāng)前計(jì)算智能的能力邊界問(wèn)題，從理論上探尋這類智能所能解決的問(wèn)題類型和能力邊界。譬如，通過(guò)建立深度學(xué)習(xí)和統(tǒng)計(jì)力學(xué)的關(guān)系，回答深度學(xué)習(xí)的相關(guān)基礎(chǔ)問(wèn)題：表達(dá)能力方面，模型做深為什么是必要的，到底深度為多少層是合理的？模型學(xué)習(xí)方面，崎嶇的目標(biāo)函數(shù)如何高效優(yōu)化？泛化能力方面，如何實(shí)現(xiàn)計(jì)算智能技術(shù)從專用到通用的轉(zhuǎn)變？如何實(shí)現(xiàn)模型的跨領(lǐng)域、跨任務(wù)、跨模態(tài)的泛化？

上述一系列基礎(chǔ)問(wèn)題將進(jìn)一步成為計(jì)算智能未來(lái)發(fā)展的關(guān)鍵“瓶頸”。其原因是，當(dāng)前的計(jì)算智能是大數(shù)據(jù)工程化驅(qū)動(dòng)的，其能力的提升主要依賴于數(shù)據(jù)規(guī)模的增加和計(jì)算速度的增長(zhǎng)。如果缺乏數(shù)據(jù)科學(xué)化理論的支撐，大數(shù)據(jù)驅(qū)動(dòng)的計(jì)算智能難以形成從量變到質(zhì)變的提升。那么另一種思路是，我們也許可以考慮發(fā)展與當(dāng)前計(jì)算智能不一樣的智能范式，以便更加簡(jiǎn)潔高效地解決更復(fù)雜、更普適的現(xiàn)實(shí)問(wèn)題。

新型智能范式的探索

事實(shí)上，自然界中存在大量具備智能的自然系統(tǒng)。這些自然系統(tǒng)比現(xiàn)有人工智能系統(tǒng)具備更加簡(jiǎn)潔、高效的邏輯推理和自我學(xué)習(xí)能力，如腦神經(jīng)系統(tǒng)、社會(huì)系統(tǒng)、自然生態(tài)系統(tǒng)等。那么，自然系統(tǒng)的智能模型是什么？我們能否借鑒自然系統(tǒng)中的智能行為，將其形式化為可計(jì)算的智能范式？實(shí)際上，已有?4?類智能范式在此方面做出了一些初步的探索。

腦啟發(fā)計(jì)算

人類的大腦皮層具有?140?億—160?億個(gè)神經(jīng)元，且每個(gè)神經(jīng)元會(huì)連接?1?000—10?000?個(gè)其他神經(jīng)元，借此人類發(fā)展出了比其他物種更高級(jí)的智慧。腦啟發(fā)計(jì)算（brain-inspired computing）正是借鑒了人腦存儲(chǔ)、處理信息的基本原理所發(fā)展出來(lái)的一種新型計(jì)算技術(shù)。與傳統(tǒng)圖靈計(jì)算機(jī)的計(jì)算模式相比，腦啟發(fā)計(jì)算是通過(guò)增加空間復(fù)雜度來(lái)保留計(jì)算單元之間的結(jié)構(gòu)相關(guān)性，從而構(gòu)造基于神經(jīng)形態(tài)工程的高速、新型計(jì)算架構(gòu)。腦啟發(fā)計(jì)算的目標(biāo)是構(gòu)造一套非“馮?·?諾依曼”架構(gòu)、可實(shí)時(shí)處理復(fù)雜非結(jié)構(gòu)化信息、超低功耗的高速新型計(jì)算架構(gòu)。腦啟發(fā)計(jì)算的發(fā)展，也許能為數(shù)據(jù)科學(xué)提供新的計(jì)算架構(gòu)和高性能的計(jì)算能力，支撐通用人工智能的發(fā)展。目前，腦啟發(fā)計(jì)算仍處于起步階段，我們需要進(jìn)一步思考如何在不完全了解人腦機(jī)制的情況下發(fā)展腦啟發(fā)計(jì)算模式，以及如何基于這種腦啟發(fā)計(jì)算為科學(xué)研究提供新思路和新范式。

演化智能

學(xué)習(xí)和演化是生物適應(yīng)環(huán)境的基本方式。現(xiàn)有的計(jì)算智能基本都擁有從數(shù)據(jù)中學(xué)習(xí)的能力，但對(duì)智能模型的演化能力缺乏關(guān)注。例如，人腦是經(jīng)過(guò)數(shù)百萬(wàn)年的演化逐步形成的。從這個(gè)角度來(lái)講，現(xiàn)有的智能模型在依靠人類設(shè)計(jì)之外，是否也能通過(guò)演化過(guò)程去自動(dòng)發(fā)現(xiàn)最佳的模型結(jié)構(gòu)？傳統(tǒng)的遺傳算法是一種基礎(chǔ)的演化計(jì)算模型；而從演化計(jì)算到演化智能，以及實(shí)現(xiàn)模型自動(dòng)演化的智能范式，還有很長(zhǎng)的路要走。未來(lái)，交互驅(qū)動(dòng)的強(qiáng)化學(xué)習(xí)、開(kāi)放環(huán)境下的人工智能是值得探索的方向。

復(fù)雜系統(tǒng)模擬

自然界存在大量的復(fù)雜系統(tǒng)，如人類社會(huì)系統(tǒng)、自然生態(tài)系統(tǒng)、人體免疫系統(tǒng)等。從控制和計(jì)算的角度來(lái)看，模型化的復(fù)雜系統(tǒng)是“由大量相互作用、相互依賴的單元構(gòu)成的一個(gè)整體系統(tǒng)；一般在沒(méi)有中央控制情況下，這個(gè)整體系統(tǒng)可通過(guò)簡(jiǎn)單的運(yùn)作規(guī)則實(shí)現(xiàn)復(fù)雜的信息處理，進(jìn)而產(chǎn)生復(fù)雜的集體行為，并能通過(guò)學(xué)習(xí)和進(jìn)化產(chǎn)生自生長(zhǎng)和自適應(yīng)能力”。是否可以通過(guò)模擬復(fù)雜系統(tǒng)的組成特點(diǎn)和交互方式來(lái)構(gòu)造新型智能范式？如何通過(guò)大量簡(jiǎn)單智能體之間的交互作用，產(chǎn)生可預(yù)期的、具有高度復(fù)雜性的群體智能？這樣的智能范式也許會(huì)從根本上改變傳統(tǒng)的單智能體的智能上限。

人機(jī)混合智能

隨著互聯(lián)網(wǎng)、物聯(lián)網(wǎng)及新一代通信技術(shù)的發(fā)展，萬(wàn)物泛在互聯(lián)成為現(xiàn)實(shí)。未來(lái)，大量物理設(shè)備、無(wú)人系統(tǒng)、人腦，通過(guò)泛在網(wǎng)絡(luò)實(shí)現(xiàn)“上線”和“互聯(lián)”。在這樣的環(huán)境下，人在回路的人機(jī)混合智能具備了基本的物理?xiàng)l件。目前，人工智能技術(shù)所具備的感知、認(rèn)知能力，基本上是模型與數(shù)據(jù)結(jié)合，并以機(jī)器為中心所形成的計(jì)算智能，故也稱為機(jī)器智能。這種機(jī)器智能在存儲(chǔ)、搜索、感知、確定性問(wèn)題求解等方面性能表現(xiàn)優(yōu)越，但在高級(jí)認(rèn)知和復(fù)雜問(wèn)題決策方面與人類智能相差很遠(yuǎn)。雖然腦啟發(fā)計(jì)算取得了一些進(jìn)展，但在可預(yù)期的未來(lái)，機(jī)器智能很難完全模仿和構(gòu)造出人類智能或其他自然智能。換一個(gè)思路，如果將人的智能引入到機(jī)器智能的系統(tǒng)回路中，將充分融合人類智能和機(jī)器智能的優(yōu)勢(shì)，從而形成更高級(jí)的智能水平。在未來(lái)較長(zhǎng)的一段時(shí)間內(nèi)，這種人機(jī)混合智能也許是一些復(fù)雜問(wèn)題求解的有效途徑。

那么，在基于機(jī)器的計(jì)算智能基礎(chǔ)上，人作為具備智能的自然系統(tǒng)，如何參與到機(jī)器智能的系統(tǒng)回路中是一個(gè)關(guān)鍵問(wèn)題。人機(jī)混合智能需要重點(diǎn)解決思維融合或決策融合的問(wèn)題。具體而言，傳統(tǒng)的人機(jī)接口往往是單向的；在人機(jī)互聯(lián)情況下，人腦如何參與到機(jī)器智能的系統(tǒng)回路當(dāng)中？如何同時(shí)讓人理解機(jī)器思維和讓機(jī)器理解人的思維，從而實(shí)現(xiàn)思維的無(wú)縫互動(dòng)？目前，一些探索和挖掘思維潛力的工具，如思維導(dǎo)圖、思維地圖、概念圖等，其理論基礎(chǔ)與形式化模型并不清晰。一些新型的腦機(jī)接口技術(shù)進(jìn)展迅速，但缺乏對(duì)人腦在直覺(jué)、意識(shí)、情感和決策方面的機(jī)理認(rèn)知。也許，從技術(shù)上構(gòu)建有效的人在回路智能通道，是當(dāng)前人機(jī)混合智能亟待解決的關(guān)鍵問(wèn)題之一（圖?2）。

小結(jié)

上述?4?類智能范式的研究，在現(xiàn)有圖靈等價(jià)的計(jì)算智能基礎(chǔ)上，或多或少地引入了人類智能或自然系統(tǒng)智能的部分機(jī)制，從而為未來(lái)智能系統(tǒng)的發(fā)展注入新的活力。但是迄今為止，這些智能范式在可形式化、可計(jì)算、可構(gòu)造等方面還存在諸多基礎(chǔ)性問(wèn)題挑戰(zhàn)。如果這些模式是未來(lái)新型智能范式，那么它們是否還是圖靈等價(jià)的？這些問(wèn)題值得我們從本源上進(jìn)行探討。數(shù)據(jù)是人類社會(huì)、物理世界和機(jī)器世界之間的橋梁，同時(shí)數(shù)據(jù)也是人類社會(huì)和物理世界的符號(hào)化映射。因而，從數(shù)據(jù)入手是探索和實(shí)現(xiàn)上述新型智能范式的基本途徑。數(shù)據(jù)科學(xué)基礎(chǔ)理論，不僅對(duì)當(dāng)前數(shù)據(jù)驅(qū)動(dòng)的計(jì)算智能起到提質(zhì)增效的作用，也將為未來(lái)新型智能范式研究提供理論支撐。

引領(lǐng)數(shù)據(jù)科學(xué)與計(jì)算智能研究的應(yīng)用

作為一門實(shí)踐性強(qiáng)的學(xué)科，數(shù)據(jù)科學(xué)的發(fā)展離不開(kāi)實(shí)際需求牽引與技術(shù)應(yīng)用驅(qū)動(dòng)。隨著感知、計(jì)算、通信、控制等技術(shù)的發(fā)展及綜合集成應(yīng)用，“人-機(jī)-物”三元世界高度融合，在線形成了一個(gè)網(wǎng)絡(luò)化的大數(shù)據(jù)系統(tǒng)，其內(nèi)部包含了互聯(lián)網(wǎng)、物聯(lián)網(wǎng)連接而成的各類數(shù)據(jù)。這是一個(gè)高度復(fù)雜、強(qiáng)不確定性、持續(xù)動(dòng)態(tài)演化的復(fù)雜系統(tǒng)，是“系統(tǒng)的系統(tǒng)”。它既是智慧城市、智能制造、健康醫(yī)療等各個(gè)領(lǐng)域應(yīng)用的空間載體，也為國(guó)家安全、社會(huì)治理、數(shù)字經(jīng)濟(jì)等領(lǐng)域的科學(xué)化、智能化發(fā)展提供了重要的數(shù)據(jù)資源供給。前文已提及，這個(gè)現(xiàn)實(shí)存在的大數(shù)據(jù)系統(tǒng)，除了具備高度復(fù)雜性、強(qiáng)不確定性等特性，人在回路也是其顯著特征。針對(duì)這一現(xiàn)實(shí)系統(tǒng)的研究與應(yīng)用，將有可能為數(shù)據(jù)科學(xué)的理論與技術(shù)發(fā)展帶來(lái)機(jī)遇。針對(duì)這一復(fù)雜系統(tǒng)的典型場(chǎng)景展開(kāi)研究，不僅有利于揭示數(shù)據(jù)的基本規(guī)律，也有可能因此而牽引未來(lái)新型智能范式的研究。其典型的應(yīng)用場(chǎng)景有如下?4?種。

基于非確定數(shù)據(jù)的社會(huì)認(rèn)知。在社會(huì)系統(tǒng)中，我們搜集到的數(shù)據(jù)通常與真實(shí)的情況存在一定的偏差，大量的虛假內(nèi)容、非確定性內(nèi)容混雜在這些數(shù)據(jù)當(dāng)中。如何能基于這樣不完備的、非確定的大數(shù)據(jù)進(jìn)行社會(huì)認(rèn)知是一個(gè)非常有挑戰(zhàn)的問(wèn)題。社會(huì)認(rèn)知具體包括真假判定、社會(huì)心理計(jì)算、輿情判定與導(dǎo)向等。而面向非確定數(shù)據(jù)的社會(huì)認(rèn)知，其中一大關(guān)鍵在于如何對(duì)大量復(fù)雜的非確定數(shù)據(jù)進(jìn)行假設(shè)建模，如何建立復(fù)雜社會(huì)系統(tǒng)中個(gè)人行為與群體社會(huì)認(rèn)知之間的關(guān)聯(lián)。演化智能、復(fù)雜系統(tǒng)仿真與模擬也許是解決這一問(wèn)題的突破口。

基于開(kāi)放環(huán)境的群智決策。互聯(lián)網(wǎng)極大地方便了信息、知識(shí)和智慧的互聯(lián)互通。在互聯(lián)網(wǎng)中，已經(jīng)有許多復(fù)雜問(wèn)題可以通過(guò)群智決策的方式加以有效解決，如眾包計(jì)算、人本計(jì)算等。那么，一方面，未來(lái)我們?cè)撊绾卧O(shè)計(jì)或改進(jìn)群智決策中的內(nèi)部個(gè)體交互、融合與反饋方式，以人工構(gòu)造的群體智能方式進(jìn)一步提升互聯(lián)網(wǎng)群智決策的智能上限？另一方面，從計(jì)算機(jī)的視角來(lái)看，該如何利用或者模擬這種人類的群智決策方式，來(lái)解決一些復(fù)雜的決策問(wèn)題？考慮到智能系統(tǒng)的演化及復(fù)雜系統(tǒng)的仿真與模擬，對(duì)單個(gè)智能體及智能體之間復(fù)雜交互進(jìn)行建模，也許是未來(lái)復(fù)雜問(wèn)題求解的一個(gè)可能方向。

人機(jī)融合的智慧醫(yī)療。智慧醫(yī)療是醫(yī)學(xué)、計(jì)算機(jī)科學(xué)、公共衛(wèi)生學(xué)等學(xué)科相互交叉的新興領(lǐng)域。隨著信息技術(shù)的普及發(fā)展，醫(yī)療領(lǐng)域產(chǎn)生了大量的數(shù)據(jù)（如電子病歷、PB?級(jí)基因數(shù)據(jù)等），也催生了諸多與智慧醫(yī)療相關(guān)的應(yīng)用需求。如何根據(jù)患者的電子病歷及臨床影像等數(shù)據(jù)對(duì)疾病診斷提供輔助決策支持？如何根據(jù)人類的基因數(shù)據(jù)，提前進(jìn)行疾病的預(yù)測(cè)，為疾病的早期發(fā)現(xiàn)、新生兒的先天缺陷預(yù)測(cè)提供幫助？需要注意的是，智慧醫(yī)療需要強(qiáng)大的可靠性，但目前的人工智能還難以替代醫(yī)生。一種比較好的提高思路是，考慮人（醫(yī)生）在回路的新型智能范式；通過(guò)這樣人機(jī)混合的方式，使得機(jī)器的智能與人的智能相輔相成，使醫(yī)療從傳統(tǒng)的“個(gè)體經(jīng)驗(yàn)決策”轉(zhuǎn)向“智能輔助決策”的新模式，進(jìn)而為醫(yī)療系統(tǒng)的革新帶來(lái)新的可能。

重大公共安全問(wèn)題與社會(huì)治理。重大公共安全問(wèn)題指對(duì)社會(huì)和公民所需的穩(wěn)定環(huán)境有嚴(yán)重影響的重大問(wèn)題。公共安全問(wèn)題涉及多方復(fù)雜因素，包括人類社會(huì)、自然環(huán)境、突發(fā)事件等，是典型的人在回路的復(fù)雜應(yīng)用問(wèn)題，急需應(yīng)用大數(shù)據(jù)技術(shù)手段進(jìn)行預(yù)測(cè)、預(yù)警和防控。以新冠肺炎疫情為例，大數(shù)據(jù)分析技術(shù)手段和人機(jī)混合智能，為疫情走勢(shì)預(yù)測(cè)、傳播鏈排查、謠言傳播溯源和意圖研判等人在回路的復(fù)雜問(wèn)題提供了有力幫助，支撐疫情精準(zhǔn)防控。

數(shù)據(jù)科學(xué)與計(jì)算智能的關(guān)鍵問(wèn)題

數(shù)據(jù)科學(xué)的發(fā)展，將幫助我們厘清數(shù)據(jù)科學(xué)的理論邊界，為計(jì)算智能的持續(xù)發(fā)展提供新的可能與機(jī)遇；與此同時(shí)，計(jì)算智能的發(fā)展與新型智能范式的興起，也將為大數(shù)據(jù)在各行業(yè)和各領(lǐng)域的應(yīng)用提供新的契機(jī)。在本節(jié)，我們從數(shù)據(jù)科學(xué)的基本內(nèi)涵與邊界、新型智能范式與智能能力測(cè)試、數(shù)據(jù)評(píng)價(jià)體系與共享利用?3?個(gè)方面出發(fā)，基于香山科學(xué)會(huì)議第?667?次學(xué)術(shù)討論會(huì)與會(huì)專家的討論，提煉形成數(shù)據(jù)科學(xué)與計(jì)算智能領(lǐng)域的七大關(guān)鍵問(wèn)題，以期得到相關(guān)領(lǐng)域研究者的共同關(guān)注，從而把握時(shí)代的機(jī)遇，推動(dòng)數(shù)據(jù)科學(xué)與計(jì)算智能的持續(xù)發(fā)展。

大數(shù)據(jù)中的相關(guān)關(guān)系與因果關(guān)系

因果關(guān)系指一個(gè)變量的發(fā)生會(huì)導(dǎo)致另一個(gè)變量的發(fā)生。而相關(guān)關(guān)系則指一個(gè)變量發(fā)生變化時(shí)，另一個(gè)變量也會(huì)規(guī)律性地發(fā)生變化。一般情況下，因果關(guān)系往往也是相關(guān)關(guān)系，而相關(guān)關(guān)系并不一定是因果關(guān)系。大數(shù)據(jù)的存在，使得人們可以廣泛尋求相關(guān)關(guān)系，Mayer-Sch?nberger甚至在其書(shū)中說(shuō)道，“大數(shù)據(jù)時(shí)代最大的轉(zhuǎn)變就是放棄對(duì)因果關(guān)系的渴求，而取而代之關(guān)注相關(guān)關(guān)系”。相關(guān)關(guān)系確實(shí)能在商業(yè)和實(shí)際應(yīng)用中帶來(lái)巨大的成功，但這種成功從科學(xué)角度尚需謹(jǐn)慎看待。從科學(xué)研究的角度來(lái)看，相關(guān)關(guān)系研究是可以替代因果分析的科學(xué)新發(fā)展，還是因果分析的補(bǔ)充？從實(shí)際應(yīng)用看，從數(shù)據(jù)中挖掘出的相關(guān)關(guān)系能否看作是一種近似因果關(guān)系幫助人們進(jìn)行預(yù)測(cè)或決策？對(duì)此，不同的學(xué)者有不同甚至相反的看法。

建議未來(lái)重點(diǎn)研究方向：相關(guān)關(guān)系能夠逼近因果關(guān)系的程度，相關(guān)關(guān)系和因果關(guān)系的邊界，是否可以利用反事實(shí)推斷從相關(guān)關(guān)系中推斷出因果關(guān)系，以及如何保證大數(shù)據(jù)分析的結(jié)論可信等問(wèn)題。

數(shù)據(jù)科學(xué)的復(fù)雜性問(wèn)題

在計(jì)算機(jī)科學(xué)中，算法的計(jì)算復(fù)雜性是一個(gè)基本問(wèn)題，包括時(shí)間復(fù)雜性和空間復(fù)雜性。而數(shù)據(jù)科學(xué)除了對(duì)計(jì)算復(fù)雜性的研究外，還需要探索數(shù)據(jù)自身的復(fù)雜性及模型復(fù)雜性。數(shù)據(jù)科學(xué)不能一味地靠增加數(shù)據(jù)量或者模型的參數(shù)規(guī)模來(lái)提升其性能。給定一個(gè)具體問(wèn)題，到底需要多大規(guī)模的數(shù)據(jù)或多復(fù)雜的模型才能獲得有效解？一個(gè)復(fù)雜模型判定能力的提升到底有沒(méi)有盡頭或界限？數(shù)據(jù)規(guī)模和模型復(fù)雜度之間是什么關(guān)系？這些問(wèn)題在大數(shù)據(jù)工程化應(yīng)用中也許可以有經(jīng)驗(yàn)性的判定，但是在數(shù)據(jù)科學(xué)研究中需要弄清楚其基本內(nèi)涵和規(guī)律。

建議未來(lái)重點(diǎn)研究方向：從數(shù)據(jù)科學(xué)理論出發(fā)，給出數(shù)據(jù)復(fù)雜性、模型復(fù)雜性和模型性能之間的關(guān)系（上下界或漸進(jìn)理論），為大數(shù)據(jù)的科學(xué)化研究和高效率應(yīng)用奠定重要基礎(chǔ)；當(dāng)然，要對(duì)所有領(lǐng)域給出一個(gè)共同的數(shù)據(jù)科學(xué)基礎(chǔ)理論，可能比較困難，但可以考慮先從某些重要領(lǐng)域或典型問(wèn)題出發(fā)進(jìn)行探索。

有限時(shí)空約束下的無(wú)限數(shù)據(jù)計(jì)算

在很多場(chǎng)景中，解決問(wèn)題所需要的數(shù)據(jù)可能是大量流動(dòng)的，甚至是無(wú)限的——無(wú)法確定其邊界。例如，真實(shí)的自動(dòng)駕駛技術(shù)需要在任意環(huán)境、道路上都確保其有效性，理想情況下我們需要通過(guò)搜集大量的數(shù)據(jù)來(lái)不斷訓(xùn)練自動(dòng)駕駛模型，促使自動(dòng)駕駛水平的提升；但問(wèn)題在于，在實(shí)際操作中我們無(wú)法在有限時(shí)空資源下搜集、處理所有的數(shù)據(jù)。現(xiàn)有的自動(dòng)駕駛技術(shù)，也基本都是在有限的實(shí)驗(yàn)室環(huán)境下或者固定的道路上進(jìn)行學(xué)習(xí)訓(xùn)練，以期能夠?qū)崿F(xiàn)在任意環(huán)境和非確定道路上的自動(dòng)駕駛。

建議未來(lái)重點(diǎn)研究方向：面向上述邊界不確定的數(shù)據(jù)，到底多大的數(shù)據(jù)量對(duì)問(wèn)題而言是足夠的，以及什么樣的數(shù)據(jù)采樣機(jī)制才能保證逼近數(shù)據(jù)整體分布；或者說(shuō)，該如何在有限時(shí)空資源限制下來(lái)處理邊界不確定的數(shù)據(jù)。

強(qiáng)不確定性復(fù)雜系統(tǒng)環(huán)境下的新型智能范式

大數(shù)據(jù)空間融合了“人-機(jī)-物”三元世界，其交互方式、運(yùn)行方式極其復(fù)雜。復(fù)雜系統(tǒng)中跨域高維稀疏的大數(shù)據(jù)具有很強(qiáng)的時(shí)空分布不確定性和價(jià)值規(guī)律不確定性。在這樣一個(gè)強(qiáng)不確定性的復(fù)雜環(huán)境下，能否形成形式化、可計(jì)算的新型智能范式？如果存在這樣的智能范式，是否還需要依靠大規(guī)模數(shù)據(jù)驅(qū)動(dòng)？現(xiàn)有的腦啟發(fā)計(jì)算、演化智能、復(fù)雜系統(tǒng)模擬等主要還是依賴計(jì)算機(jī)的計(jì)算能力，未來(lái)還需要進(jìn)一步探索能夠突破計(jì)算機(jī)計(jì)算能力邊界的智能范式。人在回路的人機(jī)混合智能是一個(gè)可能的發(fā)展方向，其目標(biāo)是打通人類智能與機(jī)器智能的融合通道，通過(guò)有機(jī)融合方式實(shí)現(xiàn)人機(jī)混合智能。

建議未來(lái)重點(diǎn)研究方向：人機(jī)混合的智能通道構(gòu)建及其方式（近幾年發(fā)展迅速的腦機(jī)接口技術(shù)、思維融合范式等）；探索這類新型智能范式的主要特征是什么，是否圖靈計(jì)算等價(jià)，是對(duì)當(dāng)前計(jì)算智能的改良還是顛覆，以及數(shù)據(jù)科學(xué)在其中發(fā)揮什么樣的作用等。這些開(kāi)放性問(wèn)題研究將為數(shù)據(jù)科學(xué)和計(jì)算智能帶來(lái)新的視野和機(jī)會(huì)。

圖靈測(cè)試以外的通用人工智能測(cè)試

圖靈測(cè)試是早期普遍被接受的人工智能測(cè)試準(zhǔn)則，主要通過(guò)測(cè)試者（人）與被測(cè)試者（機(jī)器）在隔離情況下的問(wèn)答來(lái)測(cè)試機(jī)器的智能。這是一種非常巧妙的思想實(shí)驗(yàn)，但并非工程實(shí)驗(yàn)。圖靈測(cè)試的?3?個(gè)開(kāi)放特點(diǎn)——問(wèn)題開(kāi)放、測(cè)試者開(kāi)放、語(yǔ)言開(kāi)放，導(dǎo)致真正可重復(fù)的圖靈測(cè)試很難實(shí)現(xiàn)。而在一般的計(jì)算智能設(shè)計(jì)中，一個(gè)重要準(zhǔn)則就是需要可重復(fù)且有效的評(píng)價(jià)方式。

建議未來(lái)重點(diǎn)研究方向：探尋圖靈測(cè)試之外更加科學(xué)有效的通用人工智能測(cè)試方法，以及探索以人作為標(biāo)準(zhǔn)答案和參照系之外的可重復(fù)且有效的智能評(píng)價(jià)標(biāo)準(zhǔn)。

領(lǐng)域無(wú)關(guān)的數(shù)據(jù)分類體系與評(píng)價(jià)指標(biāo)

數(shù)據(jù)科學(xué)研究中的數(shù)據(jù)常常來(lái)自各個(gè)不同的領(lǐng)域，領(lǐng)域之間的數(shù)據(jù)類型、數(shù)據(jù)完整性、數(shù)據(jù)規(guī)律等具有非常大的差異性。我們不能只針對(duì)某個(gè)特定領(lǐng)域的數(shù)據(jù)來(lái)談?wù)摂?shù)據(jù)科學(xué)，而應(yīng)該對(duì)所有領(lǐng)域的數(shù)據(jù)建立一套共同的話語(yǔ)體系和統(tǒng)一的度量標(biāo)準(zhǔn)。換句話說(shuō)，需要對(duì)不同領(lǐng)域的大數(shù)據(jù)，進(jìn)行領(lǐng)域無(wú)關(guān)的科學(xué)分類，構(gòu)建跨領(lǐng)域、可泛化的數(shù)據(jù)評(píng)價(jià)指標(biāo)和體系。

建議未來(lái)重點(diǎn)研究方向：可以從數(shù)據(jù)質(zhì)量、多樣性、復(fù)雜性、不確定性或價(jià)值密度等多個(gè)維度出發(fā)，定義數(shù)據(jù)的統(tǒng)一評(píng)價(jià)指標(biāo)。這樣的評(píng)價(jià)指標(biāo)可以使不同領(lǐng)域的研究者對(duì)數(shù)據(jù)擁有共同話語(yǔ)體系，有利于以數(shù)據(jù)作為研究對(duì)象開(kāi)展持續(xù)的科學(xué)化研究。

可信任的數(shù)據(jù)共享與流通

大數(shù)據(jù)是數(shù)據(jù)科學(xué)的研究基礎(chǔ)和研究對(duì)象，數(shù)據(jù)科學(xué)的發(fā)展離不開(kāi)良性的數(shù)據(jù)治理和大數(shù)據(jù)基礎(chǔ)環(huán)境建設(shè)。其中一大挑戰(zhàn)問(wèn)題是可信任的數(shù)據(jù)共享與流通。數(shù)據(jù)不同于傳統(tǒng)商品，可能會(huì)存在無(wú)限復(fù)制和無(wú)限使用的問(wèn)題，因而造成數(shù)據(jù)流通價(jià)值失效。

建議未來(lái)重點(diǎn)研究方向：如何用技術(shù)手段來(lái)確保數(shù)據(jù)共享和流通的有效與安全，其中數(shù)據(jù)供給和數(shù)據(jù)使用是?2?個(gè)關(guān)鍵環(huán)節(jié)。在數(shù)據(jù)供給方面，可以考慮數(shù)據(jù)的有限供給，通過(guò)技術(shù)的手段對(duì)數(shù)據(jù)進(jìn)行限量發(fā)行。例如，通過(guò)對(duì)使用數(shù)據(jù)的工具增加保護(hù)機(jī)制，實(shí)現(xiàn)數(shù)據(jù)的有償服務(wù)。也可以利用區(qū)塊鏈等技術(shù)，保證數(shù)據(jù)的單方持有。在數(shù)據(jù)使用方面，需要考慮數(shù)據(jù)的有界使用，保證數(shù)據(jù)的使用不涉及用戶隱私等問(wèn)題。具體來(lái)說(shuō)，可以利用密碼學(xué)、聯(lián)邦學(xué)習(xí)等手段，在保證隱私的前提下加密數(shù)據(jù)的傳輸，通過(guò)確立數(shù)據(jù)類型或關(guān)系而非獲得數(shù)據(jù)本身作為數(shù)據(jù)使用的主要方式。數(shù)據(jù)的共享和流通是數(shù)據(jù)開(kāi)放研究的基礎(chǔ)，期待未來(lái)有更多的人關(guān)注數(shù)據(jù)開(kāi)放的技術(shù)手段研究。

未來(lái)展望：開(kāi)啟“第五范式”科學(xué)研究

在過(guò)去十幾年間，隨著可獲得和可使用的大數(shù)據(jù)持續(xù)增長(zhǎng)，第四范式作為一種新的科學(xué)研究范式，受到科學(xué)家越來(lái)越多的關(guān)注；同時(shí)，也暴露出了很多不足。譬如：數(shù)據(jù)不確定性問(wèn)題、數(shù)據(jù)復(fù)雜性問(wèn)題、數(shù)據(jù)的維數(shù)爆炸問(wèn)題、數(shù)據(jù)的尺度邊界問(wèn)題等。目前，網(wǎng)絡(luò)科學(xué)、腦科學(xué)、社會(huì)科學(xué)等領(lǐng)域面臨的重大問(wèn)題都是極其復(fù)雜且動(dòng)態(tài)變化的難題，采用經(jīng)典物理一樣的簡(jiǎn)單實(shí)驗(yàn)（第一范式）、基于公理和假說(shuō)的理論推演（第二范式）、基于模型的計(jì)算機(jī)模擬（第三范式）和數(shù)據(jù)驅(qū)動(dòng)的相關(guān)性分析（第四范式）都無(wú)法解決。為此，科學(xué)家開(kāi)始尋求更接近數(shù)據(jù)和智能本質(zhì)、更有效認(rèn)識(shí)復(fù)雜性和不確定性的新科學(xué)研究范式。目前，這類新的科學(xué)探索方法論尚未形成定論，大體上看，這類新的科學(xué)研究范式是以智能為研究目標(biāo)的浸入式具身研究，我們暫時(shí)稱之為“第五范式”。基于數(shù)據(jù)科學(xué)本體論認(rèn)識(shí)，我們猜測(cè)“第五范式”和第四范式一樣都會(huì)以數(shù)據(jù)為對(duì)象，不同的是“第五范式”更側(cè)重于人、機(jī)器及數(shù)據(jù)之間交互，強(qiáng)調(diào)人的決策機(jī)制與數(shù)據(jù)分析的融合，體現(xiàn)了數(shù)據(jù)和智能的有機(jī)結(jié)合；“第五范式”強(qiáng)調(diào)從本體論的角度看待數(shù)據(jù)，認(rèn)為數(shù)據(jù)本身蘊(yùn)含自然智能的規(guī)律，也是新型智能的載體和產(chǎn)物，期望在數(shù)據(jù)驅(qū)動(dòng)智能的同時(shí)突破現(xiàn)有計(jì)算智能的能力邊界，借助自然智能構(gòu)造新型智能范式。

目前，針對(duì)“第五范式”的探索剛剛起步，從方法論上還歸納不出它的基本特征；但可以肯定，它的一個(gè)重要特征是“融合”，既要融合前四種范式，又要融合統(tǒng)計(jì)學(xué)、網(wǎng)絡(luò)科學(xué)、腦科學(xué)等前沿研究中涌現(xiàn)的新方法。第三范式和第四范式都用到計(jì)算機(jī)：第三范式是“人腦+計(jì)算機(jī)”，人腦是主角；第四范式是“計(jì)算機(jī)+人腦”，計(jì)算機(jī)是主角。第五范式既強(qiáng)調(diào)人腦與計(jì)算機(jī)的“有機(jī)融合”，也可能更進(jìn)一步從社會(huì)系統(tǒng)和人腦系統(tǒng)借鑒其中的計(jì)算與決策機(jī)制，從而更重視人和社會(huì)在科學(xué)研究回路中的形式化建模與計(jì)算融合。

數(shù)據(jù)科學(xué)和計(jì)算智能的發(fā)展催生“第五范式”；“第五范式”發(fā)展離不開(kāi)對(duì)數(shù)據(jù)科學(xué)內(nèi)涵的豐富和計(jì)算智能能力邊界的突破。從研究對(duì)象看，“第五范式”是科學(xué)研究從對(duì)物理世界、人類社會(huì)的研究拓展到“人-機(jī)-物”融合的三元空間；從研究目標(biāo)上看，“第五范式”不僅僅是傳統(tǒng)的科學(xué)發(fā)現(xiàn)，更是對(duì)智能系統(tǒng)的探索和實(shí)現(xiàn)；從研究方法上看，“第五范式”強(qiáng)調(diào)人在回路的浸入式具身研究。目前，還難以給出“第五范式”的清晰界定，也許再過(guò)?10—20?年，“第五范式”的特征就明朗了，可能逐步成為科學(xué)研究的主流范式之一。（作者：程學(xué)旗、沈華偉、李國(guó)杰，中國(guó)科學(xué)院計(jì)算技術(shù)研究所; 梅宏，北京大學(xué)；趙偉，阿聯(lián)酋沙迦美國(guó)大學(xué)；華云生，香港中文大學(xué)；《中國(guó)科學(xué)院院刊》供稿）

911国产在线专区,国产精品亚洲片在线va,亚洲欧美国产天堂,按摩喷潮在线播放无码,国产口爆吞精视频网站,比较有韵味的熟妇无码

數(shù)據(jù)科學(xué)與計(jì)算智能：內(nèi)涵、范式與機(jī)遇

相關(guān)文章