<noscript id="wwww0"><dd id="wwww0"></dd></noscript>
<nav id="wwww0"><code id="wwww0"></code></nav>
      • <small id="wwww0"></small><sup id="wwww0"><cite id="wwww0"></cite></sup>
      • <sup id="wwww0"></sup>

        911国产在线专区,国产精品亚洲片在线va,亚洲欧美国产天堂,按摩喷潮在线播放无码,国产口爆吞精视频网站,比较有韵味的熟妇无码

         
         

        數(shù)據(jù)科學(xué)與計(jì)算智能:內(nèi)涵、范式與機(jī)遇

        發(fā)布時(shí)間:2021-01-07 14:35:39  |  來(lái)源:中國(guó)網(wǎng)·中國(guó)發(fā)展門戶網(wǎng)  |  作者:程學(xué)旗、沈華偉等  |  責(zé)任編輯:張蔚藍(lán)
        關(guān)鍵詞:數(shù)據(jù)科學(xué),計(jì)算智能,大數(shù)據(jù),智能系統(tǒng),范式

        中國(guó)網(wǎng)/中國(guó)發(fā)展門戶網(wǎng)訊 大數(shù)據(jù)已成為信息社會(huì)的普遍現(xiàn)象,是數(shù)字經(jīng)濟(jì)的關(guān)鍵資源。以深度學(xué)習(xí)為代表的大數(shù)據(jù)驅(qū)動(dòng)的人工智能技術(shù)在很多行業(yè)和領(lǐng)域獲得了成功,這類人工智能本質(zhì)上源于計(jì)算能力,故可將其歸為計(jì)算智能?。與此同時(shí),大數(shù)據(jù)是這類人工智能成功的重要因素,這類智能也被稱為數(shù)據(jù)驅(qū)動(dòng)的計(jì)算智能,從這個(gè)意義上講,當(dāng)前數(shù)據(jù)和智能是一體兩面的關(guān)系。雖然大數(shù)據(jù)與計(jì)算智能技術(shù)在大規(guī)模工程化應(yīng)用方面取得了長(zhǎng)足進(jìn)步,但支撐技術(shù)進(jìn)步的理論基礎(chǔ)和技術(shù)體系尚處于早期階段。當(dāng)前,大數(shù)據(jù)紅利效應(yīng)在逐漸減弱,計(jì)算智能技術(shù)的單點(diǎn)突破難以為大數(shù)據(jù)驅(qū)動(dòng)的智能應(yīng)用提供持續(xù)支撐,亟待對(duì)數(shù)據(jù)科學(xué)和計(jì)算智能的基礎(chǔ)問(wèn)題進(jìn)行深入思考,重構(gòu)其理論基石,從而推動(dòng)技術(shù)與工程應(yīng)用持續(xù)進(jìn)步和跨越式發(fā)展。

        本文基于香山科學(xué)會(huì)議第?667?次學(xué)術(shù)討論會(huì)與會(huì)專家學(xué)者的集體智慧,探討并總結(jié)了?4?個(gè)方面的問(wèn)題:在數(shù)據(jù)科學(xué)的內(nèi)涵和外延尚缺乏嚴(yán)謹(jǐn)定義和學(xué)界共識(shí)的情況下,如何深入認(rèn)知反映客觀世界的數(shù)據(jù)空間的共性規(guī)律?數(shù)據(jù)科學(xué)在本體論和方法論?2?個(gè)層面上需要回答的基礎(chǔ)問(wèn)題是什么?如何理解、測(cè)試并評(píng)估現(xiàn)有計(jì)算智能的能力邊界?人腦、復(fù)雜社會(huì)系統(tǒng)、自然進(jìn)化系統(tǒng)等自然智能,往往具備比現(xiàn)有計(jì)算智能更加高效的計(jì)算思維和更加簡(jiǎn)潔優(yōu)美的智能推演與決策能力,是否可以借鑒這些自然智能探索新的人工智能范式?在探討數(shù)據(jù)科學(xué)和計(jì)算智能的同時(shí),有哪些值得關(guān)注的牽引性應(yīng)用?新的智能范式對(duì)解決復(fù)雜的社會(huì)問(wèn)題是否是一個(gè)很好的機(jī)遇?在未來(lái)的發(fā)展中,我們?cè)撊绾伟盐諘r(shí)代機(jī)遇,重點(diǎn)關(guān)注哪些關(guān)鍵科學(xué)挑戰(zhàn),優(yōu)先解決哪些關(guān)鍵問(wèn)題?

         

        數(shù)據(jù)科學(xué)的內(nèi)涵

        基于方法論視角的數(shù)據(jù)科學(xué)內(nèi)涵


        關(guān)于數(shù)據(jù)科學(xué)的內(nèi)涵,一種流行的看法認(rèn)為數(shù)據(jù)科學(xué)就是圖靈獎(jiǎng)得主吉姆·格雷(Jim Gray)提出的第四范式(the fourth paradigm),即在實(shí)驗(yàn)觀測(cè)、理論推演、計(jì)算仿真之后的數(shù)據(jù)驅(qū)動(dòng)的科學(xué)研究范式。第四范式的基本思想是把數(shù)據(jù)看成現(xiàn)實(shí)世界的事物、現(xiàn)象和行為在數(shù)字空間的映射,認(rèn)為數(shù)據(jù)自然蘊(yùn)含了現(xiàn)實(shí)世界的運(yùn)行規(guī)律;進(jìn)而以數(shù)據(jù)作為媒介,利用數(shù)據(jù)驅(qū)動(dòng)及數(shù)據(jù)分析方法揭示物理世界現(xiàn)象所蘊(yùn)含的科學(xué)規(guī)律。這是一種類似方法論視角來(lái)定義的數(shù)據(jù)科學(xué)的內(nèi)涵,即數(shù)據(jù)驅(qū)動(dòng)科學(xué)發(fā)現(xiàn)。

         

        第四范式將數(shù)據(jù)科學(xué)從其前的?3?個(gè)科學(xué)研究范式中分離出來(lái),帶來(lái)了科學(xué)發(fā)現(xiàn)和思維方式的革命性改變。借用美國(guó)谷歌公司研究部主任皮特·諾維格(Peter Norvig)的話來(lái)說(shuō),所有的模型都是錯(cuò)誤的,進(jìn)一步說(shuō),沒(méi)有模型你也可以成功(all models are wrong, and increasingly you can succeed without them。海量的數(shù)據(jù)使得我們可以在不依靠模型和假設(shè)的情況下,直接通過(guò)對(duì)數(shù)據(jù)進(jìn)行分析發(fā)現(xiàn)過(guò)去的科學(xué)研究方法發(fā)現(xiàn)不了的新模式、新知識(shí)甚至新規(guī)律。第四范式的一個(gè)典型研究案例是關(guān)于帕金森病的起因研究。通過(guò)對(duì)?160?萬(wàn)份病歷的大數(shù)據(jù)分析,研究人員發(fā)現(xiàn)帕金森病的起因與人的闌尾有關(guān)。這是基于大數(shù)據(jù)統(tǒng)計(jì)帕金森病患病率與切除闌尾的相關(guān)性得出的結(jié)論。

         

        第四范式通過(guò)大數(shù)據(jù)分析能夠發(fā)現(xiàn)數(shù)據(jù)中蘊(yùn)含的大量相關(guān)關(guān)系,為科學(xué)發(fā)現(xiàn)提供了新視野。但是,第四范式本身無(wú)法從大量的相關(guān)關(guān)系中甄別出事物的本質(zhì)規(guī)律。在發(fā)現(xiàn)了帕金森病和闌尾的相關(guān)性后,有些對(duì)第四范式十分執(zhí)著的學(xué)者召集了更大量的帕金森病患者,以徹查他們的基因,調(diào)查他們的生活環(huán)境和生活習(xí)慣,以期從中發(fā)現(xiàn)一些共性;然后去找那些也有這些共性但是沒(méi)有得帕金森病的人,看他們做了什么,有什么共性;如果這種共性存在,可能就是防治帕金森病的解決方案。但是,其結(jié)論卻不盡人意。可以想象,人體的器官何止一個(gè)闌尾,且帕金森病患者的生活習(xí)慣何其繁雜,單獨(dú)靠第四范式的數(shù)據(jù)驅(qū)動(dòng)方法做漫無(wú)邊際的相關(guān)性分析,不僅要消耗大量的計(jì)算資源,也難以真正預(yù)測(cè)未來(lái)的趨勢(shì)與變化。因此,從方法論來(lái)看,第四范式在揭示事物本質(zhì)規(guī)律方面存在固有的局限性,數(shù)據(jù)科學(xué)需要在方法論上突破第四范式。

         

        基于本體論視角的數(shù)據(jù)科學(xué)內(nèi)涵

         

        數(shù)據(jù)科學(xué)另外一種值得探討的內(nèi)涵是基于本體論視角,認(rèn)為數(shù)據(jù)是反映自然世界的符號(hào)化表示。既然自然世界是客觀存在并具備共性科學(xué)規(guī)律的,那么反映自然世界的數(shù)據(jù)空間也可能具有獨(dú)立于各個(gè)領(lǐng)域的一般性規(guī)律。因而,數(shù)據(jù)科學(xué)應(yīng)該是用科學(xué)方法來(lái)研究數(shù)據(jù),數(shù)據(jù)科學(xué)也應(yīng)該有類似信息論這樣的學(xué)科基礎(chǔ)理論。更具體來(lái)看,當(dāng)我們把世界看成是由物理世界、機(jī)器世界和人類社會(huì)組成的三元世界時(shí),新型的感知、計(jì)算、通信、控制等信息技術(shù)使三元世界相互影響和融合,形成了一個(gè)平行化(孿生)的復(fù)雜數(shù)據(jù)空間。這樣的數(shù)據(jù)空間,除了映射物理世界,其本身是否具有獨(dú)特的一般性規(guī)律?如何用科學(xué)的方法來(lái)研究數(shù)據(jù)的一般性規(guī)律,揭示其內(nèi)在機(jī)理?這些是數(shù)據(jù)科學(xué)更基本的問(wèn)題。例如,數(shù)據(jù)科學(xué)中的一些常數(shù)規(guī)律(對(duì)稱性、黃金分割、長(zhǎng)尾分布等)和更廣意義上的大數(shù)據(jù)非確定性、數(shù)據(jù)廣義關(guān)聯(lián)、時(shí)空演化、數(shù)據(jù)復(fù)雜性等。

         

        數(shù)據(jù)科學(xué)是方法論和本體論在數(shù)據(jù)價(jià)值實(shí)現(xiàn)目標(biāo)下的統(tǒng)一

         

        數(shù)據(jù)科學(xué)到底應(yīng)該從哪些視角來(lái)定義其獨(dú)有的內(nèi)涵與特征?一般認(rèn)為,作為一門學(xué)科的定義,至少應(yīng)該從其研究對(duì)象、方法論和學(xué)科目標(biāo)?3?個(gè)維度去界定。數(shù)據(jù)科學(xué)的內(nèi)涵應(yīng)該既包括本體論內(nèi)容和方法論內(nèi)容,還包括其獨(dú)特的價(jià)值實(shí)現(xiàn)目標(biāo)(圖?1)。基于這一認(rèn)知,可以定義數(shù)據(jù)科學(xué)是有關(guān)數(shù)據(jù)價(jià)值鏈實(shí)現(xiàn)過(guò)程的基礎(chǔ)理論和方法學(xué),它運(yùn)用基于分析、建模、計(jì)算和學(xué)習(xí)雜糅的方法,研究從數(shù)據(jù)到信息、從信息到知識(shí)、從知識(shí)到?jīng)Q策的轉(zhuǎn)換,并實(shí)現(xiàn)對(duì)現(xiàn)實(shí)世界的認(rèn)知和操控。這三個(gè)轉(zhuǎn)換、一個(gè)實(shí)現(xiàn)是數(shù)據(jù)科學(xué)的學(xué)科目標(biāo)。而實(shí)現(xiàn)這一目標(biāo)的方法論來(lái)自多個(gè)學(xué)科方法的融合,包括數(shù)學(xué)(特別是統(tǒng)計(jì)學(xué))、計(jì)算機(jī)科學(xué)(特別是人工智能)、社會(huì)科學(xué)(特別是管理學(xué))等。

        數(shù)據(jù)科學(xué)與相關(guān)學(xué)科的關(guān)系

         

        目前,關(guān)于數(shù)據(jù)科學(xué)的基本內(nèi)涵和基礎(chǔ)問(wèn)題還沒(méi)有像數(shù)學(xué)、物理學(xué)和計(jì)算機(jī)科學(xué)那樣成體系、有共識(shí)。但是,數(shù)據(jù)科學(xué)的多學(xué)科交叉特征及大數(shù)據(jù)自身的價(jià)值特性已經(jīng)成為共識(shí)。我們可以借助相關(guān)學(xué)科來(lái)探討當(dāng)前數(shù)據(jù)科學(xué)研究需要關(guān)注的基礎(chǔ)問(wèn)題。

         

        數(shù)據(jù)科學(xué)與統(tǒng)計(jì)學(xué)。統(tǒng)計(jì)學(xué)將數(shù)據(jù)作為研究對(duì)象,致力于收集、描述、分析和解釋數(shù)據(jù),其為數(shù)據(jù)科學(xué)提供了重要基礎(chǔ)和工具。然而,在大數(shù)據(jù)面前,統(tǒng)計(jì)學(xué)也面臨著諸多問(wèn)題和挑戰(zhàn)。例如:統(tǒng)計(jì)假設(shè)在復(fù)雜大數(shù)據(jù)分析中難以滿足、數(shù)據(jù)自身及分析結(jié)果的真?zhèn)坞y以判定、端到端的大數(shù)據(jù)推斷缺乏基礎(chǔ)理論支撐等。統(tǒng)計(jì)學(xué)針對(duì)這些問(wèn)題目前基本上是束手無(wú)策的;而統(tǒng)計(jì)學(xué)所依賴的一些傳統(tǒng)強(qiáng)假設(shè)(如獨(dú)立同分布假設(shè)、低維假設(shè)等),也都無(wú)法適用于目前多源異質(zhì)的真實(shí)數(shù)據(jù)。因此,數(shù)據(jù)科學(xué)雖然在研究對(duì)象上和統(tǒng)計(jì)學(xué)是相同的,但在研究問(wèn)題的范疇上卻是超越統(tǒng)計(jì)學(xué)的。譬如:數(shù)據(jù)科學(xué)該如何深入認(rèn)識(shí)數(shù)據(jù)固有的共性規(guī)律?是否能建立一套數(shù)據(jù)復(fù)雜性理論體系?數(shù)據(jù)規(guī)模、數(shù)據(jù)質(zhì)量和數(shù)據(jù)價(jià)值有什么定量關(guān)系?如何刻畫(huà)大數(shù)據(jù)所表現(xiàn)出來(lái)的多層面的非確定性特征?

         

        數(shù)據(jù)科學(xué)與網(wǎng)絡(luò)科學(xué)。數(shù)據(jù)科學(xué)的發(fā)展可以借鑒網(wǎng)絡(luò)科學(xué)的發(fā)展歷程,以類似的方法尋找研究對(duì)象的共性規(guī)律。網(wǎng)絡(luò)科學(xué)發(fā)現(xiàn)了物理世界中廣泛存在的網(wǎng)絡(luò)所呈現(xiàn)出的共性規(guī)律(如冪率分布、小世界現(xiàn)象等),從而促進(jìn)了其從圖論和隨機(jī)圖論中分離出來(lái)獨(dú)立發(fā)展,實(shí)現(xiàn)了其研究對(duì)象從作為數(shù)學(xué)工具的圖到作為物理對(duì)象的網(wǎng)絡(luò)的轉(zhuǎn)變。那么在數(shù)據(jù)科學(xué)中,數(shù)據(jù)的共性規(guī)律是什么?在現(xiàn)實(shí)世界中是否有完全不同的兩個(gè)數(shù)據(jù)集之間存在某種共性?一方面,一下子找到所有領(lǐng)域的共性規(guī)律可能是不現(xiàn)實(shí)的,因而可以先從幾個(gè)關(guān)鍵領(lǐng)域出發(fā),尋找部分領(lǐng)域的共性規(guī)律;另一方面,尋找數(shù)據(jù)的共性規(guī)律需要能夠問(wèn)出合適的基礎(chǔ)性問(wèn)題,類似網(wǎng)絡(luò)科學(xué)中關(guān)于度分布、聚集系數(shù)、網(wǎng)絡(luò)直徑、網(wǎng)絡(luò)脆弱性、網(wǎng)絡(luò)適航性等方面的問(wèn)題。目前,尚不明確各個(gè)領(lǐng)域的數(shù)據(jù)是否存在統(tǒng)一的規(guī)律。因此,數(shù)據(jù)科學(xué)還需要在應(yīng)用領(lǐng)域進(jìn)行一定時(shí)間的探索,從領(lǐng)域知識(shí)中汲取養(yǎng)分,并逐步發(fā)現(xiàn)規(guī)律、尋找共性。

         

        數(shù)據(jù)科學(xué)與計(jì)算機(jī)科學(xué)。數(shù)據(jù)科學(xué)的起源與發(fā)展離不開(kāi)計(jì)算機(jī)科學(xué),但這兩個(gè)學(xué)科由于研究對(duì)象和研究方法的不同,未來(lái)也許會(huì)平行發(fā)展。簡(jiǎn)單而言,從研究對(duì)象的角度來(lái)說(shuō),計(jì)算機(jī)科學(xué)是關(guān)于算法的科學(xué),而數(shù)據(jù)科學(xué)是關(guān)于數(shù)據(jù)的科學(xué)。從計(jì)算機(jī)科學(xué)到數(shù)據(jù)科學(xué),研究手段從傳統(tǒng)計(jì)算機(jī)領(lǐng)域的算法復(fù)雜性分析,轉(zhuǎn)變?yōu)閷?duì)數(shù)據(jù)的復(fù)雜性和非確定性等特性進(jìn)行分析研究。如何對(duì)非確定邊界的數(shù)據(jù),在有限時(shí)間空間下進(jìn)行計(jì)算?數(shù)據(jù)復(fù)雜性、模型復(fù)雜性與模型性能之間是什么關(guān)系?解決某個(gè)問(wèn)題所需要的大數(shù)據(jù)的量的邊界如何確定?是否能發(fā)展一套理論,為基于大數(shù)據(jù)的計(jì)算模型提供其能力上、下界的保證?這些都是數(shù)據(jù)科學(xué)獨(dú)立于計(jì)算機(jī)科學(xué)之外所需要解決的問(wèn)題。

         

        數(shù)據(jù)科學(xué)目前尚處于發(fā)展的早期階段,其研究方法也應(yīng)該與傳統(tǒng)科學(xué)有所區(qū)分。數(shù)據(jù)科學(xué),正處于無(wú)知科學(xué)的中間狀態(tài)。它目前還沒(méi)有形成一門完整的學(xué)科——信息是不完備的,環(huán)境也是非確定的。因此,不能完全按照傳統(tǒng)學(xué)科來(lái)思考和要求數(shù)據(jù)科學(xué);而應(yīng)該在這樣不完備、非確定的環(huán)境下,重新思考和定義數(shù)據(jù)科學(xué)及數(shù)據(jù)科學(xué)亟待關(guān)注的基礎(chǔ)問(wèn)題。

         

        計(jì)算智能的發(fā)展與新型智能范式的探索

        計(jì)算智能的發(fā)展

         

        人工智能(AI)概念在1956年由麥卡錫等學(xué)者提出,其發(fā)展幾經(jīng)浮沉。基于對(duì)智能產(chǎn)生機(jī)制的不同理解,人工智能發(fā)展至今學(xué)派眾多,且相互借鑒,形成了一系列代表性成果。無(wú)論是早期符號(hào)計(jì)算(以數(shù)理邏輯為基礎(chǔ))、進(jìn)化計(jì)算、支持向量機(jī)、貝葉斯網(wǎng)絡(luò),還是當(dāng)前在工業(yè)界獲得巨大成功的基于多層神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)方法,從模型的本質(zhì)上來(lái)看都是建立在圖靈機(jī)的基礎(chǔ)上,基本都符合邱奇-圖靈論題(Church-Turing thesis),即任何在算法上可計(jì)算的問(wèn)題同樣可由圖靈機(jī)計(jì)算。換句話說(shuō),現(xiàn)有的人工智能模型本質(zhì)上都是與圖靈計(jì)算模型等價(jià)的,故可歸為計(jì)算智能。計(jì)算智能一般以計(jì)算機(jī)為中心,以算法理論為基礎(chǔ),充分利用現(xiàn)代計(jì)算機(jī)的計(jì)算特性,給出了解決實(shí)際問(wèn)題的形式化模型和算法。

         

        ?10?多年以來(lái),大數(shù)據(jù)的使用、算力的提升和深度模型的發(fā)展,為計(jì)算智能帶來(lái)了新的契機(jī)。大數(shù)據(jù)、大算力、大模型三者結(jié)合,極大地推動(dòng)了計(jì)算智能的工業(yè)化應(yīng)用。例如,計(jì)算智能在以圍棋為代表的人機(jī)對(duì)弈、機(jī)器翻譯、人臉識(shí)別、語(yǔ)音識(shí)別、人機(jī)對(duì)話、自動(dòng)駕駛等應(yīng)用中均取得了巨大的成功。值得注意的是,大數(shù)據(jù)在給計(jì)算智能帶來(lái)發(fā)展的同時(shí),其復(fù)雜性和非確定性也給計(jì)算智能帶來(lái)了非常大的挑戰(zhàn)。現(xiàn)有的計(jì)算智能在面臨大數(shù)據(jù)環(huán)境下的復(fù)雜問(wèn)題和復(fù)雜系統(tǒng)時(shí),依然很難給出滿意的答案。我們需要探索當(dāng)前計(jì)算智能的能力邊界問(wèn)題,從理論上探尋這類智能所能解決的問(wèn)題類型和能力邊界。譬如,通過(guò)建立深度學(xué)習(xí)和統(tǒng)計(jì)力學(xué)的關(guān)系,回答深度學(xué)習(xí)的相關(guān)基礎(chǔ)問(wèn)題:表達(dá)能力方面,模型做深為什么是必要的,到底深度為多少層是合理的?模型學(xué)習(xí)方面,崎嶇的目標(biāo)函數(shù)如何高效優(yōu)化? 泛化能力方面,如何實(shí)現(xiàn)計(jì)算智能技術(shù)從專用到通用的轉(zhuǎn)變?如何實(shí)現(xiàn)模型的跨領(lǐng)域、跨任務(wù)、跨模態(tài)的泛化?

         

        上述一系列基礎(chǔ)問(wèn)題將進(jìn)一步成為計(jì)算智能未來(lái)發(fā)展的關(guān)鍵瓶頸。其原因是,當(dāng)前的計(jì)算智能是大數(shù)據(jù)工程化驅(qū)動(dòng)的,其能力的提升主要依賴于數(shù)據(jù)規(guī)模的增加和計(jì)算速度的增長(zhǎng)。如果缺乏數(shù)據(jù)科學(xué)化理論的支撐,大數(shù)據(jù)驅(qū)動(dòng)的計(jì)算智能難以形成從量變到質(zhì)變的提升。那么另一種思路是,我們也許可以考慮發(fā)展與當(dāng)前計(jì)算智能不一樣的智能范式,以便更加簡(jiǎn)潔高效地解決更復(fù)雜、更普適的現(xiàn)實(shí)問(wèn)題。

         

        新型智能范式的探索

         

        事實(shí)上,自然界中存在大量具備智能的自然系統(tǒng)。這些自然系統(tǒng)比現(xiàn)有人工智能系統(tǒng)具備更加簡(jiǎn)潔、高效的邏輯推理和自我學(xué)習(xí)能力,如腦神經(jīng)系統(tǒng)、社會(huì)系統(tǒng)、自然生態(tài)系統(tǒng)等。那么,自然系統(tǒng)的智能模型是什么?我們能否借鑒自然系統(tǒng)中的智能行為,將其形式化為可計(jì)算的智能范式?實(shí)際上,已有?4?類智能范式在此方面做出了一些初步的探索。

         

        腦啟發(fā)計(jì)算

         

        人類的大腦皮層具有?140?160?億個(gè)神經(jīng)元,且每個(gè)神經(jīng)元會(huì)連接?1?00010?000?個(gè)其他神經(jīng)元,借此人類發(fā)展出了比其他物種更高級(jí)的智慧。腦啟發(fā)計(jì)算(brain-inspired computing)正是借鑒了人腦存儲(chǔ)、處理信息的基本原理所發(fā)展出來(lái)的一種新型計(jì)算技術(shù)。與傳統(tǒng)圖靈計(jì)算機(jī)的計(jì)算模式相比,腦啟發(fā)計(jì)算是通過(guò)增加空間復(fù)雜度來(lái)保留計(jì)算單元之間的結(jié)構(gòu)相關(guān)性,從而構(gòu)造基于神經(jīng)形態(tài)工程的高速、新型計(jì)算架構(gòu)。腦啟發(fā)計(jì)算的目標(biāo)是構(gòu)造一套非?·?諾依曼架構(gòu)、可實(shí)時(shí)處理復(fù)雜非結(jié)構(gòu)化信息、超低功耗的高速新型計(jì)算架構(gòu)。腦啟發(fā)計(jì)算的發(fā)展,也許能為數(shù)據(jù)科學(xué)提供新的計(jì)算架構(gòu)和高性能的計(jì)算能力,支撐通用人工智能的發(fā)展。目前,腦啟發(fā)計(jì)算仍處于起步階段,我們需要進(jìn)一步思考如何在不完全了解人腦機(jī)制的情況下發(fā)展腦啟發(fā)計(jì)算模式,以及如何基于這種腦啟發(fā)計(jì)算為科學(xué)研究提供新思路和新范式。

         

        演化智能

         

        學(xué)習(xí)和演化是生物適應(yīng)環(huán)境的基本方式。現(xiàn)有的計(jì)算智能基本都擁有從數(shù)據(jù)中學(xué)習(xí)的能力,但對(duì)智能模型的演化能力缺乏關(guān)注。例如,人腦是經(jīng)過(guò)數(shù)百萬(wàn)年的演化逐步形成的。從這個(gè)角度來(lái)講,現(xiàn)有的智能模型在依靠人類設(shè)計(jì)之外,是否也能通過(guò)演化過(guò)程去自動(dòng)發(fā)現(xiàn)最佳的模型結(jié)構(gòu)?傳統(tǒng)的遺傳算法是一種基礎(chǔ)的演化計(jì)算模型;而從演化計(jì)算到演化智能,以及實(shí)現(xiàn)模型自動(dòng)演化的智能范式,還有很長(zhǎng)的路要走。未來(lái),交互驅(qū)動(dòng)的強(qiáng)化學(xué)習(xí)、開(kāi)放環(huán)境下的人工智能是值得探索的方向。

         

        復(fù)雜系統(tǒng)模擬

         

        自然界存在大量的復(fù)雜系統(tǒng),如人類社會(huì)系統(tǒng)、自然生態(tài)系統(tǒng)、人體免疫系統(tǒng)等。從控制和計(jì)算的角度來(lái)看,模型化的復(fù)雜系統(tǒng)是由大量相互作用、相互依賴的單元構(gòu)成的一個(gè)整體系統(tǒng);一般在沒(méi)有中央控制情況下,這個(gè)整體系統(tǒng)可通過(guò)簡(jiǎn)單的運(yùn)作規(guī)則實(shí)現(xiàn)復(fù)雜的信息處理,進(jìn)而產(chǎn)生復(fù)雜的集體行為,并能通過(guò)學(xué)習(xí)和進(jìn)化產(chǎn)生自生長(zhǎng)和自適應(yīng)能力。是否可以通過(guò)模擬復(fù)雜系統(tǒng)的組成特點(diǎn)和交互方式來(lái)構(gòu)造新型智能范式?如何通過(guò)大量簡(jiǎn)單智能體之間的交互作用,產(chǎn)生可預(yù)期的、具有高度復(fù)雜性的群體智能?這樣的智能范式也許會(huì)從根本上改變傳統(tǒng)的單智能體的智能上限。

         

        人機(jī)混合智能

         

        隨著互聯(lián)網(wǎng)、物聯(lián)網(wǎng)及新一代通信技術(shù)的發(fā)展,萬(wàn)物泛在互聯(lián)成為現(xiàn)實(shí)。未來(lái),大量物理設(shè)備、無(wú)人系統(tǒng)、人腦,通過(guò)泛在網(wǎng)絡(luò)實(shí)現(xiàn)上線互聯(lián)。在這樣的環(huán)境下,人在回路的人機(jī)混合智能具備了基本的物理?xiàng)l件。目前,人工智能技術(shù)所具備的感知、認(rèn)知能力,基本上是模型與數(shù)據(jù)結(jié)合,并以機(jī)器為中心所形成的計(jì)算智能,故也稱為機(jī)器智能。這種機(jī)器智能在存儲(chǔ)、搜索、感知、確定性問(wèn)題求解等方面性能表現(xiàn)優(yōu)越,但在高級(jí)認(rèn)知和復(fù)雜問(wèn)題決策方面與人類智能相差很遠(yuǎn)。雖然腦啟發(fā)計(jì)算取得了一些進(jìn)展,但在可預(yù)期的未來(lái),機(jī)器智能很難完全模仿和構(gòu)造出人類智能或其他自然智能。換一個(gè)思路,如果將人的智能引入到機(jī)器智能的系統(tǒng)回路中,將充分融合人類智能和機(jī)器智能的優(yōu)勢(shì),從而形成更高級(jí)的智能水平。在未來(lái)較長(zhǎng)的一段時(shí)間內(nèi),這種人機(jī)混合智能也許是一些復(fù)雜問(wèn)題求解的有效途徑。

         

        那么,在基于機(jī)器的計(jì)算智能基礎(chǔ)上,人作為具備智能的自然系統(tǒng),如何參與到機(jī)器智能的系統(tǒng)回路中是一個(gè)關(guān)鍵問(wèn)題。人機(jī)混合智能需要重點(diǎn)解決思維融合或決策融合的問(wèn)題。具體而言,傳統(tǒng)的人機(jī)接口往往是單向的;在人機(jī)互聯(lián)情況下,人腦如何參與到機(jī)器智能的系統(tǒng)回路當(dāng)中?如何同時(shí)讓人理解機(jī)器思維和讓機(jī)器理解人的思維,從而實(shí)現(xiàn)思維的無(wú)縫互動(dòng)?目前,一些探索和挖掘思維潛力的工具,如思維導(dǎo)圖、思維地圖、概念圖等,其理論基礎(chǔ)與形式化模型并不清晰。一些新型的腦機(jī)接口技術(shù)進(jìn)展迅速,但缺乏對(duì)人腦在直覺(jué)、意識(shí)、情感和決策方面的機(jī)理認(rèn)知。也許,從技術(shù)上構(gòu)建有效的人在回路智能通道,是當(dāng)前人機(jī)混合智能亟待解決的關(guān)鍵問(wèn)題之一(圖?2)。

         

        小結(jié)

         

        上述?4?類智能范式的研究,在現(xiàn)有圖靈等價(jià)的計(jì)算智能基礎(chǔ)上,或多或少地引入了人類智能或自然系統(tǒng)智能的部分機(jī)制,從而為未來(lái)智能系統(tǒng)的發(fā)展注入新的活力。但是迄今為止,這些智能范式在可形式化、可計(jì)算、可構(gòu)造等方面還存在諸多基礎(chǔ)性問(wèn)題挑戰(zhàn)。如果這些模式是未來(lái)新型智能范式,那么它們是否還是圖靈等價(jià)的?這些問(wèn)題值得我們從本源上進(jìn)行探討。數(shù)據(jù)是人類社會(huì)、物理世界和機(jī)器世界之間的橋梁,同時(shí)數(shù)據(jù)也是人類社會(huì)和物理世界的符號(hào)化映射。因而,從數(shù)據(jù)入手是探索和實(shí)現(xiàn)上述新型智能范式的基本途徑。數(shù)據(jù)科學(xué)基礎(chǔ)理論,不僅對(duì)當(dāng)前數(shù)據(jù)驅(qū)動(dòng)的計(jì)算智能起到提質(zhì)增效的作用,也將為未來(lái)新型智能范式研究提供理論支撐。

         

        引領(lǐng)數(shù)據(jù)科學(xué)與計(jì)算智能研究的應(yīng)用

        作為一門實(shí)踐性強(qiáng)的學(xué)科,數(shù)據(jù)科學(xué)的發(fā)展離不開(kāi)實(shí)際需求牽引與技術(shù)應(yīng)用驅(qū)動(dòng)。隨著感知、計(jì)算、通信、控制等技術(shù)的發(fā)展及綜合集成應(yīng)用,-機(jī)-三元世界高度融合,在線形成了一個(gè)網(wǎng)絡(luò)化的大數(shù)據(jù)系統(tǒng),其內(nèi)部包含了互聯(lián)網(wǎng)、物聯(lián)網(wǎng)連接而成的各類數(shù)據(jù)。這是一個(gè)高度復(fù)雜、強(qiáng)不確定性、持續(xù)動(dòng)態(tài)演化的復(fù)雜系統(tǒng),是系統(tǒng)的系統(tǒng)。它既是智慧城市、智能制造、健康醫(yī)療等各個(gè)領(lǐng)域應(yīng)用的空間載體,也為國(guó)家安全、社會(huì)治理、數(shù)字經(jīng)濟(jì)等領(lǐng)域的科學(xué)化、智能化發(fā)展提供了重要的數(shù)據(jù)資源供給。前文已提及,這個(gè)現(xiàn)實(shí)存在的大數(shù)據(jù)系統(tǒng),除了具備高度復(fù)雜性、強(qiáng)不確定性等特性,人在回路也是其顯著特征。針對(duì)這一現(xiàn)實(shí)系統(tǒng)的研究與應(yīng)用,將有可能為數(shù)據(jù)科學(xué)的理論與技術(shù)發(fā)展帶來(lái)機(jī)遇。針對(duì)這一復(fù)雜系統(tǒng)的典型場(chǎng)景展開(kāi)研究,不僅有利于揭示數(shù)據(jù)的基本規(guī)律,也有可能因此而牽引未來(lái)新型智能范式的研究。其典型的應(yīng)用場(chǎng)景有如下?4?種。

         

        基于非確定數(shù)據(jù)的社會(huì)認(rèn)知。在社會(huì)系統(tǒng)中,我們搜集到的數(shù)據(jù)通常與真實(shí)的情況存在一定的偏差,大量的虛假內(nèi)容、非確定性內(nèi)容混雜在這些數(shù)據(jù)當(dāng)中。如何能基于這樣不完備的、非確定的大數(shù)據(jù)進(jìn)行社會(huì)認(rèn)知是一個(gè)非常有挑戰(zhàn)的問(wèn)題。社會(huì)認(rèn)知具體包括真假判定、社會(huì)心理計(jì)算、輿情判定與導(dǎo)向等。而面向非確定數(shù)據(jù)的社會(huì)認(rèn)知,其中一大關(guān)鍵在于如何對(duì)大量復(fù)雜的非確定數(shù)據(jù)進(jìn)行假設(shè)建模,如何建立復(fù)雜社會(huì)系統(tǒng)中個(gè)人行為與群體社會(huì)認(rèn)知之間的關(guān)聯(lián)。演化智能、復(fù)雜系統(tǒng)仿真與模擬也許是解決這一問(wèn)題的突破口。

         

        基于開(kāi)放環(huán)境的群智決策。互聯(lián)網(wǎng)極大地方便了信息、知識(shí)和智慧的互聯(lián)互通。在互聯(lián)網(wǎng)中,已經(jīng)有許多復(fù)雜問(wèn)題可以通過(guò)群智決策的方式加以有效解決,如眾包計(jì)算、人本計(jì)算等。那么,一方面,未來(lái)我們?cè)撊绾卧O(shè)計(jì)或改進(jìn)群智決策中的內(nèi)部個(gè)體交互、融合與反饋方式,以人工構(gòu)造的群體智能方式進(jìn)一步提升互聯(lián)網(wǎng)群智決策的智能上限?另一方面,從計(jì)算機(jī)的視角來(lái)看,該如何利用或者模擬這種人類的群智決策方式,來(lái)解決一些復(fù)雜的決策問(wèn)題?考慮到智能系統(tǒng)的演化及復(fù)雜系統(tǒng)的仿真與模擬,對(duì)單個(gè)智能體及智能體之間復(fù)雜交互進(jìn)行建模,也許是未來(lái)復(fù)雜問(wèn)題求解的一個(gè)可能方向。

         

        人機(jī)融合的智慧醫(yī)療。智慧醫(yī)療是醫(yī)學(xué)、計(jì)算機(jī)科學(xué)、公共衛(wèi)生學(xué)等學(xué)科相互交叉的新興領(lǐng)域。隨著信息技術(shù)的普及發(fā)展,醫(yī)療領(lǐng)域產(chǎn)生了大量的數(shù)據(jù)(如電子病歷、PB?級(jí)基因數(shù)據(jù)等),也催生了諸多與智慧醫(yī)療相關(guān)的應(yīng)用需求。如何根據(jù)患者的電子病歷及臨床影像等數(shù)據(jù)對(duì)疾病診斷提供輔助決策支持?如何根據(jù)人類的基因數(shù)據(jù),提前進(jìn)行疾病的預(yù)測(cè),為疾病的早期發(fā)現(xiàn)、新生兒的先天缺陷預(yù)測(cè)提供幫助?需要注意的是,智慧醫(yī)療需要強(qiáng)大的可靠性,但目前的人工智能還難以替代醫(yī)生。一種比較好的提高思路是,考慮人(醫(yī)生)在回路的新型智能范式;通過(guò)這樣人機(jī)混合的方式,使得機(jī)器的智能與人的智能相輔相成,使醫(yī)療從傳統(tǒng)的個(gè)體經(jīng)驗(yàn)決策轉(zhuǎn)向智能輔助決策的新模式,進(jìn)而為醫(yī)療系統(tǒng)的革新帶來(lái)新的可能。

         

        重大公共安全問(wèn)題與社會(huì)治理。重大公共安全問(wèn)題指對(duì)社會(huì)和公民所需的穩(wěn)定環(huán)境有嚴(yán)重影響的重大問(wèn)題。公共安全問(wèn)題涉及多方復(fù)雜因素,包括人類社會(huì)、自然環(huán)境、突發(fā)事件等,是典型的人在回路的復(fù)雜應(yīng)用問(wèn)題,急需應(yīng)用大數(shù)據(jù)技術(shù)手段進(jìn)行預(yù)測(cè)、預(yù)警和防控。以新冠肺炎疫情為例,大數(shù)據(jù)分析技術(shù)手段和人機(jī)混合智能,為疫情走勢(shì)預(yù)測(cè)、傳播鏈排查、謠言傳播溯源和意圖研判等人在回路的復(fù)雜問(wèn)題提供了有力幫助,支撐疫情精準(zhǔn)防控。

         

        數(shù)據(jù)科學(xué)與計(jì)算智能的關(guān)鍵問(wèn)題

         

        數(shù)據(jù)科學(xué)的發(fā)展,將幫助我們厘清數(shù)據(jù)科學(xué)的理論邊界,為計(jì)算智能的持續(xù)發(fā)展提供新的可能與機(jī)遇;與此同時(shí),計(jì)算智能的發(fā)展與新型智能范式的興起,也將為大數(shù)據(jù)在各行業(yè)和各領(lǐng)域的應(yīng)用提供新的契機(jī)。在本節(jié),我們從數(shù)據(jù)科學(xué)的基本內(nèi)涵與邊界、新型智能范式與智能能力測(cè)試、數(shù)據(jù)評(píng)價(jià)體系與共享利用?3?個(gè)方面出發(fā),基于香山科學(xué)會(huì)議第?667?次學(xué)術(shù)討論會(huì)與會(huì)專家的討論,提煉形成數(shù)據(jù)科學(xué)與計(jì)算智能領(lǐng)域的七大關(guān)鍵問(wèn)題,以期得到相關(guān)領(lǐng)域研究者的共同關(guān)注,從而把握時(shí)代的機(jī)遇,推動(dòng)數(shù)據(jù)科學(xué)與計(jì)算智能的持續(xù)發(fā)展。

         

        大數(shù)據(jù)中的相關(guān)關(guān)系與因果關(guān)系

         

        因果關(guān)系指一個(gè)變量的發(fā)生會(huì)導(dǎo)致另一個(gè)變量的發(fā)生。而相關(guān)關(guān)系則指一個(gè)變量發(fā)生變化時(shí),另一個(gè)變量也會(huì)規(guī)律性地發(fā)生變化。一般情況下,因果關(guān)系往往也是相關(guān)關(guān)系,而相關(guān)關(guān)系并不一定是因果關(guān)系。大數(shù)據(jù)的存在,使得人們可以廣泛尋求相關(guān)關(guān)系,Mayer-Sch?nberger甚至在其書(shū)中說(shuō)道,大數(shù)據(jù)時(shí)代最大的轉(zhuǎn)變就是放棄對(duì)因果關(guān)系的渴求,而取而代之關(guān)注相關(guān)關(guān)系。相關(guān)關(guān)系確實(shí)能在商業(yè)和實(shí)際應(yīng)用中帶來(lái)巨大的成功,但這種成功從科學(xué)角度尚需謹(jǐn)慎看待。從科學(xué)研究的角度來(lái)看,相關(guān)關(guān)系研究是可以替代因果分析的科學(xué)新發(fā)展,還是因果分析的補(bǔ)充?從實(shí)際應(yīng)用看,從數(shù)據(jù)中挖掘出的相關(guān)關(guān)系能否看作是一種近似因果關(guān)系幫助人們進(jìn)行預(yù)測(cè)或決策?對(duì)此,不同的學(xué)者有不同甚至相反的看法。

         

        建議未來(lái)重點(diǎn)研究方向:相關(guān)關(guān)系能夠逼近因果關(guān)系的程度,相關(guān)關(guān)系和因果關(guān)系的邊界,是否可以利用反事實(shí)推斷從相關(guān)關(guān)系中推斷出因果關(guān)系,以及如何保證大數(shù)據(jù)分析的結(jié)論可信等問(wèn)題。

         

        數(shù)據(jù)科學(xué)的復(fù)雜性問(wèn)題


        在計(jì)算機(jī)科學(xué)中,算法的計(jì)算復(fù)雜性是一個(gè)基本問(wèn)題,包括時(shí)間復(fù)雜性和空間復(fù)雜性。而數(shù)據(jù)科學(xué)除了對(duì)計(jì)算復(fù)雜性的研究外,還需要探索數(shù)據(jù)自身的復(fù)雜性及模型復(fù)雜性。數(shù)據(jù)科學(xué)不能一味地靠增加數(shù)據(jù)量或者模型的參數(shù)規(guī)模來(lái)提升其性能。給定一個(gè)具體問(wèn)題,到底需要多大規(guī)模的數(shù)據(jù)或多復(fù)雜的模型才能獲得有效解?一個(gè)復(fù)雜模型判定能力的提升到底有沒(méi)有盡頭或界限?數(shù)據(jù)規(guī)模和模型復(fù)雜度之間是什么關(guān)系?這些問(wèn)題在大數(shù)據(jù)工程化應(yīng)用中也許可以有經(jīng)驗(yàn)性的判定,但是在數(shù)據(jù)科學(xué)研究中需要弄清楚其基本內(nèi)涵和規(guī)律。

         

        建議未來(lái)重點(diǎn)研究方向:從數(shù)據(jù)科學(xué)理論出發(fā),給出數(shù)據(jù)復(fù)雜性、模型復(fù)雜性和模型性能之間的關(guān)系(上下界或漸進(jìn)理論),為大數(shù)據(jù)的科學(xué)化研究和高效率應(yīng)用奠定重要基礎(chǔ);當(dāng)然,要對(duì)所有領(lǐng)域給出一個(gè)共同的數(shù)據(jù)科學(xué)基礎(chǔ)理論,可能比較困難,但可以考慮先從某些重要領(lǐng)域或典型問(wèn)題出發(fā)進(jìn)行探索。

        有限時(shí)空約束下的無(wú)限數(shù)據(jù)計(jì)算

         

        在很多場(chǎng)景中,解決問(wèn)題所需要的數(shù)據(jù)可能是大量流動(dòng)的,甚至是無(wú)限的——無(wú)法確定其邊界。例如,真實(shí)的自動(dòng)駕駛技術(shù)需要在任意環(huán)境、道路上都確保其有效性,理想情況下我們需要通過(guò)搜集大量的數(shù)據(jù)來(lái)不斷訓(xùn)練自動(dòng)駕駛模型,促使自動(dòng)駕駛水平的提升;但問(wèn)題在于,在實(shí)際操作中我們無(wú)法在有限時(shí)空資源下搜集、處理所有的數(shù)據(jù)。現(xiàn)有的自動(dòng)駕駛技術(shù),也基本都是在有限的實(shí)驗(yàn)室環(huán)境下或者固定的道路上進(jìn)行學(xué)習(xí)訓(xùn)練,以期能夠?qū)崿F(xiàn)在任意環(huán)境和非確定道路上的自動(dòng)駕駛。

         

        建議未來(lái)重點(diǎn)研究方向:面向上述邊界不確定的數(shù)據(jù),到底多大的數(shù)據(jù)量對(duì)問(wèn)題而言是足夠的,以及什么樣的數(shù)據(jù)采樣機(jī)制才能保證逼近數(shù)據(jù)整體分布;或者說(shuō),該如何在有限時(shí)空資源限制下來(lái)處理邊界不確定的數(shù)據(jù)。

         

        強(qiáng)不確定性復(fù)雜系統(tǒng)環(huán)境下的新型智能范式

         

        大數(shù)據(jù)空間融合了-機(jī)-三元世界,其交互方式、運(yùn)行方式極其復(fù)雜。復(fù)雜系統(tǒng)中跨域高維稀疏的大數(shù)據(jù)具有很強(qiáng)的時(shí)空分布不確定性和價(jià)值規(guī)律不確定性。在這樣一個(gè)強(qiáng)不確定性的復(fù)雜環(huán)境下,能否形成形式化、可計(jì)算的新型智能范式?如果存在這樣的智能范式,是否還需要依靠大規(guī)模數(shù)據(jù)驅(qū)動(dòng)?現(xiàn)有的腦啟發(fā)計(jì)算、演化智能、復(fù)雜系統(tǒng)模擬等主要還是依賴計(jì)算機(jī)的計(jì)算能力,未來(lái)還需要進(jìn)一步探索能夠突破計(jì)算機(jī)計(jì)算能力邊界的智能范式。人在回路的人機(jī)混合智能是一個(gè)可能的發(fā)展方向,其目標(biāo)是打通人類智能與機(jī)器智能的融合通道,通過(guò)有機(jī)融合方式實(shí)現(xiàn)人機(jī)混合智能。

         

        建議未來(lái)重點(diǎn)研究方向:人機(jī)混合的智能通道構(gòu)建及其方式(近幾年發(fā)展迅速的腦機(jī)接口技術(shù)、思維融合范式等);探索這類新型智能范式的主要特征是什么,是否圖靈計(jì)算等價(jià),是對(duì)當(dāng)前計(jì)算智能的改良還是顛覆,以及數(shù)據(jù)科學(xué)在其中發(fā)揮什么樣的作用等。這些開(kāi)放性問(wèn)題研究將為數(shù)據(jù)科學(xué)和計(jì)算智能帶來(lái)新的視野和機(jī)會(huì)。

         

        圖靈測(cè)試以外的通用人工智能測(cè)試

         

        圖靈測(cè)試是早期普遍被接受的人工智能測(cè)試準(zhǔn)則,主要通過(guò)測(cè)試者(人)與被測(cè)試者(機(jī)器)在隔離情況下的問(wèn)答來(lái)測(cè)試機(jī)器的智能。這是一種非常巧妙的思想實(shí)驗(yàn),但并非工程實(shí)驗(yàn)。圖靈測(cè)試的?3?個(gè)開(kāi)放特點(diǎn)——問(wèn)題開(kāi)放、測(cè)試者開(kāi)放、語(yǔ)言開(kāi)放,導(dǎo)致真正可重復(fù)的圖靈測(cè)試很難實(shí)現(xiàn)。而在一般的計(jì)算智能設(shè)計(jì)中,一個(gè)重要準(zhǔn)則就是需要可重復(fù)且有效的評(píng)價(jià)方式。

         

        建議未來(lái)重點(diǎn)研究方向:探尋圖靈測(cè)試之外更加科學(xué)有效的通用人工智能測(cè)試方法,以及探索以人作為標(biāo)準(zhǔn)答案和參照系之外的可重復(fù)且有效的智能評(píng)價(jià)標(biāo)準(zhǔn)。

         

        領(lǐng)域無(wú)關(guān)的數(shù)據(jù)分類體系與評(píng)價(jià)指標(biāo)

         

        數(shù)據(jù)科學(xué)研究中的數(shù)據(jù)常常來(lái)自各個(gè)不同的領(lǐng)域,領(lǐng)域之間的數(shù)據(jù)類型、數(shù)據(jù)完整性、數(shù)據(jù)規(guī)律等具有非常大的差異性。我們不能只針對(duì)某個(gè)特定領(lǐng)域的數(shù)據(jù)來(lái)談?wù)摂?shù)據(jù)科學(xué),而應(yīng)該對(duì)所有領(lǐng)域的數(shù)據(jù)建立一套共同的話語(yǔ)體系和統(tǒng)一的度量標(biāo)準(zhǔn)。換句話說(shuō),需要對(duì)不同領(lǐng)域的大數(shù)據(jù),進(jìn)行領(lǐng)域無(wú)關(guān)的科學(xué)分類,構(gòu)建跨領(lǐng)域、可泛化的數(shù)據(jù)評(píng)價(jià)指標(biāo)和體系。

         

        建議未來(lái)重點(diǎn)研究方向:可以從數(shù)據(jù)質(zhì)量、多樣性、復(fù)雜性、不確定性或價(jià)值密度等多個(gè)維度出發(fā),定義數(shù)據(jù)的統(tǒng)一評(píng)價(jià)指標(biāo)。這樣的評(píng)價(jià)指標(biāo)可以使不同領(lǐng)域的研究者對(duì)數(shù)據(jù)擁有共同話語(yǔ)體系,有利于以數(shù)據(jù)作為研究對(duì)象開(kāi)展持續(xù)的科學(xué)化研究。

         

        可信任的數(shù)據(jù)共享與流通

         

        大數(shù)據(jù)是數(shù)據(jù)科學(xué)的研究基礎(chǔ)和研究對(duì)象,數(shù)據(jù)科學(xué)的發(fā)展離不開(kāi)良性的數(shù)據(jù)治理和大數(shù)據(jù)基礎(chǔ)環(huán)境建設(shè)。其中一大挑戰(zhàn)問(wèn)題是可信任的數(shù)據(jù)共享與流通。數(shù)據(jù)不同于傳統(tǒng)商品,可能會(huì)存在無(wú)限復(fù)制和無(wú)限使用的問(wèn)題,因而造成數(shù)據(jù)流通價(jià)值失效。

         

        建議未來(lái)重點(diǎn)研究方向:如何用技術(shù)手段來(lái)確保數(shù)據(jù)共享和流通的有效與安全,其中數(shù)據(jù)供給和數(shù)據(jù)使用是?2?個(gè)關(guān)鍵環(huán)節(jié)。在數(shù)據(jù)供給方面,可以考慮數(shù)據(jù)的有限供給,通過(guò)技術(shù)的手段對(duì)數(shù)據(jù)進(jìn)行限量發(fā)行。例如,通過(guò)對(duì)使用數(shù)據(jù)的工具增加保護(hù)機(jī)制,實(shí)現(xiàn)數(shù)據(jù)的有償服務(wù)。也可以利用區(qū)塊鏈等技術(shù),保證數(shù)據(jù)的單方持有。在數(shù)據(jù)使用方面,需要考慮數(shù)據(jù)的有界使用,保證數(shù)據(jù)的使用不涉及用戶隱私等問(wèn)題。具體來(lái)說(shuō),可以利用密碼學(xué)、聯(lián)邦學(xué)習(xí)等手段,在保證隱私的前提下加密數(shù)據(jù)的傳輸,通過(guò)確立數(shù)據(jù)類型或關(guān)系而非獲得數(shù)據(jù)本身作為數(shù)據(jù)使用的主要方式。數(shù)據(jù)的共享和流通是數(shù)據(jù)開(kāi)放研究的基礎(chǔ),期待未來(lái)有更多的人關(guān)注數(shù)據(jù)開(kāi)放的技術(shù)手段研究。

         

        未來(lái)展望:開(kāi)啟第五范式科學(xué)研究

        在過(guò)去十幾年間,隨著可獲得和可使用的大數(shù)據(jù)持續(xù)增長(zhǎng),第四范式作為一種新的科學(xué)研究范式,受到科學(xué)家越來(lái)越多的關(guān)注;同時(shí),也暴露出了很多不足。譬如:數(shù)據(jù)不確定性問(wèn)題、數(shù)據(jù)復(fù)雜性問(wèn)題、數(shù)據(jù)的維數(shù)爆炸問(wèn)題、數(shù)據(jù)的尺度邊界問(wèn)題等。目前,網(wǎng)絡(luò)科學(xué)、腦科學(xué)、社會(huì)科學(xué)等領(lǐng)域面臨的重大問(wèn)題都是極其復(fù)雜且動(dòng)態(tài)變化的難題,采用經(jīng)典物理一樣的簡(jiǎn)單實(shí)驗(yàn)(第一范式)、基于公理和假說(shuō)的理論推演(第二范式)、基于模型的計(jì)算機(jī)模擬(第三范式)和數(shù)據(jù)驅(qū)動(dòng)的相關(guān)性分析(第四范式)都無(wú)法解決。為此,科學(xué)家開(kāi)始尋求更接近數(shù)據(jù)和智能本質(zhì)、更有效認(rèn)識(shí)復(fù)雜性和不確定性的新科學(xué)研究范式。目前,這類新的科學(xué)探索方法論尚未形成定論,大體上看,這類新的科學(xué)研究范式是以智能為研究目標(biāo)的浸入式具身研究,我們暫時(shí)稱之為第五范式。基于數(shù)據(jù)科學(xué)本體論認(rèn)識(shí),我們猜測(cè)第五范式和第四范式一樣都會(huì)以數(shù)據(jù)為對(duì)象,不同的是第五范式更側(cè)重于人、機(jī)器及數(shù)據(jù)之間交互,強(qiáng)調(diào)人的決策機(jī)制與數(shù)據(jù)分析的融合,體現(xiàn)了數(shù)據(jù)和智能的有機(jī)結(jié)合;第五范式強(qiáng)調(diào)從本體論的角度看待數(shù)據(jù),認(rèn)為數(shù)據(jù)本身蘊(yùn)含自然智能的規(guī)律,也是新型智能的載體和產(chǎn)物,期望在數(shù)據(jù)驅(qū)動(dòng)智能的同時(shí)突破現(xiàn)有計(jì)算智能的能力邊界,借助自然智能構(gòu)造新型智能范式。

         

        目前,針對(duì)第五范式的探索剛剛起步,從方法論上還歸納不出它的基本特征;但可以肯定,它的一個(gè)重要特征是融合,既要融合前四種范式,又要融合統(tǒng)計(jì)學(xué)、網(wǎng)絡(luò)科學(xué)、腦科學(xué)等前沿研究中涌現(xiàn)的新方法。第三范式和第四范式都用到計(jì)算機(jī):第三范式是人腦+計(jì)算機(jī),人腦是主角;第四范式是計(jì)算機(jī)+人腦,計(jì)算機(jī)是主角。第五范式既強(qiáng)調(diào)人腦與計(jì)算機(jī)的有機(jī)融合,也可能更進(jìn)一步從社會(huì)系統(tǒng)和人腦系統(tǒng)借鑒其中的計(jì)算與決策機(jī)制,從而更重視人和社會(huì)在科學(xué)研究回路中的形式化建模與計(jì)算融合。

         

        數(shù)據(jù)科學(xué)和計(jì)算智能的發(fā)展催生第五范式第五范式發(fā)展離不開(kāi)對(duì)數(shù)據(jù)科學(xué)內(nèi)涵的豐富和計(jì)算智能能力邊界的突破。從研究對(duì)象看,第五范式是科學(xué)研究從對(duì)物理世界、人類社會(huì)的研究拓展到-機(jī)-融合的三元空間;從研究目標(biāo)上看,第五范式不僅僅是傳統(tǒng)的科學(xué)發(fā)現(xiàn),更是對(duì)智能系統(tǒng)的探索和實(shí)現(xiàn);從研究方法上看,第五范式強(qiáng)調(diào)人在回路的浸入式具身研究。目前,還難以給出第五范式的清晰界定,也許再過(guò)?1020?年,第五范式的特征就明朗了,可能逐步成為科學(xué)研究的主流范式之一。(作者:程學(xué)旗沈華偉李國(guó)杰中國(guó)科學(xué)院計(jì)算技術(shù)研究所梅宏北京大學(xué)趙偉阿聯(lián)酋沙迦美國(guó)大學(xué)華云生香港中文大學(xué);《中國(guó)科學(xué)院院刊》供稿)

        返回頂部
        911国产在线专区
        <noscript id="wwww0"><dd id="wwww0"></dd></noscript>
        <nav id="wwww0"><code id="wwww0"></code></nav>
          • <small id="wwww0"></small><sup id="wwww0"><cite id="wwww0"></cite></sup>
          • <sup id="wwww0"></sup>