|
發(fā)展趨勢(shì)
科學(xué)大數(shù)據(jù)智能分析軟件的發(fā)展趨勢(shì)呈現(xiàn)出?AI?賦能、一體化、云服務(wù)、開放共享和可定制的重要特征。
AI?賦能。科學(xué)家在其研究領(lǐng)域嘗試使用人工智能新技術(shù)進(jìn)行科學(xué)發(fā)現(xiàn)的需求日益高漲。因此,智能分析軟件除了提供領(lǐng)域相關(guān)的基礎(chǔ)運(yùn)算操作和傳統(tǒng)算法,還需要支持深度學(xué)習(xí)、自然語(yǔ)言理解、知識(shí)圖譜等新型人工智能技術(shù)的集成應(yīng)用,為人工智能模型的訓(xùn)練、測(cè)試、部署和運(yùn)行提供全生命周期的工具化支持。
一體化。科學(xué)大數(shù)據(jù)智能分析包含復(fù)雜的數(shù)據(jù)處理、分析、模式提取和知識(shí)發(fā)現(xiàn)過程,而現(xiàn)有的大數(shù)據(jù)框架和平臺(tái)存在學(xué)習(xí)曲線高、開發(fā)代價(jià)大等問題。因此,在傳統(tǒng)“編程式”的開發(fā)模式基礎(chǔ)上,還需要為領(lǐng)域科學(xué)家提供簡(jiǎn)單易用的“拼裝式”可視化挖掘分析環(huán)境,并利用高質(zhì)量、可復(fù)用的模型與算法庫(kù),進(jìn)行科學(xué)大數(shù)據(jù)分析模型的創(chuàng)新設(shè)計(jì),實(shí)現(xiàn)涵蓋數(shù)據(jù)源集成、代碼編輯、流程設(shè)計(jì)、模型算法復(fù)用以及執(zhí)行與可視化的一體化支撐。
云服務(wù)。云服務(wù)化的科學(xué)大數(shù)據(jù)智能分析軟件不需要本地進(jìn)行軟件安裝和維護(hù)。因此,一方面,瀏覽器成為挖掘分析全流程操作和管理的統(tǒng)一門戶界面;另一方面,模型、算法以及數(shù)據(jù)源將以在線?API?的形式進(jìn)行共享和復(fù)用,這一形式也被稱為“功能即服務(wù)”(function as a service)。
開放共享。交叉科學(xué)的重大發(fā)現(xiàn)需要綜合應(yīng)用多領(lǐng)域的分析模型和算法。匯聚跨領(lǐng)域的共性模型,形成類型豐富、性能優(yōu)異的模型和算法庫(kù),這將成為降低領(lǐng)域交叉綜合分析模型開發(fā)難度、提升開發(fā)效率的基礎(chǔ)。同時(shí),各領(lǐng)域科學(xué)家團(tuán)隊(duì)通過共享高質(zhì)量的模型和算法,也將促進(jìn)軟件系統(tǒng)持續(xù)演化,使軟件系統(tǒng)更具生命力。例如,R?語(yǔ)言算法庫(kù)?CRAN?是交叉領(lǐng)域算法共享的典范,該算法庫(kù)目前收錄了各領(lǐng)域科學(xué)家貢獻(xiàn)的?4?000?多種算法,吸引了大量的用戶。
可定制。不同科學(xué)領(lǐng)域的數(shù)據(jù)分析模式千差萬別,通用的、固化的大數(shù)據(jù)分析軟件無法滿足特定領(lǐng)域科學(xué)家團(tuán)隊(duì)的個(gè)性化分析需求,這種個(gè)性化需求存在于分析流程、數(shù)據(jù)源、算法模型、可視化等各個(gè)層面。因此,一個(gè)理想的科學(xué)大數(shù)據(jù)智能分析軟件應(yīng)該支持?jǐn)?shù)據(jù)、模型算法和可視化視圖等多個(gè)方面的領(lǐng)域定制與擴(kuò)展,支持領(lǐng)域科學(xué)家以及領(lǐng)域內(nèi)的軟件工程師進(jìn)行特有組件的開發(fā)。