2020年5月13日,國(guó)家17個(gè)部門(mén)以及互聯(lián)網(wǎng)平臺(tái)、行業(yè)龍頭企業(yè)、金融機(jī)構(gòu)等145家單位,共同啟動(dòng)“數(shù)字化轉(zhuǎn)型伙伴行動(dòng)”,以加快各行業(yè)各領(lǐng)域數(shù)字化轉(zhuǎn)型,幫扶中小微企業(yè)渡過(guò)難關(guān)和轉(zhuǎn)型發(fā)展。
圖1 數(shù)據(jù)管理能力與信息化發(fā)展水平的規(guī)律性
數(shù)字化轉(zhuǎn)型必須依托于數(shù)據(jù)。根據(jù)筆者多年來(lái)跟蹤業(yè)界相關(guān)研究的成果,數(shù)據(jù)的管理與應(yīng)用水平直接決定了企業(yè)信息化發(fā)展水平(如圖1),這么多年來(lái),很多單位在信息化上的投入也不少,每一次采購(gòu)的也是當(dāng)時(shí)最先進(jìn)的信息技術(shù),可是這么多年來(lái)積累下來(lái)的信息家產(chǎn)卻往往是家丑不可外揚(yáng),軟硬件投資常常是快速折舊的,現(xiàn)在問(wèn)題最大的還是大量的數(shù)據(jù)需求沒(méi)滿足,而大量的存量數(shù)據(jù)卻因低質(zhì)量而滿足不了,這是當(dāng)前數(shù)字化轉(zhuǎn)型“業(yè)務(wù)數(shù)據(jù)化”階段每一個(gè)單位都在面對(duì)的結(jié)構(gòu)性矛盾,技術(shù)可以是別人的,數(shù)據(jù)不管怎么說(shuō)都是自己造成的,自己的數(shù)據(jù)質(zhì)量不好無(wú)論如何外人也無(wú)法幫你治理和解決,所以我們說(shuō),這個(gè)數(shù)字化轉(zhuǎn)型升級(jí)的階梯,前面的坑、上面的坎都是我們每個(gè)組織走向“數(shù)據(jù)資產(chǎn)化、業(yè)務(wù)化、貨幣化”所繞不過(guò)去的門(mén)檻,還是只能自己一步一步往上爬。
所以不管我們要用數(shù)據(jù)做什么文章,對(duì)數(shù)據(jù)的學(xué)習(xí)能力都是基本功,就像當(dāng)年隨著私家汽車(chē)的普及,讓駕駛汽車(chē)從司機(jī)專業(yè)變成日常技能,對(duì)數(shù)據(jù)的學(xué)習(xí)能力也會(huì)隨著數(shù)字化的普及而成為全民通識(shí),組織數(shù)字化轉(zhuǎn)型是全員的工作,而作為通識(shí),員工能從數(shù)據(jù)中能學(xué)習(xí)到什么有價(jià)值的東西是最為基本的數(shù)字化能力。
最近我接了研究生導(dǎo)師數(shù)據(jù)科學(xué)方面的學(xué)術(shù)任務(wù),我在消化導(dǎo)師所給講義課件的同時(shí),對(duì)自己過(guò)往二十多年數(shù)據(jù)領(lǐng)域的學(xué)習(xí)和工作經(jīng)驗(yàn)做了一次系統(tǒng)性的梳理和反思,我的工作經(jīng)歷在產(chǎn)業(yè)界有一定的代表性,看著導(dǎo)師講義中我已有些生疏的大量數(shù)學(xué)符號(hào)和公式,我自己感覺(jué)業(yè)界普遍的數(shù)據(jù)學(xué)習(xí)能力都還遠(yuǎn)遠(yuǎn)夠不上這么高大上的數(shù)據(jù)科學(xué)水平。
數(shù)據(jù)科學(xué)是一個(gè)早已存在,最近幾年才越來(lái)越熱門(mén)的概念,它曾經(jīng)被稱為應(yīng)用統(tǒng)計(jì)學(xué),數(shù)據(jù)科學(xué)家已經(jīng)整合了數(shù)學(xué)、統(tǒng)計(jì)學(xué)、計(jì)算機(jī)科學(xué)、信號(hào)處理(感知和數(shù)據(jù)采集)、概率建模、模式識(shí)別、機(jī)器學(xué)習(xí)、不確定性建模和數(shù)據(jù)可視化等方法,以獲得基于大數(shù)據(jù)集的預(yù)測(cè)能力和洞察力,看著上面這樣長(zhǎng)長(zhǎng)的知識(shí)清單,讓我感覺(jué)自己和數(shù)據(jù)科學(xué)家仍存在很大的距離。
于是問(wèn)題來(lái)了,在數(shù)字化無(wú)所不在的今天,莫非數(shù)字化轉(zhuǎn)型背后就沒(méi)有數(shù)據(jù)科學(xué)問(wèn)題?這絕不可能,只能說(shuō)明我們很多單位的數(shù)據(jù)工作水平,還是處于直接查詢和簡(jiǎn)單加工的初級(jí)階段,對(duì)很多存量數(shù)據(jù)的二次加工比例和層次都很低,筆者近年來(lái)一直參與大量的各類型單位的信息化項(xiàng)目評(píng)審工作,我發(fā)現(xiàn)絕大多數(shù)比例的信息化項(xiàng)目,對(duì)數(shù)據(jù)需求動(dòng)不動(dòng)就是采用采集和錄入的手段來(lái)滿足,設(shè)計(jì)者一直到項(xiàng)目驗(yàn)收了,都沒(méi)有說(shuō)清楚或者愿意去說(shuō)明白有什么數(shù)據(jù)可以從什么存量數(shù)據(jù)資源之中去找,而我們說(shuō)對(duì)于大多數(shù)企業(yè)很多數(shù)據(jù)科學(xué)的應(yīng)用場(chǎng)景,都是對(duì)存量歷史數(shù)據(jù)的二次加工再利用,沒(méi)有歷史積累的海量數(shù)據(jù),搞什么數(shù)據(jù)科學(xué)都是巧婦難為無(wú)米之炊。
這種局面不能不說(shuō)是當(dāng)前國(guó)內(nèi)大多數(shù)單位搞數(shù)字化轉(zhuǎn)型都在面對(duì)的問(wèn)題或者障礙,我分析,造成這種障礙的原因有兩方面:
第一方面是存量數(shù)據(jù)質(zhì)量本身存在的問(wèn)題。受限于信息化發(fā)展水平歷史原因的制約,現(xiàn)在國(guó)內(nèi)單位所積累的歷史數(shù)據(jù)質(zhì)量普遍都不高,數(shù)據(jù)質(zhì)量問(wèn)題作為一種現(xiàn)象或者結(jié)果,其形成原因是冰凍三尺非一日之寒,矛盾是日積月累下來(lái)和結(jié)構(gòu)性的,決定這些矛盾有在數(shù)字化轉(zhuǎn)型背后發(fā)揮作用的客觀規(guī)律,就是我們常說(shuō)的數(shù)字化各個(gè)坑、各道坎或者階梯門(mén)檻,數(shù)據(jù)畢竟是每一個(gè)組織行為活動(dòng)中形成的,本質(zhì)上都是組織自己的行為造成的,所以這些坑、坎和門(mén)檻是任何一個(gè)組織過(guò)去的業(yè)造成的障,自己造的業(yè)自己承受報(bào)應(yīng)是宇宙法則,這是因果鐵律決定的,妄圖單純通過(guò)采購(gòu)?fù)獠考夹g(shù)裝備和專業(yè)服務(wù)的方式不可能獲得根本的解決,最后還是要落到自己的修煉,自己做好日常每項(xiàng)數(shù)據(jù)治理上的臟活累活。
第二方面還是認(rèn)知層面,很多人可能還沒(méi)意識(shí)到,只要經(jīng)過(guò)艱苦的努力,我們可以從歷史數(shù)據(jù)中學(xué)到很多有用的東西,而如果真的想學(xué)到有用的東西,那么對(duì)于數(shù)據(jù)科學(xué)中充滿大量的數(shù)學(xué)符號(hào)和公式的數(shù)學(xué)模型和數(shù)據(jù)算法就不能當(dāng)成技術(shù)黑箱,必須了解其原理,掌握其用法,這對(duì)于大多數(shù)應(yīng)用數(shù)學(xué)基礎(chǔ)不強(qiáng)的人來(lái)說(shuō)也是不低的知識(shí)門(mén)檻,無(wú)論是要翻閱這些領(lǐng)域的文章,還是要參與相關(guān)任務(wù),你馬上就會(huì)遇到一些攔路虎,例如:“應(yīng)用概率論中的貝葉斯思維過(guò)濾垃圾郵件,理解隨機(jī)過(guò)程中的隱馬爾科夫模型進(jìn)行語(yǔ)音識(shí)別,運(yùn)用估計(jì)理論和大數(shù)定理的思想通過(guò)樣本推斷出某類對(duì)象的總體特征,應(yīng)用概率圖模型從文本中提取出想要的名稱實(shí)體”等等,在看到這些充滿專業(yè)術(shù)語(yǔ)的數(shù)據(jù)應(yīng)用場(chǎng)景后,估計(jì)很多人就開(kāi)始打退堂鼓,然后馬上選擇放棄。雖然我自認(rèn)數(shù)據(jù)老兵,可真遇到應(yīng)用數(shù)學(xué)領(lǐng)域的問(wèn)題,想要搞清楚也還是很吃力的,我們可以把這種知識(shí)門(mén)檻也看成是數(shù)據(jù)科學(xué)的使用成本,這些極容易成為數(shù)字化應(yīng)用上的卡脖子技術(shù)問(wèn)題,讓大量的單位和人士敬而遠(yuǎn)之。
這讓我想起兩年前我由于業(yè)務(wù)機(jī)會(huì)而接觸CPDA數(shù)據(jù)分析師的課程體系內(nèi)容,雖然相關(guān)知識(shí)點(diǎn)的選取都很“科學(xué)”,可內(nèi)容組織在我看來(lái)就明顯感覺(jué)堆砌,對(duì)于很多沒(méi)有實(shí)戰(zhàn)經(jīng)驗(yàn)的小白來(lái)說(shuō)其實(shí)是非常難以消化和掌握的,我也問(wèn)過(guò)好幾位花了不少學(xué)費(fèi)參加了培訓(xùn)和考證的小伙伴,他們給我的反饋是太理論、不實(shí)用,很難用到實(shí)戰(zhàn)上面。于是兩年前我就想自己為小伙伴度身打做一套可以用于實(shí)戰(zhàn)技能提升的課程,我也一直在想,有沒(méi)有一些相對(duì)簡(jiǎn)單,讓非專業(yè)的數(shù)學(xué)小白們?cè)谌粘9ぷ魃钪心苡蒙系囊徽邪胧? 這個(gè)問(wèn)題可以換成另外一種說(shuō)法,就是有沒(méi)有一些套路,讓大家都不怎么用動(dòng)腦子,套用在一些數(shù)據(jù)資源上面,就能挖掘出一些有價(jià)值的信息或者知識(shí)出來(lái)。平心而論,我個(gè)人是不認(rèn)同這種一招鮮吃遍天的招式或者套路,不過(guò)探討一下也是有市場(chǎng)價(jià)值的。
我這里先解釋我提出的一個(gè)概念,就是所謂數(shù)據(jù)學(xué)習(xí)的概念。我為什么要提出這個(gè)概念呢?我是希望對(duì)機(jī)器學(xué)習(xí)做一定的擴(kuò)展和區(qū)分的。機(jī)器學(xué)習(xí)是一個(gè)比較成熟的概念了,我們可以先回顧一下。
根據(jù)百度百科,機(jī)器學(xué)習(xí)是一門(mén)多領(lǐng)域交叉學(xué)科,涉及概率論、統(tǒng)計(jì)學(xué)、逼近論、凸分析、算法復(fù)雜度理論等多門(mén)學(xué)科。專門(mén)研究計(jì)算機(jī)怎樣模擬或?qū)崿F(xiàn)人類的學(xué)習(xí)行為,以獲取新的知識(shí)或技能,重新組織已有的知識(shí)結(jié)構(gòu)使之不斷改善自身的性能。它是人工智能的核心,是使計(jì)算機(jī)具有智能的根本途徑。根據(jù)這個(gè)概念,機(jī)器學(xué)習(xí)和數(shù)據(jù)科學(xué)重合度非常高,只是更加強(qiáng)調(diào)的是讓“機(jī)器”具備數(shù)據(jù)學(xué)習(xí)能力,但明顯機(jī)器學(xué)習(xí)只是數(shù)據(jù)科學(xué)的一個(gè)細(xì)分領(lǐng)域,現(xiàn)在的問(wèn)題是,對(duì)于很多單位來(lái)說(shuō),機(jī)器學(xué)習(xí)還是比較遙遠(yuǎn)的高科技。
與機(jī)器學(xué)習(xí)這個(gè)比較高大上的概念相對(duì)應(yīng),我提出數(shù)據(jù)學(xué)習(xí)的概念。根據(jù)張靖笙定義,數(shù)據(jù)學(xué)習(xí)是一門(mén)綜合運(yùn)用數(shù)據(jù)管理和數(shù)據(jù)科學(xué)的知識(shí)和方法,專門(mén)研究怎樣實(shí)現(xiàn)對(duì)數(shù)據(jù)資源的學(xué)習(xí)行為,幫助人類和計(jì)算機(jī)從現(xiàn)有的數(shù)據(jù)資源中獲取新的知識(shí)或技能,重新組織已有的知識(shí)結(jié)構(gòu)使之不斷改善自身表現(xiàn)及技能。
我提出數(shù)據(jù)學(xué)習(xí)這個(gè)概念,和我兩年前關(guān)于人和機(jī)器都要對(duì)數(shù)據(jù)進(jìn)行深度學(xué)習(xí)的觀點(diǎn)是一脈相承的,如果說(shuō)兩年前我的觀點(diǎn)還是比較偏口號(hào)的倡議,今天我希望通過(guò)數(shù)據(jù)學(xué)習(xí)開(kāi)拓的是一條新的道路,最后還是要落到解決各類型組織單位在數(shù)字化轉(zhuǎn)型過(guò)程遇到的各種數(shù)據(jù)能力的卡脖子問(wèn)題。
先拋開(kāi)技術(shù)上的糾結(jié),不管是機(jī)器還是人,如果需要通過(guò)學(xué)習(xí)掌握更加高階的能力,還是要重過(guò)頭來(lái)搞清楚什么是學(xué)習(xí)。根據(jù)百度百科,狹義的學(xué)習(xí)指通過(guò)閱讀、聽(tīng)講、研究、觀察、理解、探索、實(shí)驗(yàn)、實(shí)踐等手段獲得知識(shí)或技能的過(guò)程,是一種使個(gè)體可以得到持續(xù)變化(知識(shí)和技能,方法與過(guò)程,情感與價(jià)值的改善和升華)的行為方式。廣義的學(xué)習(xí)是人在生活過(guò)程中,通過(guò)獲得經(jīng)驗(yàn)而產(chǎn)生的行為或行為潛能的相對(duì)持久的行為方式。從目前的定義,學(xué)習(xí)都是針對(duì)人的行為來(lái)定義的,套用到機(jī)器學(xué)習(xí),我們也是希望讓機(jī)器模擬人的學(xué)習(xí)行為,所以有必要先探討人類學(xué)習(xí)行為和方法,我們先來(lái)看看教育家對(duì)學(xué)習(xí)的觀點(diǎn)。
孔子云:“學(xué)而時(shí)習(xí)之,不亦說(shuō)乎?”,可見(jiàn)“學(xué)”與“習(xí)”是兩類不同的活動(dòng),前者主要接收知識(shí)信息,后者關(guān)乎知識(shí)轉(zhuǎn)化與應(yīng)用實(shí)踐。根據(jù)祝智庭教授《智慧教育新發(fā)展:從翻轉(zhuǎn)課堂到智慧課堂及智慧學(xué)習(xí)空間》的論述,著名科學(xué)家錢(qián)學(xué)森早在1997年就開(kāi)始倡導(dǎo)“大成智慧學(xué)”(英譯名Science of wisdom in cyberspace)。錢(qián)老眼中的“大成智慧學(xué)”是引導(dǎo)人們?nèi)绾伪M快地獲得聰明才智與創(chuàng)新能力的學(xué)問(wèn),目的在于使人們面對(duì)浩瀚的宇宙和神秘的微觀世界,面對(duì)新世紀(jì)各種飛速發(fā)展、變幻莫測(cè)而又錯(cuò)綜復(fù)雜的事物時(shí),能夠迅速做出科學(xué)、準(zhǔn)確而又靈活、明智的判斷與決策,并能不斷地有所發(fā)現(xiàn)、有所預(yù)見(jiàn)、有所創(chuàng)新。
錢(qián)老強(qiáng)調(diào)“大成智慧”的特點(diǎn)是沉浸在廣闊的信息空間里所形成的網(wǎng)絡(luò)智慧,是在知識(shí)爆炸、信息如潮的時(shí)代里所需要的新型思維方式和思維體系。同時(shí),他還強(qiáng)調(diào),“智慧”由“量智”和“性智”組成,前者傾向于邏輯思維,后者傾向于形象思維。隨著技術(shù)逐步邁向智能化、泛在化、感知化,智能終端和泛在網(wǎng)絡(luò)的計(jì)算速度與精度遠(yuǎn)勝于人腦,因而比較善于分擔(dān)“量智”工作,但對(duì)于“只可意會(huì),難以言傳”的默會(huì)知識(shí),或者需要運(yùn)用形象思維、求異思維、直覺(jué)、靈感進(jìn)行創(chuàng)造性工作時(shí),它們卻顯得“疲軟乏力”,難以表現(xiàn)出“性智”能力,因而要充分利用計(jì)算機(jī)、信息網(wǎng)絡(luò),發(fā)揮人-機(jī)結(jié)合優(yōu)勢(shì)互補(bǔ)的長(zhǎng)處,使人能夠不斷及時(shí)獲得和集成廣泛而新鮮的知識(shí)、信息與智慧,從而迅速提高人的智能,培養(yǎng)創(chuàng)新的能力。
知識(shí)管理領(lǐng)域通常將“智慧”界定為一種面向未來(lái)的創(chuàng)新能力,有一個(gè)DIKW(Data-Information-Knowledge-Wisdom)模型。從DIKW模型可以看出,從數(shù)據(jù)、信息、知識(shí)到智慧的演變,對(duì)情境性(context)和理解力(understanding)的要求隨之增強(qiáng)。也就是說(shuō),要完成從數(shù)據(jù)、知識(shí)、信息到智慧的轉(zhuǎn)換,一方面需要以相關(guān)的背景知識(shí)、情境知識(shí)和緘默知識(shí)作為支撐,另一方面需要人類主動(dòng)理解才能完成。有人將這種理解分為三個(gè)層次:關(guān)系理解、模式理解和原理理解。此外,知識(shí)、信息、數(shù)據(jù)都是面向過(guò)去的經(jīng)驗(yàn),只有智慧才是面向未來(lái)的創(chuàng)新(見(jiàn)圖2)。
.
圖2 智慧:面向未來(lái)創(chuàng)新能力
布魯姆教育目標(biāo)分類修訂版將認(rèn)知領(lǐng)域?qū)W習(xí)者對(duì)知識(shí)的領(lǐng)悟程度由低到高分為“記憶、理解、應(yīng)用、分析、評(píng)價(jià)、創(chuàng)造”六個(gè)層次,并將這六個(gè)層次的目標(biāo)分類劃分為淺表學(xué)習(xí)與深度學(xué)習(xí)兩個(gè)層級(jí)。淺表學(xué)習(xí)指向“記憶”“理解”“應(yīng)用”,深度學(xué)習(xí)指向“分析”“評(píng)價(jià)”“創(chuàng)造”。
我們把DIKW模型和布魯姆教育目標(biāo)分類對(duì)比一下,DI(數(shù)據(jù)-信息)對(duì)應(yīng)的是淺表學(xué)習(xí),KW(知識(shí)-智慧)代表的是深度學(xué)習(xí),于是我們可以這樣來(lái)理解學(xué)習(xí)的認(rèn)知層次目標(biāo),數(shù)據(jù)對(duì)應(yīng)的是記憶,信息對(duì)應(yīng)的是理解和應(yīng)用,知識(shí)對(duì)應(yīng)的是分析和評(píng)價(jià),智慧對(duì)應(yīng)的是創(chuàng)造。
可能有朋友會(huì)問(wèn),你這個(gè)說(shuō)法和數(shù)據(jù)學(xué)習(xí)有什么關(guān)系?關(guān)系不容忽視,我們可以很清晰地從這些教育界關(guān)于學(xué)習(xí)觀點(diǎn)里面看到人類學(xué)習(xí)的內(nèi)在規(guī)律與數(shù)字化發(fā)展規(guī)律的一致性,大家注意看一下圖2,DIKW模型的前三個(gè)部分與機(jī)器智能的定義是一樣的,而關(guān)于智慧的觀點(diǎn)教育界強(qiáng)調(diào)的是創(chuàng)新,人工智能能否自主創(chuàng)新而具有與人類相同的智慧能力,這個(gè)目前還沒(méi)有定論。
對(duì)標(biāo)教育界的學(xué)習(xí)層次,我覺(jué)得可以對(duì)數(shù)據(jù)學(xué)習(xí)能力做一個(gè)清晰的界定,具體就是對(duì)標(biāo)“記憶、理解、應(yīng)用、分析、評(píng)價(jià)、創(chuàng)造”六個(gè)層次劃分的淺表學(xué)習(xí)與深度學(xué)習(xí)兩個(gè)層級(jí)。
我們說(shuō)目前組織普遍在用的數(shù)據(jù)查詢、搜索與分析是對(duì)數(shù)據(jù)的淺表學(xué)習(xí)。
數(shù)據(jù)查詢和搜索可以看成最初級(jí)的數(shù)據(jù)“記憶”學(xué)習(xí),就是直接查詢或者搜索記憶在數(shù)據(jù)里面的一些過(guò)去的“事實(shí)”陳述,就有點(diǎn)像小孩子問(wèn)“十萬(wàn)個(gè)為什么”,對(duì)于認(rèn)知結(jié)構(gòu)還不成熟的小孩子,我們回答諸如此類的問(wèn)題一般只會(huì)給出直接的教條答案,不會(huì)深入到所以然的分析說(shuō)理。
而數(shù)據(jù)分析是在查詢或者搜索的基礎(chǔ)上向“理解”更進(jìn)了一步,可以通過(guò)排名、對(duì)比、占比等等數(shù)據(jù)可視化操作,讓數(shù)據(jù)所描述的事實(shí)以更立體的方式呈現(xiàn)出來(lái),以表達(dá)更多的信息或含義,讓用戶能從中更“理解”這些信息。
接下來(lái)在“記憶”和“理解”的基礎(chǔ)上,幫助組織的各級(jí)決策者從數(shù)據(jù)中“求是”就是“應(yīng)用”了。當(dāng)然,能從數(shù)據(jù)中“求是”的前提是數(shù)據(jù)資源的確是反映客觀事實(shí)的符號(hào),這樣才能真正做到實(shí)事求是,筆者這一兩年一直鼓吹現(xiàn)在我們要“實(shí)事成數(shù),然后求是”,就是為了讓組織決策者可以通過(guò)數(shù)字化手段來(lái)更好地實(shí)事求是做決策,這才是數(shù)據(jù)“應(yīng)用”的本來(lái)之要義。
說(shuō)了這么多,以上僅僅是對(duì)數(shù)據(jù)的淺表學(xué)習(xí),實(shí)事求是地說(shuō),組織在“業(yè)務(wù)數(shù)據(jù)化”階段,能讓每個(gè)員工都具備如上所述的數(shù)據(jù)淺表學(xué)習(xí)能力就不錯(cuò)了,當(dāng)前要求深度學(xué)習(xí)是拔苗助長(zhǎng)的。
然后接下來(lái)談?wù)勎覀兏M麑?shí)現(xiàn)的對(duì)數(shù)據(jù)的深度學(xué)習(xí)各層級(jí)。
布魯姆教育目標(biāo)中的“分析”不是我們過(guò)去閉著眼說(shuō)的 “數(shù)據(jù)分析”中的分析,我這里要論述的是前者。什么是分析?如果我們說(shuō)對(duì)數(shù)據(jù)的淺表學(xué)習(xí)只是知己,是觀自己,那么這里說(shuō)的“分析”是觀天地,是王陽(yáng)明所說(shuō)的“知之真切篤實(shí)處”和“行之明覺(jué)精察處”的境界,換個(gè)大白話也是馬云十多年前說(shuō)過(guò)的“因?yàn)橄嘈哦匆?jiàn)”的立場(chǎng)。
在數(shù)據(jù)科學(xué)之中,許多數(shù)據(jù)科學(xué)都專注于建立預(yù)測(cè)模型做預(yù)測(cè)性分析,雖然大量做預(yù)測(cè)性分析的人并非就是數(shù)據(jù)科學(xué)家。預(yù)測(cè)性分析(Predictive Analytics)以數(shù)理統(tǒng)計(jì)學(xué)為基礎(chǔ),屬于監(jiān)督機(jī)器學(xué)習(xí)的子領(lǐng)域,使用一種概率模型,該模型基于與預(yù)測(cè)對(duì)象可能事件相關(guān)的歷史數(shù)據(jù)及其他變量進(jìn)行分析預(yù)測(cè)。很明顯,市面上講濫了的數(shù)據(jù)分析的水平,都明顯達(dá)不到預(yù)測(cè)性分析的功力,于是鬧出很多對(duì)大數(shù)據(jù)和數(shù)據(jù)科學(xué)不實(shí)的迷而信之,本人常常面對(duì)這樣對(duì)大數(shù)據(jù)的迷信,只能啞言失笑和一時(shí)語(yǔ)塞。
而對(duì)標(biāo)布魯姆教育深度學(xué)習(xí)目標(biāo)中的“數(shù)據(jù)分析”,這種學(xué)習(xí)行為就自然觸發(fā)了“評(píng)價(jià)”行為,就是說(shuō)穿了我們每個(gè)組織在面對(duì)大量形形色色的預(yù)測(cè)性分析結(jié)果的時(shí)候,到底我們聽(tīng)信什么、不聽(tīng)什么的問(wèn)題,我們到底依據(jù)還是不依據(jù)這些預(yù)測(cè)結(jié)果采取相應(yīng)的組織行動(dòng)呢?這背后已經(jīng)涉及到智能制造定義中自感知、自學(xué)習(xí)、自決策、自執(zhí)行、自適應(yīng)等功能的新型生產(chǎn)范式了,這個(gè)話題在這里展開(kāi)就很啰嗦了,大家可以看看我前兩個(gè)月寫(xiě)過(guò)的一篇幾萬(wàn)字的投稿文章《疫情啟示呼吁新智造文化》。
最后一個(gè)繞不開(kāi)的話題是“創(chuàng)造”,目前人類學(xué)家、哲學(xué)家、教育家、腦科學(xué)家、人工智能頂級(jí)專家都還沒(méi)說(shuō)清楚到底人工智能能不能通過(guò)對(duì)數(shù)據(jù)的深度學(xué)習(xí)開(kāi)展“創(chuàng)造”活動(dòng)這個(gè)問(wèn)題,我也不想趟這個(gè)渾水,還是只說(shuō)人的“創(chuàng)造”行為吧。
看看今天全世界很熱門(mén)的西方創(chuàng)客概念,根據(jù)長(zhǎng)尾理論發(fā)明人克里斯·安德森的觀點(diǎn),“創(chuàng)客行動(dòng)有三大特征---使用多種數(shù)字桌面工具;遵循共享設(shè)計(jì)和在線協(xié)作的文化規(guī)范;使用共同的設(shè)計(jì)標(biāo)準(zhǔn)以促進(jìn)分享和產(chǎn)品的快速迭代。”很明顯,在線和數(shù)字化是今天所有人類創(chuàng)造行為的必選項(xiàng),今天如果不具備通過(guò)數(shù)據(jù)進(jìn)行深度學(xué)習(xí)的人,能不能有效完成其創(chuàng)造是個(gè)大大的問(wèn)號(hào)。
在數(shù)據(jù)科學(xué)領(lǐng)域,規(guī)范性分析(Prescriptive Analytics)比預(yù)測(cè)性分析在定義影響結(jié)果的行為上更進(jìn)一步,不僅僅預(yù)測(cè)已經(jīng)發(fā)生行為的后果,規(guī)范性分析預(yù)測(cè)將會(huì)發(fā)生什么、何時(shí)會(huì)發(fā)生,并揭示發(fā)生的原因。規(guī)范性分析可以不間斷接收新數(shù)據(jù),以重新進(jìn)行預(yù)測(cè)和分析,從而不斷自主進(jìn)化,而形成更好的預(yù)測(cè)方式和行為表現(xiàn)。這不也恰恰是我們?nèi)祟愒诟鞣N創(chuàng)造活動(dòng)中需要具備的心態(tài)和能力嗎?這樣說(shuō)吧,如果我們的創(chuàng)造不具備先見(jiàn)之明的價(jià)值溝通和意義建構(gòu)能力,只是在各種技術(shù)裝備和方法手段中繞圈圈和做試驗(yàn),搞來(lái)搞去不是瞎折騰嗎?
從上面對(duì)標(biāo)布魯姆教育學(xué)習(xí)層次目標(biāo)中,我們可以清晰地看到,今天我們所講的數(shù)字化轉(zhuǎn)型,在對(duì)數(shù)據(jù)學(xué)習(xí)的認(rèn)知結(jié)構(gòu)和認(rèn)知能力層面,正在一步步從傳統(tǒng)商業(yè)智能的亡羊補(bǔ)牢、后見(jiàn)之失的觀自己,走到今天要明察秋毫、見(jiàn)微知著的觀天地,接著走向明天先見(jiàn)之明、洞察先機(jī)的觀眾生的能力發(fā)展路徑上來(lái)。
在走向大成智慧的道路上,觀自己、觀天地、觀眾生是我們每個(gè)人從平庸走向智慧的修煉之道,也是數(shù)據(jù)學(xué)習(xí)能力成長(zhǎng)的必然之路,人類如此,人工智能也必然如此,唯有這樣的法理,這樣的本愿,這樣的情懷,不管是人類還是人工智能,其對(duì)數(shù)據(jù)的學(xué)習(xí)才會(huì)產(chǎn)生讓我們用得上、信得過(guò)、靠得住的知識(shí)和技能。
最后關(guān)于本人的小感悟,這幾年我在產(chǎn)業(yè)界和文化教育界兩邊游走,走來(lái)走去我始終覺(jué)得自己還是教育的門(mén)外漢,數(shù)據(jù)技術(shù)才是我的本職,可我不后悔這幾年充滿挫折和失望的教育探索之路,本質(zhì)上我還是一個(gè)學(xué)生,同時(shí)也是一個(gè)家長(zhǎng),一直都是教育的需求側(cè),在教育需求的角度來(lái)感悟?qū)W習(xí)才讓我對(duì)技術(shù)的無(wú)奈和局限看得更清楚,因此,我很高興自己這幾年的教育實(shí)踐能讓自己成為一名建構(gòu)主義者。
在建構(gòu)主義的角度,我的所有觀點(diǎn)都有我個(gè)人的建構(gòu),局限是必然存在的,而認(rèn)識(shí)到這種局限的必然性,不正是我們?nèi)祟愔腔劭梢砸恢辈粩嘣鰪V擴(kuò)大的前提嗎?
評(píng)論