
如何擁抱大數(shù)據(jù)時(shí)代

——訪中國人民大學(xué)中國調(diào)查與數(shù)據(jù)中心主任袁衛(wèi)

袁衛(wèi) 中國人民大學(xué)中國調(diào)查與數(shù)據(jù)中心主任,曾任中國人民大學(xué)常務(wù)副校長?,F(xiàn)任第六屆國務(wù)院學(xué)位委員會(huì)應(yīng)用經(jīng)濟(jì)學(xué)學(xué)科評(píng)議組、統(tǒng)計(jì)學(xué)學(xué)科評(píng)議組召集人,教育部社會(huì)科學(xué)委員會(huì)委員、中國統(tǒng)計(jì)教育學(xué)會(huì)副會(huì)長兼高校分會(huì)會(huì)長、全國應(yīng)用統(tǒng)計(jì)專業(yè)碩士教育指導(dǎo)委員會(huì)常務(wù)副主任。
什么是大數(shù)據(jù)?也許你不能準(zhǔn)確地給它下一個(gè)定義,但是,你知道或者不知道,它就在那里,已經(jīng)滲透到你工作、生活的方方面面。我們該如何應(yīng)對(duì)這場被一些人稱為“第四次科技革命”的全球新競爭?又如何培養(yǎng)適應(yīng)大數(shù)據(jù)時(shí)代要求的高層次人才?日前,記者就此采訪了中國人民大學(xué)中國調(diào)查與數(shù)據(jù)中心主任、中國人民大學(xué)原常務(wù)副校長袁衛(wèi)教授。
中國擁有數(shù)據(jù)資源優(yōu)勢
記者:對(duì)于老百姓而言,大數(shù)據(jù)還是個(gè)新詞匯,能否介紹一下大數(shù)據(jù)產(chǎn)生的時(shí)代背景以及目前國內(nèi)外研究、應(yīng)用的狀況?
袁衛(wèi):在上世紀(jì)80年代初,就已經(jīng)有了大數(shù)據(jù)的概念和相關(guān)應(yīng)用,但是它深入社會(huì)和百姓的視野,則是最近幾年的事情。2012年,美國政府由白宮牽頭,啟動(dòng)了一個(gè)“大數(shù)據(jù)發(fā)展計(jì)劃”,這個(gè)計(jì)劃的推出被視為進(jìn)入大數(shù)據(jù)時(shí)代的標(biāo)志性事件,其重要性堪比1992年美國政府推出的“信息高速公路計(jì)劃”(被視為進(jìn)入網(wǎng)絡(luò)時(shí)代的標(biāo)志)。在相似的時(shí)間,歐盟各國陸續(xù)開放了很多政府?dāng)?shù)據(jù),日本也啟動(dòng)了一個(gè)大數(shù)據(jù)項(xiàng)目,聯(lián)合國2012年發(fā)布大數(shù)據(jù)報(bào)告,全球掀起了大數(shù)據(jù)研究和應(yīng)用的熱潮。
大數(shù)據(jù)的發(fā)展,是以網(wǎng)絡(luò)和計(jì)算機(jī)技術(shù)的高速發(fā)展為依托的。1965年英特爾創(chuàng)始人之一的摩爾先生提出,未來的網(wǎng)絡(luò)計(jì)算機(jī)發(fā)展,大體上每隔1年到2年,等面積集成電路中的晶體管數(shù)量將會(huì)增加一倍,即計(jì)算速度會(huì)提高一倍,同等的計(jì)算,成本會(huì)降低一半。經(jīng)過近50年的實(shí)踐,驗(yàn)證了摩爾先生的預(yù)測,也就是人們常說的“摩爾定律”。計(jì)算機(jī)和網(wǎng)絡(luò)科技的高速發(fā)展,使得大量網(wǎng)絡(luò)數(shù)據(jù),包括音頻的、視頻的、圖片的、文本的各種各樣的數(shù)據(jù),得以保存,并轉(zhuǎn)化為我們可以深入分析的數(shù)據(jù)。于是,大數(shù)據(jù)的研究和應(yīng)用也就水到渠成了。
記者:在大數(shù)據(jù)這個(gè)領(lǐng)域,我們和發(fā)達(dá)國家的差距大嗎?
袁衛(wèi):上世紀(jì)八九十年代,我們在很多科技領(lǐng)域和國外差距很大,但是進(jìn)入互聯(lián)網(wǎng)時(shí)代以后,這種狀況逐漸改觀。進(jìn)入大數(shù)據(jù)時(shí)代,我們可進(jìn)一步縮小與美國等科技發(fā)達(dá)國家的差距,甚至具有后發(fā)優(yōu)勢,原因有三個(gè)方面:其一,在互聯(lián)網(wǎng)時(shí)代,各種最先進(jìn)的技術(shù)可以快速傳播,基本上可以做到全球同步;其二,和微軟的操作系統(tǒng)等軟件不同,大數(shù)據(jù)絕大多數(shù)軟件是開源的,很多網(wǎng)絡(luò)技術(shù)也是公開的,中國的科學(xué)技術(shù)與教育工作者,只要具有足夠的智慧和能力,完全可以追趕甚至在某個(gè)領(lǐng)域超過美國;其三,我們在數(shù)據(jù)資源上具有優(yōu)勢。中國有13.5億人,13.5億個(gè)活動(dòng)主體組織了各種社會(huì)經(jīng)濟(jì)關(guān)系,建立起各種社會(huì)、網(wǎng)絡(luò)聯(lián)系,在各種社會(huì)經(jīng)濟(jì)活動(dòng)中產(chǎn)生大量的數(shù)據(jù),這些數(shù)據(jù)是可以充分挖掘的資源。我們起步稍晚,但是具有后發(fā)優(yōu)勢,在某些領(lǐng)域甚至可以達(dá)到國際先進(jìn)水平,比如中國推進(jìn)的智慧城市建設(shè)就很不錯(cuò),還有微信社交平臺(tái)、阿里小貸等,體現(xiàn)了中國的特色。
統(tǒng)計(jì)學(xué)科迎來“最好的時(shí)期”
記者:您是統(tǒng)計(jì)學(xué)方面的權(quán)威專家。在您看來,大數(shù)據(jù)對(duì)于統(tǒng)計(jì)學(xué)的發(fā)展有何影響?
袁衛(wèi):統(tǒng)計(jì)學(xué)就是數(shù)據(jù)科學(xué),大數(shù)據(jù)對(duì)統(tǒng)計(jì)學(xué)的發(fā)展影響巨大。我個(gè)人認(rèn)為,大數(shù)據(jù)對(duì)于統(tǒng)計(jì)學(xué)的發(fā)展,既是機(jī)遇又是挑戰(zhàn)。
說它是機(jī)遇,是因?yàn)榇髷?shù)據(jù)研究和應(yīng)用會(huì)帶來大量人才需求,這對(duì)統(tǒng)計(jì)學(xué)的發(fā)展是一個(gè)巨大的利好,可以說,目前統(tǒng)計(jì)學(xué)發(fā)展正處于歷史上最好的時(shí)期。這幾年,從全國范圍看,統(tǒng)計(jì)學(xué)專業(yè)畢業(yè)生就業(yè)狀況都不錯(cuò),今后會(huì)更好。
說它是挑戰(zhàn),是因?yàn)榇髷?shù)據(jù)可能部分顛覆傳統(tǒng)的統(tǒng)計(jì)方法。比如有人認(rèn)為,傳統(tǒng)的統(tǒng)計(jì)方法講究抽樣,但是大數(shù)據(jù)使得我們可以對(duì)接近總量的數(shù)據(jù)進(jìn)行分析,這樣進(jìn)行抽樣調(diào)查的需求就會(huì)減少;還有人認(rèn)為,傳統(tǒng)的統(tǒng)計(jì)分析注重因果關(guān)系,但大數(shù)據(jù)情況下,只需明確兩者之間有關(guān)系即可。另外,過去強(qiáng)調(diào)分析的準(zhǔn)確性,而在大數(shù)據(jù)情況下,允許存在一定的誤差,等等。
我認(rèn)為,大數(shù)據(jù)對(duì)統(tǒng)計(jì)學(xué)帶來的上述挑戰(zhàn)確實(shí)存在,但是不會(huì)導(dǎo)致傳統(tǒng)抽樣調(diào)查的需求減少。因?yàn)榇髷?shù)據(jù)雖然數(shù)據(jù)量很大,但絕大多數(shù)情況下這些大樣本都不是隨機(jī)的,推斷總體都有系統(tǒng)偏差,因而抽樣調(diào)查等統(tǒng)計(jì)方法仍然是不可取代的。此外,在很多時(shí)候,科研和商業(yè)應(yīng)用、科學(xué)決策還是需要進(jìn)行準(zhǔn)確的統(tǒng)計(jì)分析的。
從人才培養(yǎng)的角度看,統(tǒng)計(jì)學(xué)在教學(xué)內(nèi)容、教學(xué)方法、人才培養(yǎng)模式等方面需要進(jìn)行變革,以適應(yīng)大數(shù)據(jù)時(shí)代的人才素質(zhì)要求,這是統(tǒng)計(jì)學(xué)科發(fā)展面臨的另一挑戰(zhàn)。