作為與數(shù)據(jù)最為相關(guān)的領(lǐng)域之一,繼互聯(lián)網(wǎng)、物聯(lián)網(wǎng)之后,教育被視作大數(shù)據(jù)大有可為的重要行業(yè)。遍布教、學(xué)、研多層面的數(shù)據(jù)集合,通過有效利用大數(shù)據(jù)技術(shù),可幫助學(xué)生改善學(xué)習(xí)效率,提供符合職業(yè)規(guī)劃的個性化學(xué)習(xí)服務(wù),同時也有助于教育和科研機構(gòu)加快提升科研成果和教育質(zhì)量,培養(yǎng)更多更優(yōu)秀的創(chuàng)新性人才。
大數(shù)據(jù)時代教育迎新機遇
大數(shù)據(jù)時代,教育模式將加速轉(zhuǎn)型,一方面?zhèn)鹘y(tǒng)教育在朝著數(shù)字化教學(xué)過渡期間,也將逐步引入大數(shù)據(jù)分析技術(shù),更好地滿足人才培養(yǎng)、教育科研的需要;另一方面,不同區(qū)域社會經(jīng)濟發(fā)展帶來的教育差異性,可通過數(shù)據(jù)挖掘、教學(xué)案例結(jié)合本地產(chǎn)學(xué)結(jié)構(gòu),實現(xiàn)教育的“智慧化”。但無論何種情況,教育中的數(shù)據(jù)挖掘?qū)⒊蔀榇髷?shù)據(jù)分析的首要內(nèi)容。
教育機構(gòu)長年積累的數(shù)據(jù)大部分為結(jié)構(gòu)化數(shù)據(jù),比如考試成績、出勤紀(jì)錄等,但近幾年興起的數(shù)字化學(xué)習(xí)、教學(xué)互動等新型教學(xué)形式,通過智力輔導(dǎo)系統(tǒng)、個性化學(xué)習(xí)系統(tǒng)等產(chǎn)生的非結(jié)構(gòu)化數(shù)據(jù),為大數(shù)據(jù)時代教育行業(yè)的數(shù)據(jù)挖掘與分析奠定了基礎(chǔ)。
華為引領(lǐng)中國教育大數(shù)據(jù)應(yīng)用
就目前來說,教育行業(yè)通常采用的數(shù)據(jù)價值分析包括有預(yù)測、聚類、相關(guān)性挖掘、判斷、模式發(fā)現(xiàn),通過這些技術(shù)可利用大數(shù)據(jù)全面提升教育質(zhì)量和信息化水平。
在中國,教育行業(yè)的大數(shù)據(jù)市場更為廣闊,中國擁有較大的人口基數(shù),同時隨著社會經(jīng)濟的發(fā)展,人們對教育的重視和投入也逐年加大。比如中國頂級高等教育學(xué)府清華大學(xué),承擔(dān)起國家下一代互聯(lián)網(wǎng)核心網(wǎng)國家工程實驗室建設(shè)項目中的“下一代互聯(lián)網(wǎng)核心網(wǎng)運行管理技術(shù)研發(fā)平臺測量系統(tǒng)”的建設(shè)內(nèi)容,并建成“綜合流量采集與分析系統(tǒng)”和“Netflow流采集與分析系統(tǒng)”。前者需存儲6小時長度的全報文和24小時的分組頭數(shù)據(jù),最大滿足540TB;后者需支持25個核心節(jié)點的Netflow流數(shù)據(jù)的采集。采集系統(tǒng)、存儲系統(tǒng)、分析系統(tǒng)還需分層獨立構(gòu)建,并能夠滿足未來存儲容量和分析平臺升級的要求。
考慮到整體架構(gòu)的復(fù)雜性和平臺項目的長期性,需要選用具備整體解決方案的大數(shù)據(jù)技術(shù)。最終,清華大學(xué)選擇了華為的計算和存儲等一攬子解決方案:
1、通過N8500集群NAS系統(tǒng)為Netflow流采集與分析系統(tǒng)提供CIFS/FTP業(yè)務(wù),保存Netflow文件數(shù)據(jù),實現(xiàn)25個POP站點流數(shù)據(jù)及清華站點流數(shù)據(jù)的集中存儲與共享;
2、采用40臺RH2288H機架服務(wù)器為綜合流量采集與分析提供存儲和分析平臺,并為后續(xù)Hadoop平臺的建立奠定基礎(chǔ)。
華為高性能RH2288H服務(wù)器,通過創(chuàng)新架構(gòu)和高效設(shè)計,實現(xiàn)I/O模塊化靈活配置和熱插拔,在滿足高可靠性、高可用的同時,可確保最優(yōu)的計算性能和擴展能力,為后續(xù)的Hadoop大數(shù)據(jù)平臺的部署和應(yīng)用提供廣闊空間。除了支撐改平臺的RH2288H服務(wù)器以外,華為業(yè)內(nèi)首創(chuàng)推出的深度融合刀片服務(wù)器E9000,集計算、存儲、交換、管理于一體,可大幅簡化機房部署、提升運維效率。通過業(yè)內(nèi)領(lǐng)先的計算、存儲密度和能效,還可實現(xiàn)IT成本的顯著節(jié)省。
紅花還需綠葉襯大數(shù)據(jù)技術(shù)先行
清華大學(xué)承擔(dān)的國家工程試驗平臺,其目的就是為了針對下一代互聯(lián)網(wǎng)的發(fā)展需求,建立核心網(wǎng)技術(shù)研發(fā)、測試和試驗平臺,開展關(guān)鍵技術(shù)以及運營管理技術(shù)研究,推動下一代互聯(lián)網(wǎng)技術(shù)試驗、應(yīng)用示范和產(chǎn)品開發(fā),提高我國下一代互聯(lián)網(wǎng)核心網(wǎng)的運行和管理技術(shù)水平。實驗室建設(shè)將緊密圍繞信息化發(fā)展需要,提高下一代互聯(lián)網(wǎng)領(lǐng)域的自主創(chuàng)新能力,完成國家有關(guān)部門委托的科研課題,開展相關(guān)產(chǎn)業(yè)關(guān)鍵技術(shù)攻關(guān)、重要技術(shù)標(biāo)準(zhǔn)研究制訂,凝聚、培養(yǎng)產(chǎn)業(yè)急需的技術(shù)創(chuàng)新人才。
從某種程度上來說,教育大數(shù)據(jù)的應(yīng)用需要長遠(yuǎn)規(guī)劃,并通過早期試點形成規(guī)模效益。在助力清華大學(xué)國家工程試驗平臺項目上,華為深厚的技術(shù)底蘊和卓越的產(chǎn)品與解決方案,幫助實現(xiàn)了25個POP站點及清華站點流數(shù)據(jù)的集中存儲和共享,并為分光數(shù)據(jù)采集系統(tǒng)提供存儲和分析平臺,有利于后續(xù)Hadoop大數(shù)據(jù)平臺的設(shè)立和應(yīng)用。