信息平臺和數(shù)據(jù)科學家的興起
在金融服務(wù)領(lǐng)域已經(jīng)構(gòu)建了歷史市場行為的大數(shù)據(jù)存儲作為該領(lǐng)域的數(shù)據(jù)科學家, 即數(shù)據(jù)分析專家(Quants),來開發(fā)新模型的實驗場。在工業(yè)以外,我發(fā)現(xiàn)在很多科學領(lǐng)域,研究生扮演著數(shù)據(jù)科學家的角色。Facebook數(shù)據(jù)組團隊的其中一員曾在生物信息實驗室工作過,在那里他構(gòu)建過數(shù)據(jù)管道流,并做類似的離線數(shù)據(jù)分析。在CERN,著名的Large Hadron Collider生成大量的數(shù)據(jù),這些數(shù)據(jù)是由一群追求突破的研究生精心收集和鉆研的。
最近新出的書如Davenport和Harris合著的《Competing on Analytics》(哈佛商學院出版社,2007),Baker的《The Numerati》(Houghton Mifflin Harcourt,2008)以及Ayres的《Super Crunchers》(Bantam,2008)都強調(diào)了在跨工業(yè)中數(shù)據(jù)科學家的重要性,他們在促進企業(yè)基于收集到的信息做出改進發(fā)揮了至關(guān)重要的作用。和研究社區(qū)在數(shù)據(jù)空間的調(diào)研一起,數(shù)據(jù)科學家在今后幾年需要進一步的定義。通過更好的闡明數(shù)據(jù)科學家角色,我們可以建設(shè)培訓課程、制定廣告層次、組織會議、寫書以及為任何被認可的行業(yè)做補充。在這個過程中,可行的數(shù)據(jù)科學家組織將會不斷擴展,用來滿足飛速增殖的數(shù)據(jù)平臺上不斷增長的專業(yè)“領(lǐng)航員”需求,進一步加速跨企業(yè)的學習過程。