基于Spark和Hadoop的規(guī)模化數(shù)據(jù)科學
時長:3天
課程概述:了解數(shù)據(jù)科學家的工作內(nèi)容、需要解決的問題以及其處理現(xiàn)實問題時應(yīng)用的方法, 以獲得來自不同行業(yè)數(shù)據(jù)的業(yè)務(wù)價值。實施自動推薦系統(tǒng)。
培訓對象:面向具備 Hadoop 基礎(chǔ)知識(HDFS、MapReduce、Hadoop Streaming、Hive) 的工程師、數(shù)據(jù)分析師、統(tǒng)計人員。培訓對象應(yīng)具備熟練的腳本語言能力:Python 是;熟悉Perl或者Ruby也可。