課程描述INTRODUCTION
hadoop培訓班
日程安(an)排(pai)SCHEDULE
課程大綱Syllabus
hadoop培訓班
【課程背景】
為響應工業和信息化部信息化高端人才培養的號召,曼頓培訓中心特推出了Hadoop技術架構課程培訓班,希望通過專業的Hadoop技術架構體系與業界真實案例來全面提高大數據工程師、設計人員的工作水平,旨在培養專業Hadoop技術架構專家,更好地服務于大數據開發。
【培訓特色】
項目全過程Hadoop沙盤模擬實戰。通過一個完整的大數據開發項目及一組實際項目案例,完全覆蓋Hadoop開發過程的各個技術體系的實踐應用。該項目是一個課堂實踐項目,以項目小組的形式進行沙盤實操練習,重點在于強化理解Hadoop項目各個階段的工作重點,同時明確并強化作為項目管理者的一些基本素質。
強調互動式教學、強化團隊討論,力爭每一個學員在課程中都有上臺發言的機會,將有超過50%-70%的時間用于討論、練習及游戲(具體比例可視學員的情況進行調整)。但這一做法需要學員的積極參與,盡可能地將實際項目中地各種問題拿出來討論,這要求學員前期做一定地準備工作。
【培訓目標】
1、了解Hadoop的歷史及目前發展的現狀、以及Hadoop的技術特點,從而把握分布式計算框架及未來發展方向,在大數據時代能為企業的技術選型及架構設計提供決策參考。
2、全面掌握Hadoop的架構原理和使用場景,并通過貫穿課程的項目進行實戰鍛煉,從而熟練使用Hadoop進行MapReduce程序開發。課程還涵蓋了分布式計算領域的常用算法介紹,幫助學員為企業在利用大數據方面體現自身價值。
3、深(shen)入理(li)解(jie)Hadoop技(ji)術架構(gou),對(dui)Hadoop運(yun)(yun)作機制有清(qing)晰(xi)全面(mian)的認識,可以獨(du)立規劃及部署生產環境的Hadoop集(ji)群(qun),掌握Hadoop基(ji)本運(yun)(yun)維(wei)思(si)路和(he)方法,對(dui)Hadoop集(ji)群(qun)進行(xing)管理(li)和(he)優化。
【課程大綱】
第一天上午
一、Hadoop入門,了解什么是hadoop
1、Hadoop產生背景
2、Hadoop在大數據、云計算中的位置和關系
3、國內外Hadoop應用案例介紹
4、國內Hadoop的就業情況分析及課程大綱介紹
5、分布式系統概述
6、Hadoop生態圈以及各組成部分的簡介
7、Hadoop核(he)心MapReduce例子說明
二、分布式文件系統HDF
S,是數據庫管理員的基礎課程
1、分布式文件系統DFS簡介
2、HDFS的系統組成介紹
3、HDFS的組成部分詳解
4、副本存放策略及路由規則
5、NameNodeFederation
6、命令行接口
7、Java接口
8、客戶端與HDFS的數據流講解
9、HDFS的可用(yong)性(HA)
第一天下午
三、初級MapReduce,成為Hadoop開發人員的基礎課程
1、如何理解map、reduce計算模型
2、剖析偽分布式下MapReduce作業的執行過程
3、Yarn模型
4、序列化
5、MapReduce的類型與格式
6、MapReduce開發環境搭建
7、MapReduce應用開發
8、更多(duo)示(shi)例(li)講(jiang)解,熟悉MapReduce算法原理
第二天上午
四、高級MapReduce,高級Hadoop開發人員的關鍵課程
1、使用壓縮分隔減少輸入規模
2、利用Combiner減少中間數據
3、編寫Partitioner優化負載均衡
4、如何自定義排序規則
5、如何自定義分組規則
6、MapReduce優化
7、編程實戰
五、Hadoop集群與管理,是數據庫管理員的高級課程
1、Hadoop集群的搭建
2、Hadoop集群的監控
3、Hadoop集群的管理
4、集群下運行MapReduce程序
六、ZooKeeper基礎知識,構建分布式系統的基礎框架
1、ZooKeeper體現結構
2、ZooKeeper集群的安裝
3、操作ZooKeeper
第二天下午
七、Hbase基礎知識,面向列的實時分布式數據庫
1、Hbase定義
2、Hbase與RDBMS的對比
3、數據模型
4、系統架構
5、Hbase上的MapReduce
6、表的設計
八、Hbase集群及其管理
1、集群的搭建過程講解
2、集群的監控
3、集群的管理
九、Hbase客戶端1、HbaseShell以及演示
2、Java客戶(hu)端以(yi)及代碼演示
第三天上午
十、Pig基礎知識,進行hadoop計算的另一種框架
1、Pig概述
2、安裝Pig
3、使用Pig完成手機流量統計業務
十一、Hive,使用sql進行計算的hadoop框架
1、數據倉庫基礎知識
2、Hive定義
3、Hive體系結構簡介
4、Hive集群
5、客戶端簡介
6、HiveQL定義
7、HiveQL與SQL的比較
8、數據類型
9、表與表分區概念
10、表的操作與CLI客戶端演示
11、數據導入與CLI客戶端演示
12、查詢數據與CLI客戶端演示
13、數據的連接與CLI客戶端演示
14、用戶自定義函數(UDF)的(de)開發與演(yan)示
第三天下午
十二、Sqoop,hadoop與rdbms進行數據轉換的框架
1、配置Sqoop
2、使用Sqoop把數據從mysql導入到HDFS中
3、使用Sqoop把數據從HDFS導出到mysql中
十三、大數據實戰
大數(shu)據(ju)完(wan)整項目(mu)架(jia)構和開發(fa)過程練習
【講師介紹】
錢興會老師,中國培訓資訊網()資深講師。
大數據專家。在電信、電力、金融行業從事Java開發和架構設計的工作;資深云計算研發工程師。作為項目的主要成員和負責人參與并領導完成了多個大型復雜項目,并成功應用于行業解決方案,如海量數據匹配系統、電力行業實時數據采集分析系統等。設計并實現了實時索引系統-云搜,成功應用與某國企知識庫系統。并可應用與互聯網行業的搜索等應用。完成多個云計算解決方案的架構,涉及到金融行業海量數據分析與數據處理系統、海量日志分析系統、電力用電信息統計系統等,獲得業界認可。
鐘運琴老師,中國培訓資訊網()資深講師。
任職于(yu)某研究(jiu)(jiu)所,中國科學(xue)院計(ji)算技術(shu)研究(jiu)(jiu)所攻讀計(ji)算機系統(tong)結構博士(shi)學(xue)位。從(cong)2008年(nian)12月起(qi),主(zhu)要(yao)從(cong)事云(yun)計(ji)算和(he)大規模數據管(guan)理方面的研究(jiu)(jiu),精(jing)通云(yun)計(ji)算平臺和(he)大規模數據庫管(guan)理系統(tong)內部實現(xian)細節,包括(kuo)Hadoop、鍵值(zhi)存(cun)儲系統(tong)(KVS)、NoSQL(Hbase、Cassandra、Membase/Memcached)數據庫和(he)數據倉庫(HIVE)。
hadoop培訓班
轉載://bamboo-vinegar.cn/gkk_detail/8556.html
已開課時間Have start time
大數據課程公開培訓班
- 大數據時代營銷數據分析技能 陳劍
- 大數據、云計算與信息化演進 何寶(bao)宏
- 贏在未來-大數據時代的財務 呂(lv)軍
- 產品數據管理高級實務培訓 劉(liu)海濤
- 大數據時代的商業數據分析管 鄒紅偉
- 大數據分析(Hadoop) 朱永(yong)春(chun)
- 大數據時代財務管理-從業務 楊云(yun)
- 大數據時代的績效管理 楊云
- 大數據時代的績效管理-精細 楊云
- 大數據時代企業公司化運營 楊云(yun)
- 大數據分析與洞察 孫子(zi)辰
- 大數據時代的財務管理—從業 楊云
大數據課程內訓
- Quick BI 數據分析 張曉如(ru)
- 以需求為導向的大數據精準營 張世(shi)民(min)
- 《跨境電商全鏈路AI賦能轉 黃光偉(wei)
- 數字技術與數字工具應用 王(wang)文琭
- 數智化領域新技術與典型應用 胡(hu)國慶
- 大數據應用現狀與未來發展重 胡國慶
- 政府數字化轉型實務 焦波
- 數字經濟時代銀行開展數字化 李勇
- 數字經濟與數據技術應用與變 王文琭
- 《銀行數據驅動經營方法論與 宗(zong)錦(
- 數字時代下的營銷趨勢 韓天成
- 《數據資源入表與數據治理》 鐘凱