您现在的位置是:Instagram刷粉絲, Ins買粉絲自助下單平台, Ins買贊網站可微信支付寶付款 >
06 stash訂閱轉換(es怎么改角色叫我什么)
Instagram刷粉絲, Ins買粉絲自助下單平台, Ins買贊網站可微信支付寶付款2024-06-08 20:52:41【】2人已围观
简介面包括幾個組件HDFS、MapRece和YARN,HDFS是存儲數據的地方就像我們電腦的硬盤一樣文件都存儲在這個上面,MapRece是對數據進行處理計算的,它有個特點就是不管多大的數據只要給它時間它就
Zookeeper:這是個萬金油,安裝Hadoop的HA的時候就會用到它,以后的Hbase也會用到它。它一般用來存放一些相互協作的信息,這些信息比較小一般不會超過1M,都是使用它的軟件對它有依賴,對于我們個人來講只需要把它安裝正確,讓它正常的run起來就可以了。
Mysql:我們學習完大數據的處理了,接下來學習學習小數據的處理工具mysql數據庫,因為一會裝hive的時候要用到,mysql需要掌握到什么層度那?你能在Linux上把它安裝好,運行起來,會配置簡單的權限,修改root的密碼,創建數據庫。這里主要的是學習SQL的語法,因為hive的語法和這個非常相似。
Sqoop:這個是用于把Mysql里的數據導入到Hadoop里的。當然你也可以不用這個,直接把Mysql數據表導出成文件再放到HDFS上也是一樣的,當然生產環境中使用要注意Mysql的壓力。
Hive:這個東西對于會SQL語法的來說就是神器,它能讓你處理大數據變的很簡單,不會再費勁的編寫MapRece程序。有的人說Pig那?它和Pig差不多掌握一個就可以了。
Oozie:既然學會Hive了,我相信你一定需要這個東西,它可以幫你管理你的Hive或者MapRece、Spark腳本,還能檢查你的程序是否執行正確,出錯了給你發報警并能幫你重試程序,最重要的是還能幫你配置任務的依賴關系。我相信你一定會喜歡上它的,不然你看著那一大堆腳本,和密密麻麻的crond是不是有種想屎的感覺。
Hbase:這是Hadoop生態體系中的NOSQL數據庫,他的數據是按照key和value的形式存儲的并且key是唯一的,所以它能用來做數據的排重,它與MYSQL相比能存儲的數據量大很多。所以他常被用于大數據處理完成之后的存儲目的地。
Kafka:這是個比較好用的隊列工具,隊列是干嗎的?排隊買票你知道不?數據多了同樣也需要排隊處理,這樣與你協作的其它同學不會叫起來,你干嗎給我這么多的數據(比如好幾百G的文件)我怎么處理得過來,你別怪他因為他不是搞大數據的,你可以跟他講我把數據放在隊列里你使用的時候一個個拿,這樣他就不在抱怨了馬上灰流流的去優化他的程序去了,因為處理不過來就是他的事情。而不是你給的問題。當然我們也可以利用這個工具來做線上實時數據的入庫或入HDFS,這時你可以與一個叫Flume的工具配合使用,它是專門用來提供對數據進行簡單處理,并寫到各種數據接受方(比如Kafka)的。
Spark:它是用來彌補基于MapRece處理數據速度上的缺點,它的特點是把數據裝載到內存中計算而不是去讀慢的要死進化還特別慢的硬盤。特別適合做迭代運算,所以算法流們特別稀飯它。它是用scala編寫的。Java語言或者Scala都可以操作它,因為它們都是用JVM的。
很赞哦!(91)
相关文章
- 01 買粉絲訂閱號只能一天發一篇文章嗎(買粉絲買粉絲為什么一天只能發1條信息了?)
- 01 買粉絲訂閱號圖標圖片(在買粉絲里點出訂閱號消息為什么右上角沒有頭樣圖標而只有三個點?)
- 01 買粉絲訂閱號消息歷史怎么看(如何查看買粉絲買粉絲買粉絲訂閱號的所有歷史文章?)
- 01 關注買粉絲給傭金的任務群(剛加入一個群就只讓你關注買粉絲 然后給你發2元傭金 這個靠譜嗎?)
- 01 買粉絲訂閱號怎么發布作品(買粉絲訂閱號上如何上傳視頻?)
- 01 買粉絲訂閱號怎么制作滑動圖片的效果(買粉絲訂閱號里面的圖片動態效果如何實現)
- 01 關注買粉絲顯示操作過于頻繁(關注買粉絲買粉絲提示操作過于頻繁,請稍后再試,咋回事?)
- 01 買粉絲訂閱號如何取消視頻模塊(買粉絲視頻號推送消息怎么關閉)
- 01 關注醫院買粉絲買粉絲怎么發朋友圈(買粉絲買粉絲如何發朋友圈通知)
- 01 買粉絲訂閱號助手網頁版登錄首頁網頁版(如何下載買粉絲中的訂閱號助手)