hadoop其實是一個有某個基金會所開發(fā)的一種分布式的系統(tǒng)基礎架構,大家如果對分布式底層細節(jié)不太了解的話,也沒有關系,還可以開發(fā)分布式程序,以充分的利用集群威力來做高速的運算和存儲。而hadoop云存儲就是一個分布式的存儲系統(tǒng),我們可以在任何時候對文件做管理和下載等,下面新網(wǎng)就來具體說下hadoop云存儲能實現(xiàn)什么功能?基于Hadoop平臺的云存儲解決方案是怎樣的。
hadoop云存儲開發(fā)環(huán)境
Hadoop2.x分布式環(huán)境;
Eclipse;
Tomcat7;
JDK1.7;
hadoop云存儲主要技術
HDFS-API的運用;
JSP+Servlet;
Bootstrap框架渲染;
系統(tǒng)B/S結構;
MVC開發(fā)模式。
hadoop云存儲
hadoop云存儲實現(xiàn)功能
對文件的管理,其包含對文件的刪除,上傳,下載,新建文件夾等;
對后臺系統(tǒng)的實現(xiàn),包含用戶登陸,系統(tǒng)退出等;
后續(xù)待完善功能;
增加用戶注冊以及用戶基本信息修改功能;
用戶權限修改功能;
文件分享模塊。
基于Hadoop平臺的云存儲解決方案
云計算(Cloud Computing)是一種基于因特網(wǎng)的超級計算模式,在遠程的數(shù)據(jù)中心里,成千上萬臺電腦和服務器連接成一片電腦云。用戶通過電腦、筆記本、手機等方式接人數(shù)據(jù)中心,按自己的需求進行運算。目前,對于云計算仍沒有普遍一致的定義。結合上述定義,可以總結出云計算的一些本質特征,即分布式計算和存儲特性、高擴展性、用戶友好性、良好的管理性。
1云存儲架構圖
橘色的作為存儲節(jié)點(Storage Node)負責存放文件,藍色作為控制節(jié)點((Control Node)則是負責文件索引,并負責監(jiān)控存儲節(jié)點間容量及負載的均衡,這兩個部分合起來便組成一個云存儲。存儲節(jié)點與控制節(jié)點都是單純的服務器,只是存儲節(jié)點的硬盤多一些,存儲節(jié)點服務器不需要具備RAID的功能,只要能安裝Linux即可,控制節(jié)點為了保護數(shù)據(jù),需要有簡單的RAID level O1的功能。
云存儲不是要取代現(xiàn)有的盤陣,而是為了應付高速成長的數(shù)據(jù)量與帶寬而產(chǎn)生的新形態(tài)存儲系統(tǒng),因此云存儲在設計時通常會考慮以下三點:
(1)容量、帶寬的擴容是否簡便
擴容是不能停機,會自動將新的存儲節(jié)點容量納入原來的存儲池。不需要做繁復的設定。
(2)帶寬是否線形增長
使用云存儲的客戶,很多是考慮未來帶寬的增長,因此云存儲產(chǎn)品設計的好壞會產(chǎn)生很大的差異,有些十幾個節(jié)點便達到飽和,這樣對未來帶寬的擴容就有不利的影響,這一點要事先弄清楚,否則等到發(fā)現(xiàn)不符合需求時,已經(jīng)買了幾百TB,后悔就來不及了。
(3)管理是否容易。
2云存儲關鍵技術
云存儲必須具備九大要素:
①性能;
②安全性;
③自動ILM存儲;
④存儲訪問模式;
⑤可用性;
⑥主數(shù)據(jù)保護;
⑦次級數(shù)據(jù)保護;
⑧存儲的靈活;
⑨存儲報表。
云計算的發(fā)展離不開虛擬化、并行計算、分布式計算等核心技術的發(fā)展成熟。下面對其介紹如下:
(1)集群技術、網(wǎng)格技術和分布式文件系統(tǒng)
云存儲系統(tǒng)是一個多存儲設備、多應用、多服務協(xié)同工作的集合體,任何一個單點的存儲系統(tǒng)都不是云存儲。
既然是由多個存儲設備構成的,不同存儲設備之間就需要通過集群技術、分布式文件系統(tǒng)和網(wǎng)格計算等技術,實現(xiàn)多個存儲設備之間的協(xié)同工作,使多個的存 儲設備可以對外提供同一種服務,并提供更大更強更好的數(shù)據(jù)訪問性能。如果沒有這些技術的存在,云存儲就不可能真正實現(xiàn),所謂的云存儲只能是一個一個的獨立 系統(tǒng),不能形成云狀結構。
(2)CDN內容分發(fā)、P2P技術、數(shù)據(jù)壓縮技術、重復數(shù)據(jù)刪除技術、數(shù)據(jù)加密技術
CDN內容分發(fā)系統(tǒng)、數(shù)據(jù)加密技術保證云存儲中的數(shù)據(jù)不會被未授權的用戶所訪問,同時,通過各種數(shù)據(jù)備份和容災技術保證云存儲中的數(shù)據(jù)不會丟失,保證云存儲自身的安全和穩(wěn)定。如果云存儲中的數(shù)據(jù)安全得不到保證,也沒有人敢用云存儲了。
(3)存儲虛擬化技術、存儲網(wǎng)絡化管理技術
云存儲中的存儲設備數(shù)量龐大且分布多在不同地域,如何實現(xiàn)不同廠商、不同型號甚至于不同類型(例如FC存儲和IP存儲)的多臺設備之間的邏輯卷管 理、存儲虛擬化管理和多鏈路冗余管理將會是一個巨大的難題,這個問題得不到解決,存儲設備就會是整個云存儲系統(tǒng)的性能瓶頸,結構上也無法形成一個整體,而 且還會帶來后期容量和性能擴展難等問題。
hadoop云存儲能夠實現(xiàn)什么樣的功能?以上就給大家簡要的介紹了關于hadoop
云存儲技術和功能方面的問題,hadoop云存儲使用的技術比較多,它具有多種功能,比如文件管理,分享文件模塊等,另外,對于hadoop云存儲的解決方案,大家最好也要了解一下,如有疑問,可以咨詢新網(wǎng)。