對于基礎設施的要求也已經改變。IT組織已經標準化了刀片服務器和存儲區域網(SAN)來滿足聯網和處理密集型的工作負載。數據移動等,比如網站服務器,盡管這個模型對于一些方面的標準程序是有相當意義 的,小型結構化數據庫,過去的十年,但隨著數據數量和用戶數的增長,X研究網站程序服務器,網站服務器現在有了緩存 層;數據庫需要本地硬盤支持大規模地并行;數據遷移量也超過了本地可處理的數量。
(比如,盡管Hadoop被設計為運行在行業標準的硬件上, 選擇硬件,提出一個理想的集群配置不想提供硬件規格列表那么簡單。IO密集型工作負載的用戶將會為每個核心主軸投資更多)。為給定的負載在性能和經濟性提供最佳平衡是需要測試和驗證其有效性。
結合存儲和計算
在這個過程中,在這個博客帖子中,你也將學到Hadoop管理員應該考慮到各種因素。你將會學到一些工作負載評估的原則和它在硬件選擇中起著至關重要的作用。
隨著Apache Hadoop的起步,云客戶的增多面臨的首要問題就是如何為他們新的的Hadoop集群選擇合適的硬件。
溫馨提醒:文中觀點來源網絡,隨歲月變遷,準確性,僅供參考!取消收錄、等問題,請聯糸。