国产毛片a精品毛-国产毛片黄片-国产毛片久久国产-国产毛片久久精品-青娱乐极品在线-青娱乐精品

初期集群構建方案

發布時間:2018-11-29 11:50    發布者:ielilan
集群規模計算
集群規模取決于用戶數據及應用需求,最終規劃值為以下各種計算方式得出的最小集群規模的最大值
⦁        容量需求
⦁        估算相對容易且準確
⦁        大多數案例可以通過容量來決定集群規模
⦁         計算需求
⦁        準確的估算計算資源只能通過小規模測試并合理估算
⦁        其他資源限制
⦁        如用戶MapReduce應用可能對內存等資源有特殊要求,且單節點可配置資源相對有限,則集群最小規模需滿足用戶此類資源要求
網絡建議
⦁        建議使用萬兆網絡或更高速度網絡
⦁        如要充分利用磁盤并行操作帶寬,至少需要萬兆網絡
⦁        即使帶寬足夠,使用高帶寬網絡也能帶來性能提升
⦁        對網絡帶寬敏感的場景:
⦁        ETL類型或其他高輸入輸出數據量的MapReduce任務
⦁        對于空間或者電力資源有限的環境中,可使用大容量節點并配合高速度網絡
⦁        HBase等時延敏感類應用也對網絡傳輸速度有要求

傳統樹狀網絡
⦁        網絡超額(Oversubscription)
⦁        通過增加層次擴充網絡,但會有如下問題
⦁        節點間網絡距離增加
⦁        網絡超額問題惡化
⦁        因此盡量采用超多端口交換機或擴充交換機背板擴充端口容量
⦁        小型或中型網絡可以使用雙層樹形架構
⦁        僅通過頂層交換機上行端口和外部系統進行交互
⦁        避免Hadoop的網絡傳輸風暴污染外部網絡
組件架構
⦁        管理節點(Head/Master Node):如NameNode, Yarn及Master等
⦁        提供關鍵的、集中的、無替代的集群管理服務
⦁        若該管理服務停止,則對應集群Hadoop服務停止
⦁        需要可靠性高的硬件設備
⦁        數據節點(Data/Worker/Slave Node)
⦁         處理實際任務,如數據存儲,子任務執行等
⦁        同節點運行多個服務,為保證局部性
⦁        若該服務停止,則由其他節點自動代替服務
⦁        硬件各部件皆可能損壞,但能方便的替換
⦁        邊緣節點(Edge Node)
⦁        對外提供Hadoop服務代理以及包裝
⦁        作為客戶端訪問實際Hadoop服務
⦁        需要可靠性高的硬件設備
管理節點硬件要求
⦁        管理節點角色主要包括NameNode,Secondary NameNode,Yarn RM
⦁        Hive Meta Server以及Hive Server通常部署在管理節點服務器上
⦁        Zookeeper Server以及Hmaster可以選取數據節點服務器,由于一般負載有限,對節點無太大特殊要求
⦁        所有HA候選服務器(Active以及Standby)使用相同配置
⦁        通常對內存要求高但對存儲要求低
⦁        建議使用高端PC服務器甚至小型機服務器,以提高性能和可靠性
⦁        雙電源、冗余風扇、網卡聚合、RAID…
⦁        系統盤使用RAID1
⦁        由于管理節點數目很少且重要性高,高配置一般不是問題
數據節點配置策略建議
⦁        數量少但單點性能高的集群 vs. 數量多但單點性能低的集群
⦁        一般而言,使用更多的機器而不是升級服務器配置
⦁        采購主流的最”合算”配置的服務器,可以降低整體成本
⦁        數據多分布可獲得更好的scale-out并行性能以及可靠性
⦁        需要考慮物理空間、網絡規模以及其他配套設備等綜合因素來
⦁        考慮集群服務器數目
⦁         計算密集型應用考慮使用更好的CPU以及更多的內存
內存需求計算
⦁        需要大內存的主節點角色:
⦁        NameNode, Secondary NameNode,YARN AM, Hbase Regionserver
⦁        節點內存算法:
⦁        大內存角色內存相加
⦁        計算類應用需要大內存,如Spark/Impala建議至少256GB內存
硬盤容量選擇
⦁        通常建議使用更多數目的硬盤
⦁         獲得更好的并行能力
⦁        不同的任務可以訪問不同的磁盤
⦁        8個1.5TB的硬盤性能好于6個2TB的硬盤
⦁        除去數據永久存儲需求外,一般建議預留20%至30%的空間用于存儲臨時數據
⦁        MapReduce任務中間數據
⦁        實際部署中每服務器配備12個硬盤非常常見
⦁        單節點存儲容量最大值不超過48TB
存儲服務需求
數據源        Hadoop方式物理存儲容量        數據節點數量
原始文件
數據量 625T        625TB*3(復制份數)*0.3(壓縮比)/80%(硬盤利用率)=703TB
(只存放明細數據,無表,無MR)        按30T每節點
703TB/30*1.05(冗余度)=25臺
Hbase 和 Cassandra        數據服務:假設歷史數據量為2.6T,每日增量為55G,數據保留365天,3副本
使用壓縮時:
( 2.6 + 0.055*365 ) *1.3*1.2(key開銷)/70%(硬盤利用率)=51T        按30T每節點
51T/30*1.3(冗余度)=3臺
打開WAL時需增加:
region server wal大小(通常小於RS內存的一半)
服務器配置建議
        管理服務器        數據服務器        邊緣服務器
CPU        2*E5-2620v4        2*E5-2620v4        2*E5-2620v4
硬盤         SAS 600GB*4
RAID0+1        SAS 600GB*2
SATA  2T*15        SAS 600GB*2
SATA  2T*15
內存        256G ECC        256G ECC        256G ECC
網絡        雙萬兆網卡        雙萬兆網卡        雙萬兆網卡
數量        3        30        3
文件來源于www.bemore.cn

本文地址:http://www.qingdxww.cn/thread-550743-1-1.html     【打印本頁】

本站部分文章為轉載或網友發布,目的在于傳遞和分享信息,并不代表本網贊同其觀點和對其真實性負責;文章版權歸原作者及原出處所有,如涉及作品內容、版權和其它問題,我們將根據著作權人的要求,第一時間更正或刪除。
您需要登錄后才可以發表評論 登錄 | 立即注冊

廠商推薦

  • Microchip視頻專區
  • Dev Tool Bits——使用MPLAB® Discover瀏覽資源
  • Dev Tool Bits——使用條件軟件斷點宏來節省時間和空間
  • Dev Tool Bits——使用DVRT協議查看項目中的數據
  • Dev Tool Bits——使用MPLAB® Data Visualizer進行功率監視
  • 貿澤電子(Mouser)專區
關于我們  -  服務條款  -  使用指南  -  站點地圖  -  友情鏈接  -  聯系我們
電子工程網 © 版權所有   京ICP備16069177號 | 京公網安備11010502021702
快速回復 返回頂部 返回列表
主站蜘蛛池模板: 麻豆成人久久精品二区三区小说 | 免费手机黄色网站 | 欧美在线一区视频 | 麻豆精品久久久一区二区 | 欧美成人精品大片免费流量 | 九九老司机在线视频精品 | 男女那啥的视频免费 | 九一色视频 | 亚洲一区二区视频 | 天堂色综合 | 青青视频在线播放 | 99精品国产兔费观看66 | 9久9久女女热精品视频免费观看 | 91青草视频 | 欧美交性a视频免费 | 欧美日韩在线免费看 | 无限视频免费观看网 | 欧美激情一区二区三区视频高清 | 东方四虎 | 青青草原国产在线视频 | 青青草手机视频 | 日本一区二区三区四区视频 | 欧美成人午夜精品免费福利 | 交在线观看网站视频 | 日韩欧美国产高清 | 韩国免费a级毛片 | 亚洲五月激情网 | 中文字幕日韩女同互慰视频 | 色视频在线免费 | 久久思| 国产成人精品一区二区视频 | 可以免费观看的黄色网址 | 日日噜噜夜夜狠狠视频无 | 天天摸天天操免费播放小视频 | 日日夜夜操天天干 | 欧美一卡2卡三卡4卡公司免费 | 五月天在线免费视频 | 淫操干 | 九九成人 | 欧美一区二区三区大片 | 国产精品精品视频 |