軟件特點:
1、速度快
基于內存進行計算(當然也有部分計算基于磁盤,比如shuffle)。
2、集成Hadoop
并不是要成為一個大數據領域的“獨裁者”,一個人霸占大數據領域所有的“地盤”,而是與Hadoop進行了高度的集成,兩者可以完美的配合使用。Hadoop的HDFS、spark大數據平臺官網,Hive、HBase負責存儲,YARN負責資源調度;復雜大數據計算。實際上,Hadoop+的組合,是一種“double win”的組合。
3、極高的活躍度
目前是Apache基金會的頂級項目,全世界有大量的優秀工程師是的committer。并且世界上很多頂級的IT公司都在大規模地使用。spark軟件官方網站、電腦軟件、行業軟件、其他行業、
4、容易上手開發
的基于RDD的計算模型,比Hadoop的基于Map-Reduce的計算模型要更加易于理解,更加易于上手開發,實現各種復雜功能,比如二次排序、topn等復雜操作時,更加便捷。
溫馨提醒:文章觀點來源于網絡,隨歲月變遷,準確性、可靠性、難免有所變動,因此文中資訊僅供參考!刪除,修改信息,聯糸方式,詳見網頁底部。