時間:2024-03-26 14:41作者:下載吧人氣:25
Spark介紹
按照官方的定義,Spark 是一個通用,快速,適用于大規模數據的處理引擎。
通用性:我們可以使用Spark SQL來執行常規分析, Spark Streaming 來流數據處理, 以及用Mlib來執行機器學習等。Java,python,scala及R語言的支持也是其通用性的表現之一。
快速: 這個可能是Spark成功的最初原因之一,主要歸功于其基于內存的運算方式。當需要處理的數據需要反復迭代時,Spark可以直接在內存中暫存數據,而無需像Map Reduce一樣需要把數據寫回磁盤。官方的數據表明:它可以比傳統的Map Reduce快上100倍。
大規模:原生支持HDFS,并且其計算節點支持彈性擴展,利用大量廉價計算資源并發的特點來支持大規模數據處理。
環境準備
mongodb下載
解壓安裝
啟動mongodb服務
$MONGODB_HOME/bin/mongod --fork --dbpath=/root/data/mongodb/ --logpath=/root/data/log/mongodb/mongodb.log
網友評論