22
14-12
摘要:在“基于Spark軟件棧的下一代大數據分析”演講之后,我們采訪了英特爾大數據首席架構師戴金權。深入了解了Spark應用場景、技術制約和未來發展方向,解讀了“Spark是Hadoop生態中下一代處理引擎和分析引擎”的原因。2014中國大數據技術大會上,英特爾大數據首席架構師戴金權發表了題為《基于Spark軟件棧的下一代大...
05
14-11
摘要:本文將介紹基于物品的協同過濾推薦算法案例在TDW Spark與MapReudce上的實現對比,相比于MapReduce,TDW Spark執行時間減少了66%,計算成本降低了40%。MapReduce為大數據挖掘提供了有力的支持,但是復雜的挖掘算法往往需要多個MapReduce作業才能完成,多個作業之間存在著冗余的磁盤讀寫開銷和多次資...
03
14-07
摘要:Databricks和MapR分別為Spark和Hadoop進行大量融資,以推動其成長。兩家公司對它們的融資情況是怎樣的,兩者未來的發展走勢如何。憑借技術優勢,它們的成長對未來業界云服務數據處理又會產生怎樣的影響呢?Spark首次由Databricks發布,融資3300萬美元;Hadoop再次得到MapR的1.1億美元的融資,以促進其在激烈...
工作日 9:00-12:00 13:30-18:00 周六及部分節假日提供值班服務