09
17-08
譯者注:想要程序的性能得到提升嗎?嘗試下通過找到慢的東西,然后用更快的東西來代
14
15-01
摘要:Hive查詢生成多個map reduce job,一個map reduce job又有map,reduce,spill,shuffle,sort等多個階段,所以針對hive查詢的優化可以大致分為針對MR中單個步驟的優化,針對MR全局的優化以及針對整個查詢的優化。一個Hive查詢生成多個Map Reduce Job,一個Map Reduce Job又有Map,Reduce,Spill,S...
21
14-05
摘要:騰訊分布式數據倉庫基于開源軟件Hadoop和Hive進行構建,TDW計算引擎包括兩部分:MapReduce和Spark,兩者內部都包含了一個重要的過程—Shuffle。本文對Shuffle過程進行解析,并對兩個計算引擎的Shuffle過程進行比較。騰訊分布式數據倉庫(Tencent distributed Data Warehouse, 簡
工作日 9:00-12:00 13:30-18:00 周六及部分節假日提供值班服務