摘要:短短兩年,Apache Drill當下已獲得超過40個公司的支持和貢獻,而在近日,更被MapR加入其公司的大數據平臺,作為開發者預覽版展示給用戶。
【編者按】近日,MapR正式將Apache Drill整合進該公司的大數據處理平臺,并開源了一系列大數據相關工具。時至今日,在高度競爭的Hadoop領域,開源已成為眾多公司的利器,他們紛紛通過貢獻更多的代碼來保護自己,也通過開源來攻擊其它公司的開發性。就這個事件,Derrick Harris在Gigaom上做了簡要分析。
以下為譯文
近日,MapR,Apache Drill項目的創建者,已經將該技術的初期版本整合到該公司的大數據平臺。該公司稱這個版本的Drill為0.5,以“開發者預覽版”的方式展示這個SQL查詢引擎。
Drill初公布是在 2012年8月,專注于SQL on Hadoop,當下已經取得了很大的進展。在SQL on Hadoop領域,各個公司可謂是八仙過海各顯神通——Cloudera的Impala、Hortonworks的Hive迭代,以及各種各樣的初創公司和開源項目,包括當下炙手可熱的Spark社區。
然而MapR的Chief Marketing Officer Jack Norris表示,Drill是個值得期待的技術,因為它是其他SQL on Hadoop引擎所有特性的“父集”。同時,Drill的主要特性在于,在數據被加載到數據庫之前,它可以快速的生成結構模式,這主要因為取代將數據轉換成其他模式或者表格,Drill保持原始的格式。因此,Drill也無法滿足那些期望將數據轉換成特定格式的用戶需求。
MapR產品管理負責人Tomer Shiran表示:“對比其他SQL on Hadoop項目,我們更有信心將Drill做好。”
盡管該公司當下的大數據平臺已經整合了Drill,但是這個技術并不是MapR產品的選擇。MapR的大數據平臺同樣整合了Impala和Hive堆棧,甚至通過更緊密的集成支持HP的Vertica分析工具。
Tomer承認:“通過支撐更多的技術及貢獻大量的代碼,這將作為MapR重塑專有Hadoop供應商形象更廣泛戰略的一部分。”Norris更表示:
當下,MapR發行版中所有關系到應用程序層組件都使用了開源技術或者標準的API。在將來,MapR將盡可能開源更多的技術。MapR會用實際行動證實這一點,比如這周二,公司就開源了大量 Hadoop平臺的資源管理功能,并且提交了MapR的磁盤IO分配方法,以及作業調度機制到Apache。
Drill已經得到超過40個以上公司的支持和貢獻,其中包括Cisco、LinkedIn以及威斯康星大學。當下,開源已經被證實為產品提升的有效途徑,通過眾包的方式它可以喜迎大量的工程師致力開源。同時,在高度競爭的Hadoop領域,開源更成為捍衛自己的盾牌,以及在開放性上攻擊其它公司的利劍。
原文鏈接: SQL-on-Hadoop tech Apache Drill is ready to use and part of MapR’s distro
本站文章版權歸原作者及原出處所有 。內容為作者個人觀點, 并不代表本站贊同其觀點和對其真實性負責,本站只提供參考并不構成任何投資及應用建議。本站是一個個人學習交流的平臺,網站上部分文章為轉載,并不用于任何商業目的,我們已經盡可能的對作者和來源進行了通告,但是能力有限或疏忽,造成漏登,請及時聯系我們,我們將根據著作權人的要求,立即更正或者刪除有關內容。本站擁有對此聲明的最終解釋權。