Intel 發表 Distribution for Apache Hadoop
分類: 軟體 新品報導 2/27/2013
為確保更多企業與個人能善加運用每天產生、蒐集、儲存的大量資料 – 亦即巨量資料(Big Data) – 英特爾宣布推出Intel Distribution for Apache Hadoop* (Intel Distribution)軟體。這款內含Intel Manager for Apache Hadoop*的軟體是基於晶片的架構所設計,具備領先業界的效能與改善安全性的功能。
從巨量資料中分析出有用資訊並對其賦予意義,將促進科學探索、催生新的商業模式以及消費者體驗,對於改變社會型態有著可觀的影響潛力。然而,因為現今的技術、方法、以及技能對於資料型態來說太過僵化,而且佈建的成本過於昂貴,因此至今全世界只有一小部分的人能從所有資訊中擷取出價值。
Hadoop*是開放原始碼框架,用來儲存與處理可擴充伺服器叢集中龐大且多類型資料,因此成為各界用來管理資料的首選平台。因應從數十億個感測器與智慧型系統匯集而來的更多資訊,整個框架必須維持開放性與擴充性,並須配合用戶需求帶來企業級的效能、安全性、以及具備可管理的能力。
英特爾副總裁暨資料中心軟體部門總經理Boyd Davis表示:「人和機器都會產生寶貴的資訊,並在諸多方面豐富我們的生活,像是從精準預測極端氣候到為絕症開發客製化療法。英特爾致力於提升所有的運算動能,提供給開放原始碼社群,為業界提供一個更好的基礎,藉此推展創新的極限,掌握巨量資料帶來的轉型機會。」
效能與安全:英特爾開創的新局面
英特爾提供了以Apache Hadoop*為基礎的創新開放性平台,能跟上巨量資料分析快速演進的步伐。Intel Distribution率先提供完全加密機制,支援Intel XeonR處理器中的IntelR進階加密標準新指令(Intel AES New Instructions,Intel AES-NI)。HadoopDistributed Files System*系統提供基於晶片的加密功能,讓企業能更安全地分析其資料集,而且效能完全不會因加密程序而降低。
Intel XeonR處理器平台中針對網路與IO技術進行最佳化,打造出更上一層樓的分析效能。過去需花四小時以上去分析1 TB (terabyte)的資料,由於英特爾硬體與Intel Distribution快速處理資料的組合,現在僅須七分鐘1就能完成。英特爾估計全世界每11秒就產生1 PB (petabyte),也就是1,000 TB的資料量,相當於長度達13年的HD影片,英特爾的技術實力為世界開創了更多可能性。
例如在醫院中,擷取出的資訊能協助改善病患的醫療成效,幫助醫護人員做出更快且更精準的診斷,藉由分析數百萬份的電子病歷、公共衛生資料、以及保險理賠記錄,去判斷藥物的效果、藥物間的相互作用、建議用藥劑量、以及潛在的副作用。同時藉由嚴格的全球化實施規範,以保護醫療與付款資訊,讓資料進行分析時仍得以維護安全與隱私性。
此外,Intel Manager for Apache Hadoop*軟體亦協助系統管理者簡化新應用程式的佈建、設定、以及監視叢集的作業程序。以往,管理者必須瞭解每個程式使用系統資源的狀況、Hadoop的組態、以及效能評測軟體才能進行調校。運用Intel Active Tuner for Apache Hadoop*軟體,可自動完成效能最佳化的設定,無須在效能調校時盲目地猜測。
英特爾與多家策略夥伴合作將這款軟體整合至數個下一代平台與解決方案,以及佈建在公有雲與私有雲環境。支持該軟體的夥伴包括1degreenorth*、AMAX*、思科(Cisco)*、Colfax Corporation*、Cray*、Datameer*、戴爾(Dell)*、En Pointe*、Flytxt*、Hadapt*、 HStreaming*、Infosys*、LucidWorks*、MarkLogic*、NextBio*、Pentaho*、Persistent Systems*、廣達電腦(Quanta)、RainStor*、紅帽(Red Hat)*、Revolution Analytics*、思愛普(SAP)*、賽仕(SAS)*、Savvis、CenturyLink *、Silicon Mechanics*、SoftNet Solutions*、美超微(Super Micro) *、Tableau Software*、天睿(Teradata)*、T-Systems*、Wipro*、以及Zettaset*。
跨入巨量資料的全方位途徑
新軟體讓英特爾得以擴展在資料中心運算、網路、儲存、以及智慧型系統產品的龐大陣容。最近推出的Intel Intelligent Systems Framework結合許多互通解決方案,讓智慧裝置在一貫與可擴充的模式下進行連結、管理、以及防護,奠定協助蒐集、分析、以及產生重要資訊的基礎,以應用在裝置及資料中心間的端至端的分析。
此外,英特爾持續挹注研發資源與資金,推動巨量資料產業體系的發展。英特爾實驗室(Intel Labs)已領先從事先進分析的研究,其中包括Intel Graph Builder for Apache Hadoop*軟體的開發,用來將巨量資料轉換成一目瞭然的圖表,以便於瞭解資料間的關連性。Intel Graph Builder針對Intel Distribution進行最佳化,讓用戶無須撰寫大量的客製化程式碼,進而縮短開發時間。與此同時,Intel Capital參與許多大型投資案,推動突破性巨量資料分析技術,其中包括MongoDB公司旗下的10gen,以及巨量資料分析解決方案供應商Guavus Analytics。