2007年10月19日 星期五

關連式資料庫已經落伍了!?

關連式資料庫已經落伍了!?

Relational database pioneer says technology is obsolete
http://www.computerworld.com/action/article.do?command=printArticleBasic&articleId=9034619

Eric Lai
September 06, 2007 (Computerworld)

身 為加州大學柏克萊分校的研究者,在 1970 年代早期,Michael Stonebraker 共同創造了 Ingres 與 Postgres 技術,那是今日許多主要關連式資料庫的基礎:微軟的 SQL Server、Sybase Inc. 的 Adaptive Server Enterprise、Ingres Corp. 的知名產品還有 IBM 的 Informix 與其他。

但 Stonebraker 現在議論,關連式資料庫,又稱為 RDBMS,已經「老掉牙了(long in the tooth)」而且「應該被列為遺產技術(legacy technology)」。

在一個新 blog(The Database Column,參見相關報導一)星期二的一篇文章裡,Stonebraker 也爭論今日的關連式資料庫的效能嚴重落後在新一波資料庫之後,這些新資料庫將資料表(database tables)翻轉了 90 度。

直 欄導向式資料庫(Column-oriented databases,參見相關報導二)-- 例如由 Stonebraker 的新公司,位在麻州 Andover 的 Vertica Systems Inc.,所打造的 -- 將資料垂直儲存在表格的直欄(columns)中,而非連續的橫列(rows)裡。

藉由把相似的資料放在一起,直欄導向式資料庫將磁碟讀取的時間最小化,當執行大規模的計算時,諸如那些在資料倉儲(data warehouse)當中所進行的,可獲得加倍成效。

" 總有天",直欄資料庫 "將奪取資料倉儲市場,完全迫使橫列儲存離開," Stonebraker 寫道。"因為許多資料倉儲使用者都遇到相當大的痛苦(無法從可用的載入視窗載入、無法支援點對點 [ad-hoc] 的查詢,若不經「分支提升 [fork-lift]」的升級就無法獲得更好的效能),我預期過渡到直欄儲存將迅速發生。"

直欄導向式資料庫並不新。Sybase 已成功銷售它基於直欄的 IQ 資料庫多年,成為一種高效能的商業智慧(BI)解決方案。最近的 BigTable,這個資料庫是由 Google Inc. 所打造,用來處理一些應用,資料則以直欄方式儲存。

但它們仍是一種利基祭品(niche offering)。相較下,在主流資料庫市場(那估計每年有 150 億美金)當中的領導玩家,全都倚賴使用基於橫列式資料表的系統。

以橫列組織資料也有它的優勢。將資料寫入磁碟時會比直欄式要快。這是高交易(transaction,異動)資料庫應用的關鍵,在那裡資料持續不斷地讀取與寫入資料庫,然而,這對於資料倉儲市場顯然不怎麼重要,在那裡資料通常只寫入一次,並且在之後存取許多次。

Stonebraker,他是 Vertica 的共同創辦人以及 CTO,宣稱他的新公司擁有其他效能提升的功能,例如非常具侵略性的資料壓縮以及查詢執行者(query executor),那能在「已壓縮的資料中運行」。

所以,"Vertica 打敗地球上所有橫列式儲存 -- 通常可勝過 50 倍," 他寫道。"唯一能與之相比擬的引擎是其他的直欄儲存,對於那些,Vertica 大約勝過 10 倍。"

Stonebraker 表示,其他類似 Vertica 的公司無法做這麼好。

"In every major application area I can think of, it is possible to build a SQL DBMS engine with vertical market-specific internals(在本質上專注於特定垂直市場的) that outperforms the 'one size fits all(一體適用的)' engines by a factor of 50 or so," 他寫道。

其他 Database Column 的貢獻者包括 Don Haderle,IBM 退休員工,他被認為是 DB2 資料庫之父,以及 Jerry Held,他曾協助創造 Tandem Computer 的 NonStop 資料庫。

※ 相關報導:

* One Size Fits All - A Concept Whose Time Has Come and Gone - The Database Column
http://www.databasecolumn.com/2007/09/one-size-fits-all.html

* Column-oriented DBMS - Wikipedia
http://en.wikipedia.org/wiki/Column-oriented_DBMS

英特爾研發大量多核處理器
科學家觀測到普適態
「模擬地球」預測未來
物理學家創造「幽靈般」的量子通訊