2007年12月1日 星期六

線上圖書館讓讀者存取 150 萬本書

2007-11-30

線上圖書館讓讀者存取 150 萬本書

Online library gives readers access to 1.5 million books
http://www.physorg.com/news115383203.html

November 27, 2007

The Million Book Project(百萬圖書計畫),一個由美國的卡內基美隆大學(CMU)所領導、中國的浙江大學、印度的印度科學研究與埃及的亞歷山卓 (Alexandria,亞歷山大)圖書館所領導的國際合作計畫,已完成將 150 萬本書數位化的工作,現在正式上線。

自 2002 年這個計畫開始以來,這是頭一遭從馬克吐溫的「A Connecticut Yankee in King Arthur's Court(在亞瑟王庭院裡的康乃迪克州美國人)」到「The Analects of Confucius(論語)」的所有書籍都能透過 Universal Library(http://www.ulib.org/) 的單一入口網站取得,Gloriana St. Clair 說,CMU 的圖書館館長表示。

" 任何能連上網際網路的人,現在都能夠存取相當於一所大型大學藏書規模的書籍收集," Raj Reddy, CMU 的電腦科學系與機器人學教授。"此計畫讓我們更靠近理想中的 Universal Library:讓所有已出版的作品能讓人何人,在任何時間以任何語言取用。散佈知識的經濟障礙已然傾圮," Reddy 說,他是 Million Book Project 的開路先鋒。

儘管 Google、微軟與 Internet Archive 都發起大規模的書籍數位化計畫,Million Book Project 卻代表著世上最大的、能自由存取書籍的大學數位化圖書館。至少有半數以上的書籍已無著作權,或是在著作權人的允許下進行數位化,故完整的本文都將能,或最 終能,自由取用。

收藏包括大量的罕見書籍與孤本。超過 20 種語言遍及在 150 萬本書(約佔全世界書籍 1% 強)當中。

許多書籍,特別是中文與英文,都已經數位化 -- 它們的文字經由光學字元辨識(OCR)成電腦可讀取的文字。這讓這些書籍能夠被搜尋,而且終將能重新改變格式,讓 PDA 等裝置存取。

Reddy 的 Universal Library 自然發展下的結果,Million Book Project ,收到 NSF 所提供的 350 萬美元種子資金,以及隨後由軟、硬體製造商所提供的大量實物捐獻。這些資金主要是用在購買創造大型數位圖書館所需的掃描裝備以及開發掃描、數位化與編目方 法。

絕大多數的掃描、數位化與編目工作都在中國與印度的中心完成,在那裡分別有超過 110 萬與 36 萬本書被掃描過。美國、中國與印度則分別提供 1000 萬美金與非現金貢獻給該計畫。最近埃及的亞歷山卓圖書館也參與合作。現在全世界各地每天有 7000 本書被 1000 名以上的工作者所掃描。

"我們相當重視亞歷山卓圖書室的參與," Michael Shamos 說,CMU 電腦科學教授與著作權律師。"學者每每懊悔亞歷山卓圖書館在歷史各種不同的點中被毀滅,我們願意不遺餘力要讓未來看不見這樣的破壞。一旦書籍上了網際網路,它們將成為不朽。"

保 護與保存本文是主要目標,中國 Million Book Project 的領導 Pan Yunhe(潘雲鶴)表示。"紙張會變老、易碎,故書籍很快會變得如此脆弱,以致於沒有人可以在不傷害它的情況下閱讀," Yunhe 說,浙江大學前任校長,他現在是中國工程院的副院長。"藝術品會褪色。不過我們一旦有了數位化的文字與圖案,我們能讓它們無限制地循環流通。而且藉由將它 們儲存在多重網站中,我們能使它們被摧毀的風險(如同在亞歷山卓所發生的事)降至最低。"

"這種多語言的藏書開啟一個無比的良機,讓印度的文化材料能呈現在每個人眼前,並為自然語言的研究提供一個廣泛的可能性," N. Balakrishnan,印度科學研究所,本計畫的夥伴之一,的副主管表示。

" 數位化圖書館構成未來開發中世界一個不可或缺的部份," Ismail Serageldin 說,亞歷山卓圖書室主任。"這需要我們以創造二階層系統(two-tier systems)的資訊存取為目的,著手處理著作權管理、數位典藏與科學資料庫的狀態,那將使得開發中國家能以微不足道的費用或甚至是免費來存取這些資 訊。"

"雖然 Universal Library 的長遠目標是要讓書籍、插圖與其他出版物能夠免費上限,但目前的收藏中仍有半數擁有版權。直到取得著作權人的許可文件或是著作權法贊成(amended)之前,這些書籍當中只有 10% 能在沒有費用的情況下被存取。"

該 計畫已超過 100 萬本書,不過參與者目前正試圖拓展至所有國家,以及最終所有語言。Universal Digital Library 第三屆國際研討會,2007 11/2-4 日於 CMU 舉行,Million Book Project 的夥伴同意繼續掃描書籍,並徵招更多中心來掃描稀有與獨一無二的材料,並對那些已絕版但仍有著作權保護的書籍,繼續運作政府方面的解決方案。

※ 這些書籍的格式似乎都不一樣,TIFF、Djvu、HTML 等等都有。

* Online Library Project Hits 1.5 Million Book Milestone
http://blogs.pcworld.com/staffblog/archives/005983.html