2007年7月18日 星期三

電子交易標準RosettaNet改採收費制

記馬培治/台北報導  17/07/2007

廣受高科技製造業採用的電子交易流程標準RosettaNet,一改早前公開、免費的政策,近日起正式開始收費。

RosettaNet是在今(2007)年三月底,在全球分會會議中決議,自6月1日起不再免費提供標準文件的下載,使用者若欲採用RosettaNet 組織發佈的相關標準,必須付費取得標準技術文件後,才得以合法使用。根據RosettaNet台灣分會代表、資策會創新應用服務研究所專案經理張潔表示, 收費方案採雙軌制,企業可以選擇以單筆付費方式下載個別標準文件,或繳交年費加入RosettaNet台灣分會以取得標準使用權。

根據該會規定,下載標準文件須支付295美元的費用,七類標準文件全部下載,須支付美金2065元。但若企業本身是RosettaNet 各地分會的會員,則可免費取得標準文件。而台灣分會的會員年費,分為一般製造業者的普通會員,以及供應鏈相關解決方案提供者的夥伴會員兩種,會員年費則分 別為新台幣3萬元與4萬5000元。

由全球40多間IT軟硬體廠商在1998年於美國合作創立的RosettaNet,為一提供以XML為基礎的跨企業供應鏈資訊傳輸技術標準 的非營利組織,在全球各地均有分會,包括HP、微軟、IBM、Intel等IT大廠皆為創始會員。由於受到大廠加持,RosettaNet已是不少國際著 名高科技或電子產品製造業者如Nokia、Intel等所採用的B2B電子商務標準規格。

由於自成立日起便是以免費方式提供標準文件,Rosetta轉向收費的決定,便特別引起外界好奇政策轉變的原因。

「收費的目的在於推廣使用者付費的觀念,」張潔表示,由於採用RosettaNet標準進行電子交易自動化的製造業者多半具有一定規模,對於僅數萬元的標準文件費用並不會太在意,「僅收取象徵性的金額,並沒有聽到企業反彈的聲音,」她說。

RosettaNet台灣分會估計,目前台灣地區約有200家廠商採用RosettaNet標準,但分會會員至六月份僅有20家,收費政策實施後則增加至25家。張潔表示,相較於單次下載標準文件,加入會員繳交的費用較少,因此將吸引業者陸續加入成為分會會員。

數位冰河時代 -- 你的檔案還能用嗎?

The Digital Ice Age

http://www.popularmechanics.com/technology/industry/4201645.html

在我們當前的時代,文件都以位元與位元組記錄,而且不保證未來的可讀性。當科技改朝換代時,我們可能發現我們的檔案被冰凍在已經被遺忘的格式當中。我們整個時代的人類歷史將會消失不見嗎?

BY Brad Reagan / Published in the December, 2006 issue.

當航空母艦尼米茲號(USS Nimitz)開始在海上航行時,它攜帶了超過 50萬個推進、機電與其他系統的圖表檔案。因為現在是 21 世紀,所以沒有不方便的工程製圖紙捲,只有艦上電腦中的數位檔案。改變成數位科技後,能讓海軍工程師在世界任何角落存取這些圖表讓維修更加有效率。理論上。數年以前,當較舊的檔案於新版 CAD(電腦輔助設計)軟體開啟時,海軍注意到一個問題。

"我們將檔案打開時,會喊出:'哇,這不太像以前話的圖,'" Norfolk 海軍造船廠航空母艦規劃工場部門的頭頭 Brad Cumming 表示。

這種改變有點微妙 -- 破折號變成了虛線或細微的尺寸改變 -- 不過足以引起海軍工程師的憂慮。即便是最細微的差異,都對於一艘以二具核子反應器為動力,並且滿載達 85 架飛機的船隻來說,都有可能危及任務。

恢復數位檔案不只是美國海軍的挑戰。事實上,資料遺失或毀損所造成的威脅,每個倚賴數位媒介來儲存資料的人都會面對 -- 而且在今日,幾乎是每個人了。數位資訊的創造與儲存是如此簡便,我們自然認為,在未來它將能很容易的,很精確的被保存。在未來沒有一樣能夠成真。事實上,我們的數位資訊 -- 從我們所愛之人的照片到海軍的圖表中的每樣東西 -- 都處於降級(degrading)的風險中,變成無法讀取或全然消失無蹤。

這個問題愈來愈明顯,而一般公民都無法察覺。它會在我們的硬碟掛掉或我們的新電腦沒有軟碟機,或我們線上 e-mail 服務關門大吉並且將我們的通訊郵件一並帶走時收成。我們會認為類型的資料喪失情節是一場個人大災難。浩瀚的文件(writ large),它們是症候逐漸危及的一群。如我們用來創造與儲存資訊的軟硬體屆時不在可靠,那麼我們用那些資訊打造的每樣東西都岌岌可危了。

龐大的政府與學術研究所在數年前開始著手對付資料喪失的問題,迄今只有少數實在的進展。此領域的專家同意,如果一個解決辦法不趕快研究出來,我們可能在歷史長流中留下一抹空白。"這段時期可以想見會被丟失,"

Jeff Rothenberg 說,Rand Corp. 一位電腦科學家,他精通(studied)數位典藏(digital preservation)。

在我們大部分的過去,替後代保存資訊,大部分都是將照片、書信或其他文件存放於一個安全的地方。內戰之後的個人帳單至今依然可以被讀取,因為人們費盡心力來保存書信,不過美國軍人從伊拉克前線寄到家中的幾百萬封e-mail 當中有多少能夠在 100 年後被讀取呢?

數位時代諷刺的地方是歸檔已經變成一種比過去更複雜的程序了。你不只是要保護持有你資訊的物理性磁碟、磁帶與驅動器,你還必須確保這些媒介能與未來的軟硬體相容。"大部分的人都無法辨識以某種格式編碼的數位東西,那需要軟體以人類可以感知的形式來呈現(render)它," Rothenberg 說。"那些知道如何呈現這些位元的軟體逐漸被淘汰。而跑它們的電腦也逐漸被過時。"

例如,1986 年,BBC 編輯了環視中世紀英格蘭生活的《征服者威廉的末日審判書(William the Conqueror's Domesday Book)》一部現代的、互動式的版本。有超過 100 萬人替這本新「書」提交照片、撰寫描述與剪輯短片。它被儲存在雷射光碟上 -- 在那時被認為是不會毀滅的 -- 所以未來的學生與學者可以習知 20 世紀的生活。

但是 15 年後,英國官員發現在碟片上的資訊差不多無法被讀取 -- 不是因為碟片毀損,而是因為它不再與現代的電腦系統相容。相較之下,原本的《末日審判書》,1086 年寫在羊皮紙上,仍位在英格蘭 Kew 的國家檔案館中處於可閱讀的狀態下。(多媒體的版本最後被搶救回來。)

電腦標準的改變並非數位資料的唯一威脅。在 2004 年,Miami-Dade 郡宣佈,因為嚴重的電腦當機,它已經丟失了 2002 年大選幾乎所有電子投票的記錄 -- 提醒了我們電子記錄許多不足之處 -- 保存可歸因於日常設備的失誤(詳見原網站的 "Preserving Your Data" 專欄)。此外,軟體公司也有可能關門大吉,讓它們專有的程式碼隨之而逝。在 2001 年,線上相片儲存網站 PhotoPoint 關閉,而數百人喪失了他們儲存載網站上的照片。

不過資料遺失,不只是會發生在一顆掛掉的硬碟或沒有機器能夠播放的碟片上。一個數位檔案只是一長串二進位碼。不像書信或是相片,它的內容無法直接呈現在終端使用者面前。為了要看見一張被儲存為 JPEG 檔的照片或是閱讀一封以文字處理程式編輯的信,我們需要軟體幫忙將這些編碼翻譯給我們。

根據 Software and Information Industry Association,軟體應用程式平均每隔 18 個月到 2 年就會更新,而新版本通常不會相容於先前的版本。這對於尼米茲號而言是個問題,正如同它也可能會替你製造麻煩,如果有問題的檔案,你醫療記錄的話。

同樣地,法律事務所發現 metadata -- 關於資料的資料,諸如這個檔案何時被建立 -- 在檔案被拷貝時通常無法精確的被轉移。例如:磁性儲存媒介,如硬碟,允許三部份的日期儲存系統(建立/存取/修改),而在光學媒介,如 CD-R 等等,只允許一種日期,這對於法律訴訟是個難題,因為律師必須要建立案件中關鍵事件的年代表。"我幾乎在每一個單一個案中都會遇到," Craig Ball,一位電腦鑑識專家,他勸告律師事務所。"在許多程度上,那是一個相當複雜的問題。我們失去很多!"(譯註:比較新式的壓縮軟體可以保存這些資料,另外,如果是電腦鑑識用途,需要更特殊的軟體才有辦法複製保存電腦系統當中的精確日期。)

一如 Richard Pearce-Moses,Society of American Archivists 的前任總裁,所表達的,"我們可以讓 0 與 1 長存,但我們能理解它嗎?"

作者最近旅行到華盛頓特區,會見國家檔案館電子記錄檔案(ERA)的頭頭Ken Thibodeau。國家檔案館對於保存所有與歷史相關的文件與聯邦政府所產生的資料 -- 來自於白宮的 e-mail 到核廢料儲存地點的每樣東西 -- 這件苦差事感到緊張。10 年前,Thibodeau 最大的顧慮是如何處理柯林頓政府送來歸檔的 3200 萬封 e-mail。然而這只是個開始。預計布希政府會在2008 年時產生 1 億封 e-mail。Thibodeau 長久以來體認到光是將資料拷貝到磁帶上 -- 先前將電子記錄歸檔的方式 -- 不足以應付數位時代,而且與接踵而來如雪崩般更加複雜的數位檔案相較,這只不過是涓涓細流。

"問題是我們所建造的每樣東西,不管它是高速公路、隧道、船隻或飛機,都是用電腦設計的," Thibodeau 說。"送來歸檔的電子記錄比起紙張記錄要多上 100 倍。我們不知道要如何避免丟失大部分在今日所建立的數位資訊。"

國家檔案館不只是要將極大量的資料進行分類,它也要找到一種方式讓那些資料可以被理解。Thibodeau 希望開發一種系統,那可以保存任何種類的文件 -- 由任何應用軟體與電腦平台所建立,並且在任何數位媒介上傳遞 --只要美國依然是個共和政體。牽連的問題還更多,這些檔案需要能夠被搜尋。當 Thibodeau 向政府研究實驗室一位的頭頭說明他的任務時,那個人回答,"你的問題太大了,要去嘗試以及解決這個問題可能是一件很蠢的事。"

去年,國家檔案館授與 Lockheed Martin 3080 萬美金的合約,來開發此系統。"我們認為這是資訊時代一種開創性的努力," Clyde Relick,該計畫的計畫主持人表示。

迄今,ERA 目前已經確認出他們需要涵括的、超過 4500 種的檔案格式。每一種檔案格式基本上需要一種獨立的解決方案。哪一種資訊需要被保存?這些資訊應如何呈現?

一個相對簡單的例子為例,讓我們看看來自於某管控局處頭頭的 e-mail。如果信件是純文字,它的解決方法很簡單。但如果有附件呢?是哪一種檔案被夾帶?如果這個附件是一份試算表,那麼這張試算表的行為需要保留嗎?換句話說,未來的一代能夠執行此一格式並且玩弄這些資料是否事關緊要?

"當我們擁有的是紙張文件時,這看起來不像是個挑戰," Relick 說。更複雜的檔案格式,例如 NASA 的虛擬實境訓練程式,則需要更複雜的解決方案。ERA 在某些錯綜複雜的挑戰中,與一票研究夥伴一起工作,包括聖地牙哥超級電腦中心以及 NSF。

Lockheed 所建立的主要是一套 "遷移" 系統,在其中檔案被轉換成具有彈性的格式,例如:XML,所以這些檔案可以被未來的科技所存取。這個點子可以在拷貝時不會喪失資料原本的特徵。

並非每一位都同意 Lockheed 的方法。以 Rand Corp., 的 Rothenberg 為例,相信採用一種 "模擬" 的策略可能更加恰當。模擬允許現代電腦模仿較老的電腦,所以它能夠執行某些程式。今日所使用的模擬程式能夠讀取專為Sony PlayStation 2 或 Microsoft Xbox 設計的電玩,並且在 PC 上玩。

"對我而言,遷移就等於扔掉原物," Rothenberg 說。"它甚至沒有試著要保存原物。你所終結的是某人對於原物有多重要的點子。(What you end up with is somebody's idea about what was important about the original.)"

Relick 說模擬涉及的成本與科技努力對於像 ERA 這種規模的計畫是不可行的。此外,他還提到那些檔案能讓任何人透過瀏覽器來存取,而且模擬在使用者的軟硬體搭配有無限多種的情況下,會變得相當困難。

Lockheed 團隊的目標是讓 ERA 於 2007 年 9 月能有最初步的運作能力,但預算縮減很可能會延遲程式的搜尋功能。

資料危機決不限於國家檔案館,或是軍方部門。國會圖書館也位在它自己的典藏計畫當中,還有許多大學也正忙於建立能夠留存不同學術研究的系統。

但是為政府與學界開發的計畫並不能夠幫助個人電腦使用者找到遺失的e-mail。某些專家相信,這是單一市場力量的結果:消費者必須對數位典藏沒有太多關注,而企業則必須在事業中符合消費者的需求。其他人則說企業是銷售更多新產品唯一的顧慮。

"他們的興趣,對我而言,是隨時創造不相容,而非相容," Rothenberg 說,"冷眼旁觀,他們沒有太多動機要對自己強加相容性的重擔,因為這樣做只會阻止消費者『升級』。"

然而,這裡已經有受到鼓勵的發展。在 2005 年末,微軟宣佈將開放它自己Office suite 的檔案格式,包括 Word 與 Excel 給競爭對手,以便讓Office 被授證為一種國際標準。藉由將格式的專有控制割讓給第三方開發者,微軟大大的增加這些格式將會被未來一代存取的可能性。

在此同時,International Organization for Standardization 最近認可Adobe Systems 熱門的 Portable Document Format (PDF) 的修改版本,專門用於長期歸檔。它稱為 PDF/A。在本質上,PDF/A 保留了文件當中可以被列印的每樣東西,卻同時將某些在短期之內或許相當有用,但是就長期而言卻不確定的功能排除在外。例如,此心格時不允許嵌入連結到外部應用程式,因為那些程式可能遭到淘汰,而且它也不允許密碼,因為在未來可能會忘記。"它全都是為了要能創造一個可靠的呈現," Melonie Warfel,Adobe 的世界標準主管表示。Adobe 現在也正在開發工程文件與數位影像的歸檔標準。

即使歷史是一份指南 -- 而那,畢竟是所保留歷史的一點 -- 我們知道未來將提供我們無法想像,以不同方式操作數位資訊的方法。目前的手法不過是繼續讓大家保持前進,而不要留下太多東西在過去。

"那已經超越了 '重要記錄' 這種概念 -- 那已經變成對我們而言是很重要的事," Warfel 說,她是兩位孩子的媽。"我媽有個裝滿照片的鞋盒,但我們不在這麼做。我有裝滿照片的硬碟。"


* 好公民不助長非法拷貝 -- 請停止散佈 .doc 檔
http://www.cyut.edu.tw/~ckhung/a/c041.php

* PDF/A, PDF for Long-term Preservation
http://www.digitalpreservation.gov/formats/fdd/fdd000125.shtml

* PREMIS: PREservation Metadata Implementation Strategies [OCLC - Projects]
http://www.oclc.org/asiapacific/zhtw/research/projects/pmwg/


掃描全世界的書!
史上最大圖書館 Google 化夢想為行動
Google 線上書庫 微軟雅虎踢館
國家圖書館將設歐盟資訊中心
英國千年史 盡在國家檔案中心
台灣數位典藏創意產業紐約展出研發成果
早期臺灣史料 數位檔案上網
數位典藏 文史瀚海任挖寶
數位典藏計畫 下個五年怎麼走?

微軟 PDF-killer XPS 將朝標準邁進
微軟 Office 12 將支援原生 PDF
Open Document通過成為國際標準
微軟展示 JPEG 的競爭對手

數位出版 我落後了
「無紙化」閱讀 面臨關鍵障礙

繁體中文字碼發展史

國內中文字碼之發展

http://www.math.ncu.edu.tw/~shann/Chinese/bbs97.html

這是 rux@cis_nctu (亦驢) 在 交大資科_BBS (Wed May 28 20:55:57 1997) 張貼的文告,抄錄於此,以免遺失。原文是純文字檔案,我將它稍事編輯,成為網頁。

我國最早之中文字碼為民國六十九年提出之「中文資訊交換碼」 (Chinese Character Code for Information Interchange, CCCII)。訂定此碼的原動力是美國急需使用電腦處理東亞語文資料,因此派遣負責人赴東亞考察。當時只有日本訂定資訊碼標準 JIS C 6226 。在「只此一家,別無分號」的情況下,美方初步決定採用此標準。我華裔美國亞東圖書館代表與我國代表極力反對,說明日本漢字無法代表中國文字的理由,並允諾四個月之後提出我方之標準。

我方代表返國之後,上書政務委員李國鼎及國科會、中美會等單位,集合國內一批文字學家、圖書館學家、以及電腦學者,組成臨時性質之任務編組:國字整理小組。經過謹慎考察、研究,一套涵蓋中日韓各國語文、以及繁體、簡體、異體等等之「中文資訊交換碼」出爐了。此碼終為美方接受為處理中日韓資料之正規標準。至今仍有許多圖書館系統採用,因為只有此碼才能擔當這個重任。

CCCII 在國外受到歡迎,在國內卻遭受排擠。有心人士或是想在歷史留名;或是自認官大學問大。用盡各種方法打擊 CCCII,並玩起編碼遊戲。這個遊戲,為咱們中文字碼的悲劇「萬碼奔騰」揭開了序幕。我想這個編碼遊戲,至少讓國內的資訊工業停滯五年。

下列兩本書,詳細記載了這一段歷史,以及 CCCII 的技術資料。在本文之後,我從第二本書抄錄一個章節,供無法借到這兩本書的網友參考。打這篇文章的目的,一方面是前一陣子有許多網友詢問到 CCCII;另一方面,讓網友瞭解現在我們使用的中文內碼的訂定過程是如何草率。

一、書名:中文字碼:萬碼奔騰,一碼當先作者:黃大一出版:永麒科技

二、書名:國字整理小組十年作者:謝清俊、黃克東出版:資訊應用國字整理小組

以下文章摘錄自「國字整理小組十年」p15-p18

四、國內外局勢之發展

(一)國內中文字碼之發展

國內有識之士早在民國六十六年起,就多次提起制訂中文字碼的事情。可惜當時由於國內沒有標準字形而受阻。此事在六十七年、六十八年之國建會及近代工程討論會中,亦曾討論,甚至有決議作成。然而終究因字形整理的問題而拖延著。至六十八年,教育部公佈了 4808 個常用字的標準字形後,編字碼的是才有一線希望。

中文資訊交換碼之所以能在六十九年三月發表,實拜教育部公佈標準常用字形之賜。然而,在當時,除上述之標準字形外,餘無標準字形。於是國字小組只得負擔起後續的工作,以期能在七十年將 CCCII 擴充到可實用的字數,並能符合國際上日益迫切之需求,來維護我們的傳統文字。

當民國六十九年三月中文資訊交換碼發表之事傳到國內以後,並未受到應有的重視和獎勵,反而引起了杯葛、謾罵、和各種侮辱的情形,此誠始料未及。

引起這種情況的主要原因是:在六十八年國建會的建議中,曾建議我國編中文字碼,而行政院將此案交主計處電子處理資料中心研究。因此,該單位獲知 CCCII 發表後,赫然震怒。認為國字小組破壞政府體制,此事應該由他們做才是。於是在民國六十九年五月,召開會議決定要另做一碼。當時國字小組有人出席該次會議,曾即席說明編制 CCCII 之原委,並說明 CCCII 發表時沒有作者,這純是為了國家,為了維護文字和文化先鋒。同時表示願和主計處電子處理資料中心合作或甚至交給他們繼續未完之工作,大家戮力一致對外。非常可惜的是此建議並未為主計處電子處理資料中心接受,反而一意孤行,非另做一碼不可。

為協調此爭執,有該年九月間在溪頭開的會議。在溪頭開的會議中,國字小組代表對編碼的作業有詳細的報告。在當時,國內翠於 ISO 資訊交換的相關標準之了解實在貧乏的可憐,與會人員不明白 ISO-646 及 ISO-2022 是做什麼的,因此對 CCCII 之編碼技術無法體認。當然也就不明白 CCCII 的長處了。國字小組之成員雖然全力說明,然而在主事人以政治手段解決技術問題的作法之下,以為再編一碼亦非難事,而且還可以平息爭端,斷然宣佈要再設計一碼作為解決之道,由此開啟了中文字碼十年混亂之情,迄今仍然遺禍社會無法解決。

經溪頭會議後,主計處電子處理資料中心邀王金土根據決議所編之碼為「中文資訊標準碼」,並於民國七十年發表 (記錄上是二月,而事實上到六月才完稿)。此碼完全不理會 ISO 之相關標準,獨斷專行,在碼的結構上主觀幼稚,在文字上則由個人任意挑選。當然,這種碼是不能用的,然而主事者並不相信,反而行文各單位要求採用。經過日本 NEC 及 FACOM 之技術人員在警政署強烈抗議之下,才明白此碼真不可用,只得偃旗息鼓自行收回。然而其耗費之公帑,即以印刷而言,上千本二吋厚之巨著就此報廢,更遑論其人力、物力,和時間之投入,合法之浪費莫以此為甚。

事實上,由此事件之教訓,主事者應該明白溪頭會議之錯誤,以及編碼是涉及計算機技術與我固有文字學之事,不是無知之輩想得那麼簡單。若是就此收兵,也就罷了。可嘆的是,在此過程中,主辦單位應用各報章媒體,造成許多打擊國字小組,對 CCCII 之技術成就惡意曲解,似是而非的謬論,一意認定他們自己是對的。當發現所編的王金土碼不能時,竟惱羞成怒,執意非再做一個碼不可。至此情形,已非理性之爭,而是以一己之私,一念之差,置國家社會利益不顧地孤行到底了。

於是主事者另起一灶,又行設計第二套碼,在民國七十一年七月發表,這碼名為「中文資訊標準交換碼」。然而,此碼並未完全做完,同年九月又補充附冊。這些碼雖然號稱採用 ISO-646 及 ISO-2022 標準,然而,又不真正認真執行,所以徒具虛名,且七月發表和九月補充的字碼均不同, (詳情請表一) 。當然此碼依然不能用!

雖然又失敗了,可是主事者巧言隱瞞事實,暗地裡再整旗鼓,又做一碼: 「通用漢字標準交換碼」並於民國七十二年十月發表。經過以前這許多失敗之經驗,又從 CCCII 學到不少技術,這一次充滿信心竟以國家標準為支柱,以行政命令強行推銷此碼,此舉已干犯到國家標準不是強制性質的原則了。

雖然此碼修正了許多過去之缺失,也越來越神似 CCCII,可是主事者所堅持的: 以一萬三千字為限的錯誤決定,仍然使得此碼窒礙難行。許多廠商為應付採購程序上非要用國家標準的箝制,在電腦中安置了此碼,然而實際上又不用。形成了可笑亦復可悲的瞞天過海的情形。這種情形不知造成了多少電腦資源上的浪費,對政府形象之傷害更是無以言喻!

之後,由於大家心裡明白此碼不可不用又不得不用的情況下,只好再造一碼,即「五大專案碼」之誕生。爾後,至民國七十五年「通用漢字標準交換碼」又更新一次版本,字碼又換一次,從民國七十年至七十五年之五年中,六次變易,世界上找不出這樣子做的「國家標準」。不僅這個過程無法統一字碼,為工業界造福,反而造成天下大亂,國內中文碼之亂,此實為罪魁禍首。

到今天,這個碼除了在個人電腦中可用以外,稍微大一些的系統都不夠用,它仍然是採購上必要而又無用的一個設備罷了。無論在台電,自來水、瓦斯、電信局、警政署、海關、外貿會、出版社、報社、財稅... 此碼的字均不夠用,更不必談到國家級的系統,像戶政、地政、財稅、圖書館等等系統了。

這麼多年來,主持通用中文標準交換碼的人員對中文資訊交換碼之攻擊和打擊不遺餘力,凡有中文資訊交換碼之廠商竟不敢明言,以免遭排擠。對通用中文標準碼以行政命令強制推行,若任何中文系統無此碼者則禁止公家機構採購。在標準法中明白說明國家標準無強制性,然而有關單位竟一意孤行。

在這麼惡劣的環境下,通用碼無法取得使用上之優勢,實在是該碼設計上缺陷累累 (見經建會民國七十七年九月製版之 "中共電腦業之發展及其對我之影響 P.173),否則以國家政令之力,豈有中文資訊交換碼活命之空間?

表一 中文標準碼自民國 70 年至 75 年歷年變遷簡表

名稱 中文資訊標準碼 中文資訊 標準交換碼 中文資訊 標準交換碼 (附冊) 通用漢字 標準交換碼 五大專案碼 通用漢字 標準交換碼
發表時間 70年二月 71年七月 71年九月 72年十月 73年三月 75年三月
發表單位 主計處 國科會 教育部 標準局 主計處 同左 同左 資策會 工業局 國科會 教育部 標準局 主計處
主持人 李克昌 何宜慈 何宜慈 何宜慈 果芸 何宜慈
承辦單位 行政院 主計處 電子資料 處理中心 同左 同左 同左 不詳 (十三家業者) 行政院 主計處 電子資料 處理中心
結構 2 8-bit bytes 二元碼 同左 同左 同左 同左 同左
字位 32,768 (奇數碼) 35,344 35,344 35,344 35,344 35,344
字構 16,000 字, 王金土 【辭海】中 任意選出 4,808 (常用字) 4,808 (常用字) 5,401 (4421-7D4B) 13,053 (30A1-FBE2) 5,401 常用字 7,652 次常用字 5,401 (4421-7D4B) 7,650 (2121-7244)
字序 1.總筆劃 2.部首 同左 1.部首 2.總筆劃 1.總筆劃 2.部首 同左 同左
ISO 完全不合 合 ISO-646 部份合 ISO-2022 同左 同左 同左 同左
獨一性 不合常用字一
涵蓋性 不合: 僅 32768 字位 不合: 總字4,808 同左 不合: 總字 13,053 同左 同左
擴充性 不合: 無法擴充 不合: 總字數35,344 同左 不合: 無法擴充 不合: 總字數35,344
試用 不能使用 主計處 自行收回 無人試用 業者字數 超過 8,000 同左 無業者採用 75年三月 宣佈放棄 多家採用 外來程式 有問題

中 華 民 國

031F 36AB 05C1 2730 4C50 6675 4E4A 5F54 4C26 712B 623B 535E 4463 615E 4661 594F 或 32F6 B1AE 39EF A138 A4A4 B5D8 A5C1 B0EA 4463 615E 4661 594F

亦驢註:想知道主計處編出來的第一套碼有多荒誕,可以看看上表最後一項。

「中華民國」的內碼為 031F 。在 ASCII 標準中 03、1F 都是控制碼。在以 ASCII 為主的電腦世界,這個字碼不是非常荒謬嗎?

亦驢人驢名亦驢(不可再驢下去) 成大電研計算機 rux@eembox.ncku.edu.tw


Created: Oct 4, 2000 Last Revised: Oct 4, 2000

* Mozilla 系列與 Big5 中文字碼 http://www.moztw.org/docs/big5/

* BIG5-2003 http://www.cns11643.gov.tw/web/big5/

* Unicode 補完計画 http://uao.cpatch.org/

* CP950 mapping table http://www.unicode.org/Public/MAPPINGS/VENDORS/MICSFT/WINDOWS/CP950.TXT

* UTF8 終端機 http://www.csie.ntu.edu.tw/%7Eb88062/i18n/utf8term.html

「俗體字」參考表 年底會訂出

創造繁體字價值!