跳到主要內容

CNS11643中文標準交換碼全字庫(簡稱全字庫)

資料集評分: 
平均 4.6 (303 人次投票)
資料集描述: 
zip壓縮檔,內容包含全字庫字型、屬性資料及中文碼對照表三部分,其中全字庫字型提供明體、正宋體及正楷體3種;屬性資料則涵蓋注音、倉頡、筆畫、部首、拼音、部件及筆順等7種;中文碼對照表則提供BIG5、Unicode、電信碼、地政自造字、財稅內碼、稅務碼及工商自造字等7種中文內碼對照。
主要欄位說明: 
資料下載網址: 
ZIP 檢視資料全字庫資料集,109年5月13日更新
資料資源欄位: 
檔案格式: 
ZIP
編碼格式: 
N/A
資料量: 
0
資料資源描述: 
全字庫資料集,109年5月13日更新
資料資源更新時間: 
2020/05/13 17:51
CSV 檢視資料全字庫資料集的目錄檔案列表
資料資源欄位: 
名稱、所屬、類別、說明
檔案格式: 
CSV
編碼格式: 
BIG5
資料量: 
65
資料資源描述: 
全字庫資料集的目錄檔案列表
資料資源更新時間: 
2019/11/26 13:51

經本平臺品質檢測後符合表格化資料之資料資源將會轉為CSV、XLSX、ODS、XML、JSON檔案格式,若所轉出之資料內容與機關所提供之原始資料有所出入,請以機關所提供之原始資料為主。

提供機關: 
提供機關聯絡人姓名: 
黃先生 (02-23165300#6822)
更新頻率: 
不定期
授權方式: 
政府資料開放授權條款-第1版
計費方式: 
免費
上架日期: 
2015/02/01
資料集類型: 
原始資料
詮釋資料更新時間: 
2020/05/13 09:42
主題分類: 
政府統計
服務分類: 
資料集分類: 
開放資料
備註: 

授權說明網址: https://data.gov.tw/license
如有關全字庫網站問題,請參考 https://www.cns11643.gov.tw/AIDB/service_consulting.do 網頁,歡迎來信: cnscode@ndc.gov.tw至 客服信箱或來電:(02)2598-7557轉217 洽詢,我們將為您解答。

活化應用: 

中華民國臺灣正體中文注音和國音二式輸入法表格檔

創作者: 
Ian Ho
摘要: 

中華民國臺灣正體中文輸入法表格檔,有「國語注音符號」、「國語注音符號第二式」兩種輸入模式。支援OpenVanilla for MacOSX、gcin for Linux兩種輸入法框架。
來源網址:https://sites.google.com/site/ianho7979/InputMethodTables

瀏覽次數: 302766 下載次數: 61586 意見數: 268 品質檢測金標章

回應

回應: 
「斉」的相關漢字中,只有「斉」和「15-6D42」部件是「%,247,43,1,1」,其他都是「%,247,43,19」,請統一部件。另外10-7931分明就是「臍」的異體,應音ㄑㄧˊ;13-7223是「霽」,音ㄐㄧˋ;請一并修正。

回應: 
終於找到一個蒐羅一堆難字的字型了 希望能夠標準化~ 可以用在所有漢語地區的公部門與民營企業 感恩感恩

回應: 
有些字從全字庫查到的映射 Unicode 碼和 Unihan 資料庫查到的不一致,有些甚至相反。 例如:全字庫查到 2-4C61 映射 U+5284、14-656C 映射 U+7B9A;然而按 Unihan 資料庫(下載 13.0 版資料表),U+5284 的 TSource 為 14-656C、U+7B9A 的 TSource 為 2-4C61。 諸如此類的不一致還有很多,如以下所示。這造成我們無法據此做正確的編碼轉換。可否協助調查何者的映射數據才是正確的? 2-4C61: 全字庫映射Unicode=5284; 反查TSource=14-656C 14-656C: 全字庫映射Unicode=7B9A; 反查TSource=2-4C61 3-2623: 全字庫映射Unicode=5FF9; 反查TSource=5-2438 10-4336: 全字庫映射Unicode=225D6; 反查TSource=3-2623 3-653A: 全字庫映射Unicode=6BF5; 反查TSource=15-3C3C 15-3C3E: 全字庫映射Unicode=6BF6; 反查TSource=3-653A 4-684F: 全字庫映射Unicode=2FA16; 反查TSource=5-6F54 5-6F54: 全字庫映射Unicode=4D56; 反查TSource=4-684F 5-2D48: 全字庫映射Unicode=2F89B; 反查TSource=15-2F3E 15-2F3E: 全字庫映射Unicode=38E3; 反查TSource=5-2D48 5-7234: 全字庫映射Unicode=29984; 反查TSource=7-564E 7-564E: 全字庫映射Unicode=29974; 反查TSource=5-7234 4-216A: 全字庫映射Unicode=53FD; 反查TSource=11-5545 (映射至Unicode造字) 6-497E: 全字庫映射Unicode=440B; 反查TSource=5-3B50 (映射至Unicode造字) 10-3E37: 全字庫映射Unicode=21F2C; 反查TSource=5-4C6E (映射至Unicode造字) 10-6364: 全字庫映射Unicode=24C53; 反查TSource=5-2E6E (映射至Unicode造字) 14-5D48: 全字庫映射Unicode=841C; 反查TSource=14-5D58 (映射至Unicode造字) 14-5F2F: 全字庫映射Unicode=55B9; 反查TSource=14-5FAF (映射至Unicode造字) 15-3B6A: 全字庫映射Unicode=692C; 反查TSource=3-652E (映射至Unicode造字) 15-3C65: 全字庫映射Unicode=713F; 反查TSource=3-6552 (映射至Unicode造字) 15-5036: 全字庫映射Unicode=71B4; 反查TSource=3-655C (映射至Unicode造字) 15-517D: 全字庫映射Unicode=8786; 反查TSource=4-533C (映射至Unicode造字) 15-636A: 全字庫映射Unicode=27068; 反查TSource=15-6362 (映射至Unicode造字) 15-6559: 全字庫映射Unicode=7922; 反查TSource=3-6576 (映射至Unicode造字)

回應: 
您好: 感謝您的留言。關於您所提的全字庫對應Unicode 碼和 Unihan資料庫查到不一致的問題, 涉及我國字形來源與ISO/IEC 10646(UCS)編碼有關,我們將進行查證並轉知經濟部標準檢驗局研議,如有後續修正,將視結果一併調整。非常感謝您的建議。 祝 安康 中文標準交換碼全字庫小組 敬上

回應: 
* 3-275A 楷體與宋體字形不一致。與 11-706D 是否同形? * 11-6D2A 楷體與宋體字形不一致。與 2-3E50 是否同形? * 11-7070 明體與楷體、宋體字形不一致。與 2-3727 是否同形? * 3-322C 楷體與宋體字形不一致。與 11-7073 是否同形? * 14-5C66 宋體與明體、楷體字形不一致。

回應: 
您好: 感謝您的留言。目前全字庫刻正進行字形不一致查證工作,關於您所提到的不一致之字碼已在前述作業的清單內,後續將依查證結果視需要調整。感謝您的建議。 祝 安康 中文標準交換碼全字庫小組 敬上

回應: 
最近從 Unihan 下載的資料表發現許多字元(以 Ext-G 為主)已有對應的 kIRG_TSource,但查全字庫仍是編於暫用造字區。例如 U+3003A 據 Unihan 資料庫可查到對應 11-5B30,但查全字庫 11-5B30 仍編於造字區 U+FADFB。這些字是否可按 Unihan 資料庫全面轉移至 Unicode 正式編碼區?

回應: 
例如在全字庫網站查詢 8-7523 會得到「8-7523 與 1-243E 同字形」,但此資料表完全無 8-7523 的記錄,無法查到對應的字元。 希望資料表也能提供所有被兼併字的對應表,感謝。

回應: 
您好: 感謝您的留言。現行資料集所提供資料以使用中的字碼資料為主,關於您所提到有關「被兼併字」的對應表,我們將作後續的整理與改善。 感謝您的建議。 祝 安康 中文標準交換碼全字庫小組 敬上

回應: 
全字庫三月底即回復「刻正進行明、楷、宋字型不一致清查作業,並召開專家學者會議進行討論後調整」,目前的進度到了哪裡?預計什麼時候能全部完成?如果有所進展希望能階段式上傳調整後版本,不必待全部調整完才上傳。