跳到主要內容

CNS11643中文標準交換碼全字庫(簡稱全字庫)

資料集評分: 
平均 4.5 (317 人次投票)
資料集描述: 
zip壓縮檔,內容包含全字庫字型、屬性資料及中文碼對照表三部分,其中全字庫字型提供明體、正宋體及正楷體3種;屬性資料則涵蓋注音、倉頡、筆畫、部首、拼音、部件及筆順等7種;中文碼對照表則提供BIG5、Unicode、電信碼、地政自造字、財稅內碼、稅務碼及工商自造字等7種中文內碼對照。
主要欄位說明: 
資料下載網址: 
ZIP 檢視資料全字庫資料集,109年10月16日更新
資料資源欄位: 
檔案格式: 
ZIP
編碼格式: 
N/A
資料量: 
0
資料資源描述: 
全字庫資料集,109年10月16日更新
資料資源更新時間: 
2020/10/16 14:36
CSV 檢視資料全字庫資料集的目錄檔案列表
資料資源欄位: 
名稱、所屬、類別、說明
檔案格式: 
CSV
編碼格式: 
BIG5
資料量: 
65
資料資源描述: 
全字庫資料集的目錄檔案列表
資料資源更新時間: 
2019/11/26 13:51

以下連結為本平臺轉檔資料 (轉檔時間:2019/11/26 13:51),非即時資料, 請以機關原始連結為主。

提供機關: 
提供機關聯絡人姓名: 
黃先生 (02-23165300#6822)
更新頻率: 
不定期
授權方式: 
政府資料開放授權條款-第1版
計費方式: 
免費
上架日期: 
2015/02/01
資料集類型: 
原始資料
詮釋資料更新時間: 
2020/10/16 14:36
主題分類: 
政府統計
服務分類: 
資料集分類: 
開放資料
備註: 

授權說明網址: https://data.gov.tw/license
如有關全字庫網站問題,請參考 https://www.cns11643.gov.tw/AIDB/service_consulting.do 網頁,歡迎來信: cnscode@ndc.gov.tw至 客服信箱或來電:(02)2598-7557轉217 洽詢,我們將為您解答。

活化應用: 

中華民國臺灣正體中文注音和國音二式輸入法表格檔

創作者: 
Ian Ho
摘要: 

中華民國臺灣正體中文輸入法表格檔,有「國語注音符號」、「國語注音符號第二式」兩種輸入模式。支援OpenVanilla for MacOSX、gcin for Linux兩種輸入法框架。
來源網址:https://sites.google.com/site/ianho7979/InputMethodTables

瀏覽次數: 323998 下載次數: 69637 意見數: 303 品質檢測金標章

回應

回應: 
您好: 感謝您的留言。關於您所提的全字庫對應Unicode 碼和 Unihan資料庫查到不一致的問題, 涉及我國字形來源與ISO/IEC 10646(UCS)編碼有關,我們將進行查證並轉知經濟部標準檢驗局研議,如有後續修正,將視結果一併調整。非常感謝您的建議。 祝 安康 中文標準交換碼全字庫小組 敬上

回應: 
* 3-275A 楷體與宋體字形不一致。與 11-706D 是否同形? * 11-6D2A 楷體與宋體字形不一致。與 2-3E50 是否同形? * 11-7070 明體與楷體、宋體字形不一致。與 2-3727 是否同形? * 3-322C 楷體與宋體字形不一致。與 11-7073 是否同形? * 14-5C66 宋體與明體、楷體字形不一致。

回應: 
您好: 感謝您的留言。目前全字庫刻正進行字形不一致查證工作,關於您所提到的不一致之字碼已在前述作業的清單內,後續將依查證結果視需要調整。感謝您的建議。 祝 安康 中文標準交換碼全字庫小組 敬上

回應: 
最近從 Unihan 下載的資料表發現許多字元(以 Ext-G 為主)已有對應的 kIRG_TSource,但查全字庫仍是編於暫用造字區。例如 U+3003A 據 Unihan 資料庫可查到對應 11-5B30,但查全字庫 11-5B30 仍編於造字區 U+FADFB。這些字是否可按 Unihan 資料庫全面轉移至 Unicode 正式編碼區?

回應: 
您好: 目前全字庫與Unicode字碼對應到 8.0版,而與Unicode最新版本的對應一直是全字庫的長期目標,惟Unicode版本異動頻繁,我們將持續投入人力及資源,進行資料清查及調整。 感謝您的建議。 祝 安康 中文標準交換碼全字庫小組

回應: 
例如在全字庫網站查詢 8-7523 會得到「8-7523 與 1-243E 同字形」,但此資料表完全無 8-7523 的記錄,無法查到對應的字元。 希望資料表也能提供所有被兼併字的對應表,感謝。

回應: 
您好: 感謝您的留言。現行資料集所提供資料以使用中的字碼資料為主,關於您所提到有關「被兼併字」的對應表,我們將作後續的整理與改善。 感謝您的建議。 祝 安康 中文標準交換碼全字庫小組 敬上

回應: 
全字庫三月底即回復「刻正進行明、楷、宋字型不一致清查作業,並召開專家學者會議進行討論後調整」,目前的進度到了哪裡?預計什麼時候能全部完成?如果有所進展希望能階段式上傳調整後版本,不必待全部調整完才上傳。

回應: 
您好: 感謝您的留言。 關於全字庫明、楷及宋字型不一致清查工作,有其作業程序,目前正在進行字形不一致查證工作。 謝謝您對工作進度的關心,並請耐心等候。 再次感謝您的建議。 祝 安康 中文標準交換碼全字庫小組 敬上

回應: 
Open_Data/Properties/CNS_phonetic.txt 將該文字最常見的注音排序到第一位 希望調整 CNS_phonetic 的注音順序 例如 '不' 讓 'ㄅㄨˋ' 排在第一位 這樣比較能幫助當使用此資料查詢注音時 能更容易地顯示常見注音