跳到主要內容

CNS11643中文標準交換碼全字庫(簡稱全字庫)

資料集評分: 
平均 4.6 (276 人次投票)
資料集描述: 
zip壓縮檔,內容包含全字庫字型、屬性資料及中文碼對照表三部分,其中全字庫字型提供明體、正宋體及正楷體3種;屬性資料則涵蓋注音、倉頡、筆畫、部首、拼音、部件及筆順等7種;中文碼對照表則提供BIG5、Unicode、電信碼、地政自造字、財稅內碼、稅務碼及工商自造字等7種中文內碼對照。
主要欄位說明: 
資料下載網址: 
ZIP 檢視資料全字庫資料集,108年8月13日更新
資料資源欄位: 
檔案格式: 
ZIP
編碼格式: 
N/A
資料量: 
0
資料資源描述: 
全字庫資料集,108年8月13日更新
資料資源更新時間: 
2019/08/13 18:54
CSV 檢視資料全字庫資料集的目錄檔案列表
資料資源欄位: 
名稱、所屬、類別、說明
檔案格式: 
CSV
編碼格式: 
BIG5
資料量: 
65
資料資源描述: 
全字庫資料集的目錄檔案列表
資料資源更新時間: 
2019/02/13 10:02

經本平臺品質檢測後符合表格化資料之資料資源將會轉為CSV、XLSX、ODS、XML、JSON檔案格式,若所轉出之資料內容與機關所提供之原始資料有所出入,請以機關所提供之原始資料為主。

提供機關: 
提供機關聯絡人姓名: 
黃先生 (02-23165300#6822)
更新頻率: 
不定期
授權方式: 
政府資料開放授權條款-第1版
計費方式: 
免費
上架日期: 
2015/02/01
資料集類型: 
原始資料
詮釋資料更新時間: 
2019/08/14 10:04
主題分類: 
政府統計
服務分類: 
資料集分類: 
開放資料
備註: 

授權說明網址: http://data.gov.tw/license
如有關全字庫網站問題,請參考 http://www.cns11643.gov.tw/AIDB/service_consulting.do 網頁,歡迎來信: cnscode@ndc.gov.tw至 客服信箱或來電:(02)2598-7557轉217 洽詢,我們將為您解答。

活化應用: 

中華民國臺灣正體中文注音和國音二式輸入法表格檔

創作者: 
Ian Ho
摘要: 

中華民國臺灣正體中文輸入法表格檔,有「國語注音符號」、「國語注音符號第二式」兩種輸入模式。支援OpenVanilla for MacOSX、gcin for Linux兩種輸入法框架。
來源網址:https://sites.google.com/site/ianho7979/InputMethodTables

瀏覽次數: 250633 下載次數: 41810 意見數: 175 品質檢測金標章

回應

教育部上從「彐」的「彝」字應該也要是CNS 3-5764,建議查詢《異體字字典》、《重編國語辭典修訂本》,都是使用CNS 3-5764,以此為正字。

很明顯這是兩個字碼的字形相反了,教育部與經濟部標準檢驗局都是國家政府機關,標準不能一國三公,如果不能統一規範,國民習字、識字要如何適從?請協助詢問,使兩套標準合而為一!

「彝」Unicode:5F5D,教育部標準楷書、教育部標準宋體UN的上方部件是「彐」。
全字庫明體、楷體、宋體的上方部件是「彑」,兩者寫法有明顯差異,到底誰才是對的?

感謝您的留言。
全字庫正編碼是依經濟部標準檢驗局公布之CNS11643中文標準交換碼實作,即依該局所公布之資料為準。
關於「彝」(CNS 3-5764)與公布之字形及Unicode(5F5D)收錄我國字形一致;「彞」(CNS 1-7641)與公布之字形及Unicode(5F5E)收錄我國字形一致,同時亦與「教育部4808個常用字下載」(https://ws.moe.edu.tw/001/Upload/6/relfile/6490/38921/d190213c-7af8-45bf-b70e-48b4469aad72.pdf)內容:01266/A01266/5f5e/彞(流水序/教育部字號/Unicode/常用字)一致。
您所提的「彝」Unicode:5F5D,教育部標準楷書、教育部標準宋體UN的上方部件是「彐」我們將再與教育部確認。
再次感謝您的建議。

我問的「只是」 Unicode:5F5D/CNS:3-5764 而已啊。
我並「沒有」問 Unicode:5F5E/CNS:1-7641。
然後「教育部4808個常用字下載PDF」本身就有「編輯上的瑕疵」,01266/A01266/5f5e/,該行的「國字」背後真正的碼位其實是"5F5D",公家機關做事實在是...唉... 公告文件之前都沒有在校稿嗎?
奢望公家機關能夠立即修正「教育部4808個常用字下載PDF」整份文件所有「編輯上的瑕疵」,並且在修正好重新上傳公告之後,回給我一封email。

關於所提「教育部4808個常用字下載PDF」整份文件所有「編輯上的瑕疵」事涉教育部權責,我們將與教育部反映。
感謝您的建議。
祝 安康 中文標準交換碼全字庫小組 敬上

「鉛」CNS:1-6745,全字庫明體、宋體右上角部件有斷開,楷體則是黏起來。
教育部標準楷書、教育部標準宋體UN則都是斷開。到底誰才是對的?

您好:
感謝您的留言。
您所提「鉛」的右上角部件筆畫不一致問題已完成修正。
感謝您的建議。
祝 安康 中文標準交換碼全字庫小組 敬上

中華民國教育部規範的國語注音符號第二式的四個聲調符號都是用英文字母帶有聲調符號的顯示方式,而非用數字。
現代的unicode也都已經有支援英文字母本身直接帶有聲調符號的碼位和有對應字形檔的存在。
而全字庫卻還在使用英文字母後接鍵盤數字鍵位的便宜行事方案。
請全字庫將各種拼音改回原本的英文字母本身直接帶有聲調符號的顯示方式。

感謝您的留言。
關於全字庫提供之拼音改以聲調符號顯示,因整理資料需時間辦理,所提問題將後續作為網站改善方案之一。
感謝您的建議。
祝 安康 中文標準交換碼全字庫小組 敬上

unicode:5FC4「忄」的明體、楷體「右側的點畫」和「中間的豎槓」是斷開的,宋體則是黏起來的。
CNS:1-3767「󶄂」明體、楷體、宋體「右側的點畫」和「中間的豎槓」都是黏起來的。
豎心旁「右側的點畫」和「中間的豎槓」到底是要「黏起來」還是「斷開」?到底誰才是對的?