跳到主要內容

CNS11643中文標準交換碼全字庫(簡稱全字庫)

資料集評分: 
平均 4.6 (276 人次投票)
資料集描述: 
zip壓縮檔,內容包含全字庫字型、屬性資料及中文碼對照表三部分,其中全字庫字型提供明體、正宋體及正楷體3種;屬性資料則涵蓋注音、倉頡、筆畫、部首、拼音、部件及筆順等7種;中文碼對照表則提供BIG5、Unicode、電信碼、地政自造字、財稅內碼、稅務碼及工商自造字等7種中文內碼對照。
主要欄位說明: 
資料下載網址: 
ZIP 檢視資料全字庫資料集,108年8月13日更新
資料資源欄位: 
檔案格式: 
ZIP
編碼格式: 
N/A
資料量: 
0
資料資源描述: 
全字庫資料集,108年8月13日更新
資料資源更新時間: 
2019/08/13 18:54
CSV 檢視資料全字庫資料集的目錄檔案列表
資料資源欄位: 
名稱、所屬、類別、說明
檔案格式: 
CSV
編碼格式: 
BIG5
資料量: 
65
資料資源描述: 
全字庫資料集的目錄檔案列表
資料資源更新時間: 
2019/02/13 10:02

經本平臺品質檢測後符合表格化資料之資料資源將會轉為CSV、XLSX、ODS、XML、JSON檔案格式,若所轉出之資料內容與機關所提供之原始資料有所出入,請以機關所提供之原始資料為主。

提供機關: 
提供機關聯絡人姓名: 
黃先生 (02-23165300#6822)
更新頻率: 
不定期
授權方式: 
政府資料開放授權條款-第1版
計費方式: 
免費
上架日期: 
2015/02/01
資料集類型: 
原始資料
詮釋資料更新時間: 
2019/08/14 10:04
主題分類: 
政府統計
服務分類: 
資料集分類: 
開放資料
備註: 

授權說明網址: http://data.gov.tw/license
如有關全字庫網站問題,請參考 http://www.cns11643.gov.tw/AIDB/service_consulting.do 網頁,歡迎來信: cnscode@ndc.gov.tw至 客服信箱或來電:(02)2598-7557轉217 洽詢,我們將為您解答。

活化應用: 

中華民國臺灣正體中文注音和國音二式輸入法表格檔

創作者: 
Ian Ho
摘要: 

中華民國臺灣正體中文輸入法表格檔,有「國語注音符號」、「國語注音符號第二式」兩種輸入模式。支援OpenVanilla for MacOSX、gcin for Linux兩種輸入法框架。
來源網址:https://sites.google.com/site/ianho7979/InputMethodTables

瀏覽次數: 249831 下載次數: 41513 意見數: 173 品質檢測金標章

回應

在全字庫頁面注音查詢輸入「˙ㄅㄞ」「可以找到」「㗑」,但是「㗑」這個字的頁面列表內卻「沒有」「˙ㄅㄞ」這組發音,CNS_phonetic.txt 查詢"14-5F2B"「也沒有」找到「˙ㄅㄞ」這組發音。
另外在中研院的國際電腦漢字及異體字知識庫
http://chardb.iis.sinica.edu.tw/char/469
則發現「㗑」有對應「˙ㄅㄞ」,而「沒有」對應到全字庫的「ㄅㄞ」。
到底誰才是對的?
國家單位的國語發音資料庫可以不以互相橋一橋,一致化,不要多頭馬車各自為政!

感謝您的留言。
關於您所提「㗑」資料連結不正確問題,已依據教育部異體字字典「㗑」之正字為【唄】,已修正其發音為 「ㄅㄞˋ」及「.ㄅㄟ」。
感謝您的建議。
祝 安康 中文標準交換碼全字庫小組 敬上

「𣩀」右上角部件 明體/楷體 是左上右下的點畫、宋體是右上左下的撇畫,到底誰才是對的?
unicode:23A40/CNS:10-5470
https://www.cns11643.gov.tw/wordView.jsp?ID=676976
另請全字庫自發性檢查所有包含「戶」部件的字,有無撇畫或點畫不一致的問題!「戶」部件上方的撇畫或點畫不一致的問題已經反應過不只一次了,請公家機關不要老是反應一個才去改一個,請主動清查所有包含「戶」部件的字。
也請不要再用:
---
關於您提到的字形,由於不同字體間所呈現之風格特性,在不影響其字義及字形判讀原則下,各字體間之筆形容或有細小差異。
---
這種類型的理由了。就是影響到字形判讀了,民眾才會留言反應問題。

您好:
感謝您的留言。
您所提「𣩀」右上角部件明體/楷體、宋體筆畫不一致問題已完成修正。
感謝您的建議。
祝 安康 中文標準交換碼全字庫小組 敬上

「迟」字的「尺」和點沒有斷開,字形顯得非常奇怪,不美觀。

謝謝您的留言。
全字庫正編碼是依經濟部標準檢驗局公布之CNS11643中文標準交換碼實作,即依該局所公布之資料為準。
您所提的「迟」字修正建議,經查與公佈標準的字形、字碼(CNS 15-286E)一致
再次感謝您的建議。
祝 安康 中文標準交換碼全字庫小組 敬上

字形是一致不錯,但不是說不影響字形架構的原則下,筆畫容有些許差異嗎?「迟」的「尺」不斷開真的不好看,就不能改改?

關於先前所提「鉛」、「桜」、「読」等字錯誤應盡快修正。另外看到又有人提到「彝」上方部件錯誤,我想你們一直都沒理解,是說教育部規定的標準字體「彝」上為「彐」,教科書及《異體字字典》都是從「彐」,建議親自至《異體字字典》與《國字標準字體楷書母稿》查詢。

在近二十年受過國民教育的人自教科書中所學的「彝」字,上部都是從「彐」而非「彑」,應該更正。

謝謝您的留言。
關於您提的字型問題,全字庫小組會檢視其字型來源再行規劃。
全字庫正編碼是依經濟部標準檢驗局公布之CNS11643中文標準交換碼實作,即依該局所公布之資料為準。
您所提的全字庫「彝」上方部件錯誤,經查與公佈標準的字形、字碼(CNS 3-5764)一致;育部規定的標準字體「彞」亦與公佈標準的字形、字碼(CNS 1-7641)一致
再次感謝您的建議。
祝 安康 中文標準交換碼全字庫小組 敬上

教育部上從「彐」的「彝」字應該也要是CNS 3-5764,建議查詢《異體字字典》、《重編國語辭典修訂本》,都是使用CNS 3-5764,以此為正字。

很明顯這是兩個字碼的字形相反了,教育部與經濟部標準檢驗局都是國家政府機關,標準不能一國三公,如果不能統一規範,國民習字、識字要如何適從?請協助詢問,使兩套標準合而為一!