跳到主要內容

CNS11643中文標準交換碼全字庫(簡稱全字庫)

資料集評分: 
平均 4.6 (266 人次投票)
資料集描述: 
zip壓縮檔,內容包含全字庫字型、屬性資料及中文碼對照表三部分,其中全字庫字型提供明體、正宋體及正楷體3種;屬性資料則涵蓋注音、倉頡、筆畫、部首、拼音、部件及筆順等7種;中文碼對照表則提供BIG5、Unicode、電信碼、地政自造字、財稅內碼、稅務碼及工商自造字等7種中文內碼對照。
主要欄位說明: 
資料下載網址: 
ZIP 檢視資料全字庫資料集,108年6月21日更新
資料資源欄位: 
檔案格式: 
ZIP
編碼格式: 
N/A
資料量: 
0
資料資源描述: 
全字庫資料集,108年6月21日更新
資料資源更新時間: 
2019/06/25 02:52
CSV 檢視資料全字庫資料集的目錄檔案列表
資料資源欄位: 
名稱、所屬、類別、說明
檔案格式: 
CSV
編碼格式: 
BIG5
資料量: 
65
資料資源描述: 
全字庫資料集的目錄檔案列表
資料資源更新時間: 
2019/02/13 10:02

經本平臺品質檢測後符合表格化資料之資料資源將會轉為CSV、XLSX、ODS、XML、JSON檔案格式,若所轉出之資料內容與機關所提供之原始資料有所出入,請以機關所提供之原始資料為主。

提供機關: 
提供機關聯絡人姓名: 
黃先生 (02-23165300#6822)
更新頻率: 
不定期
授權方式: 
政府資料開放授權條款-第1版
計費方式: 
免費
上架日期: 
2015/02/01
資料集類型: 
原始資料
詮釋資料更新時間: 
2019/06/25 09:21
主題分類: 
政府統計
服務分類: 
資料集分類: 
開放資料
備註: 

授權說明網址: http://data.gov.tw/license
如有關全字庫網站問題,請參考 http://www.cns11643.gov.tw/AIDB/service_consulting.do 網頁,歡迎來信: cnscode@ndc.gov.tw至 客服信箱或來電:(02)2598-7557轉217 洽詢,我們將為您解答。

活化應用: 

中華民國臺灣正體中文注音和國音二式輸入法表格檔

創作者: 
Ian Ho
摘要: 

中華民國臺灣正體中文輸入法表格檔,有「國語注音符號」、「國語注音符號第二式」兩種輸入模式。支援OpenVanilla for MacOSX、gcin for Linux兩種輸入法框架。
來源網址:https://sites.google.com/site/ianho7979/InputMethodTables

瀏覽次數: 236176 下載次數: 36912 意見數: 138 品質檢測金標章

回應

您好:
感謝您的留言。
全字庫資料集提供明、楷及宋體等字型,由於不同字體呈現之特性,在不影響其字義及字形判讀原則下,各字體間之筆形容或有細微差異,敬請諒查。
再次感謝您的留言。
祝 安康 中文標準交換碼全字庫小組 敬上

右上到左下,和左上到右下,至少差了「九十度」,已經不算是細微差異了。

您好:
感謝您的留言。
經查教育部未有CNS 14-4E38(Unicode 7CF9)字體標準規範,僅對「糸」字作偏旁時,下三筆改為三點,亦未規範下三點之方向。全字庫CNS 14-4E38之收錄來源為Unicode CJK Ext-A,其收錄各國字體之三點之方向亦不一致。另參考微軟之標楷體及新細明體下三點之方向亦有相同情形。故在不影響其字義及字形判讀原則下,各字體間之筆形容或有細微差異,敬請諒查。
再次感謝您的留言。
祝 安康 中文標準交換碼全字庫小組 敬上

CNS:14-4D28 / Unicode:8864/「衤」,全字庫明體右側的兩點畫都是分別的點畫終端連到中間的豎槓上,但是全字庫宋體/楷體卻是上點畫先連到下點畫,下點畫再連到中間的豎槓上。全字庫明體、全字庫宋體/楷體,到底哪一個才是對的?

您好:
感謝您的留言。
全字庫資料集提供明、楷及宋體等字型,由於不同字體呈現之特性,在不影響其字義及字形判讀原則下,各字體間之筆形容或有細微差異,敬請諒查。
再次感謝您的留言。
祝 安康 中文標準交換碼全字庫小組 敬上

CNS_pinyin.txt 第三個欄位:注音第二式(zuin2) 2019年02月18日版本
「ㄨㄥ」 系列組合應為"weng",全字庫錯拼為"wng"。
很久以前就反應過了,全字庫一直還是沒有修正。
參考資料:
https://language.moe.gov.tw/001/Upload/files/site_content/M0001/er/cmain.htm?open

您好:
感謝您的留言。
您所提CNS_pinyin.txt 拼音錯誤已完成修正。
感謝您的建議。
祝 安康 中文標準交換碼全字庫小組 敬上

全字庫正宋體和正楷體的「飠」unicode:98E0,「中間一橫」的筆畫不一樣。一個右側有連住、一個右側有斷開,到底哪一個才是對的?若其中一個是錯的,請修正筆畫。
---
下載的包裹檔內容明明有更新到2019年一月份,為什麼 詮釋資料更新時間/資料資源更新時間 都還在2018/10/02 ?已經反應過,資料更新時間標示也要跟著更新,但 www.cns11643.gov.tw/data.gov.tw 都一直拖延。
---
https://www.cns11643.gov.tw/search.jsp?ID=10
之前已經反應過 部首查詢 簡化字的「飠」(其他簡化字部首也一樣)應該擺在第二個或之後,正體字的變體部首應該擺在第一個或優先顯示(正體字的變體部首「飠」出現的字數還是比較多的)。怎麼現在又變回簡化字的部首變體先出現了?
---
為什麼下載包裹檔裡頭的語音檔只有1411組發音?全字庫網站上的語音檔估算應該至少有1644組以上的發音才是。請把缺漏的所有全字庫語音檔補齊。並請使用「國語注音符號第二式」作為參考檔名。
---

您好:
關於全字庫資料集楷體字型檔中,CNS 14-5361(unicode 98E0)字型於本次(3月4日)更新完成修改。
祝 安康 中文標準交換碼全字庫小組 敬上

「CNS 14-5361(unicode 98E0)字型於本次(4月3日)更新完成修改。」
更新進度居然超前了一個月!!!???