跳到主要內容

CNS11643中文標準交換碼全字庫(簡稱全字庫)

資料集評分: 
平均 4.6 (284 人次投票)
資料集描述: 
zip壓縮檔,內容包含全字庫字型、屬性資料及中文碼對照表三部分,其中全字庫字型提供明體、正宋體及正楷體3種;屬性資料則涵蓋注音、倉頡、筆畫、部首、拼音、部件及筆順等7種;中文碼對照表則提供BIG5、Unicode、電信碼、地政自造字、財稅內碼、稅務碼及工商自造字等7種中文內碼對照。
主要欄位說明: 
資料下載網址: 
ZIP 檢視資料全字庫資料集,108年11月29日更新
資料資源欄位: 
檔案格式: 
ZIP
編碼格式: 
N/A
資料量: 
0
資料資源描述: 
全字庫資料集,108年11月29日更新
資料資源更新時間: 
2019/11/29 14:36
CSV 檢視資料全字庫資料集的目錄檔案列表
資料資源欄位: 
名稱、所屬、類別、說明
檔案格式: 
CSV
編碼格式: 
BIG5
資料量: 
65
資料資源描述: 
全字庫資料集的目錄檔案列表
資料資源更新時間: 
2019/11/26 13:51

經本平臺品質檢測後符合表格化資料之資料資源將會轉為CSV、XLSX、ODS、XML、JSON檔案格式,若所轉出之資料內容與機關所提供之原始資料有所出入,請以機關所提供之原始資料為主。

提供機關: 
提供機關聯絡人姓名: 
黃先生 (02-23165300#6822)
更新頻率: 
不定期
授權方式: 
政府資料開放授權條款-第1版
計費方式: 
免費
上架日期: 
2015/02/01
資料集類型: 
原始資料
詮釋資料更新時間: 
2019/12/11 13:10
主題分類: 
政府統計
服務分類: 
資料集分類: 
開放資料
備註: 

授權說明網址: https://data.gov.tw/license
如有關全字庫網站問題,請參考 https://www.cns11643.gov.tw/AIDB/service_consulting.do 網頁,歡迎來信: cnscode@ndc.gov.tw至 客服信箱或來電:(02)2598-7557轉217 洽詢,我們將為您解答。

活化應用: 

中華民國臺灣正體中文注音和國音二式輸入法表格檔

創作者: 
Ian Ho
摘要: 

中華民國臺灣正體中文輸入法表格檔,有「國語注音符號」、「國語注音符號第二式」兩種輸入模式。支援OpenVanilla for MacOSX、gcin for Linux兩種輸入法框架。
來源網址:https://sites.google.com/site/ianho7979/InputMethodTables

瀏覽次數: 267315 下載次數: 48498 意見數: 218 品質檢測金標章

回應

CNS:14-4D28 / Unicode:8864/「衤」,全字庫明體右側的兩點畫都是分別的點畫終端連到中間的豎槓上,但是全字庫宋體/楷體卻是上點畫先連到下點畫,下點畫再連到中間的豎槓上。全字庫明體、全字庫宋體/楷體,到底哪一個才是對的?

您好:
感謝您的留言。
全字庫資料集提供明、楷及宋體等字型,由於不同字體呈現之特性,在不影響其字義及字形判讀原則下,各字體間之筆形容或有細微差異,敬請諒查。
再次感謝您的留言。
祝 安康 中文標準交換碼全字庫小組 敬上

CNS_pinyin.txt 第三個欄位:注音第二式(zuin2) 2019年02月18日版本
「ㄨㄥ」 系列組合應為"weng",全字庫錯拼為"wng"。
很久以前就反應過了,全字庫一直還是沒有修正。
參考資料:
https://language.moe.gov.tw/001/Upload/files/site_content/M0001/er/cmain.htm?open

您好:
感謝您的留言。
您所提CNS_pinyin.txt 拼音錯誤已完成修正。
感謝您的建議。
祝 安康 中文標準交換碼全字庫小組 敬上

全字庫正宋體和正楷體的「飠」unicode:98E0,「中間一橫」的筆畫不一樣。一個右側有連住、一個右側有斷開,到底哪一個才是對的?若其中一個是錯的,請修正筆畫。
---
下載的包裹檔內容明明有更新到2019年一月份,為什麼 詮釋資料更新時間/資料資源更新時間 都還在2018/10/02 ?已經反應過,資料更新時間標示也要跟著更新,但 www.cns11643.gov.tw/data.gov.tw 都一直拖延。
---
https://www.cns11643.gov.tw/search.jsp?ID=10
之前已經反應過 部首查詢 簡化字的「飠」(其他簡化字部首也一樣)應該擺在第二個或之後,正體字的變體部首應該擺在第一個或優先顯示(正體字的變體部首「飠」出現的字數還是比較多的)。怎麼現在又變回簡化字的部首變體先出現了?
---
為什麼下載包裹檔裡頭的語音檔只有1411組發音?全字庫網站上的語音檔估算應該至少有1644組以上的發音才是。請把缺漏的所有全字庫語音檔補齊。並請使用「國語注音符號第二式」作為參考檔名。
---

您好:
關於全字庫資料集楷體字型檔中,CNS 14-5361(unicode 98E0)字型於本次(3月4日)更新完成修改。
祝 安康 中文標準交換碼全字庫小組 敬上

「CNS 14-5361(unicode 98E0)字型於本次(4月3日)更新完成修改。」
更新進度居然超前了一個月!!!???

您好:
感謝您的留言。
一、關於全字庫CNS 14-5361(unicode 98E0)楷體顯示已完成修改。
二、目前提供下載資料之更新日期可參下載資料檔案內於「資料更新說明.txt」。
三、全字庫網站「部首索引」已做調整;部首變體部分,主要依筆畫數少至多列示,且不提供簡體字的部首參考。
四、目前提供下載之語音檔以全字庫現存且有注音字碼之語音檔,不足部份正刻錄製。另音檔檔名部分,參考教育部「中文譯音使用原則」,中文譯音採以漢語拼音為主,現行教育部電子辭典網站,如《重編國語辭典修訂本》、《異體字字典》、《常用國字標準字體筆順學習網》等亦提供「漢語拼音」,因此全字庫網站提供的檔名仍以「漢語拼音」為主。
再次感謝您的留言。
祝 安康 中文標準交換碼全字庫小組 敬上

字型是否能採用較適合字型的 SIL Open Font License (OFL) 授權?

SIL Open Font License (OFL): https://scripts.sil.org/OFL

您好:
感謝您的留言。
依據「行政院及所屬各機關政府資料分類及授權利用收費原則」之資料類型區分,全字庫字型係為甲類資料,開放於政府資料開放平臺提供民眾免費使用下載,並統一使用政府資料開放平臺之授權條款(授權條款網頁請參考:https://data.gov.tw/license),如有授權條款疑義可洽詢平臺。
再次感謝您的留言。
祝 安康 中文標準交換碼全字庫小組 敬上