跳到主要內容

CNS11643中文標準交換碼全字庫(簡稱全字庫)

資料集評分: 
平均 4.6 (276 人次投票)
資料集描述: 
zip壓縮檔,內容包含全字庫字型、屬性資料及中文碼對照表三部分,其中全字庫字型提供明體、正宋體及正楷體3種;屬性資料則涵蓋注音、倉頡、筆畫、部首、拼音、部件及筆順等7種;中文碼對照表則提供BIG5、Unicode、電信碼、地政自造字、財稅內碼、稅務碼及工商自造字等7種中文內碼對照。
主要欄位說明: 
資料下載網址: 
ZIP 檢視資料全字庫資料集,108年8月13日更新
資料資源欄位: 
檔案格式: 
ZIP
編碼格式: 
N/A
資料量: 
0
資料資源描述: 
全字庫資料集,108年8月13日更新
資料資源更新時間: 
2019/08/13 18:54
CSV 檢視資料全字庫資料集的目錄檔案列表
資料資源欄位: 
名稱、所屬、類別、說明
檔案格式: 
CSV
編碼格式: 
BIG5
資料量: 
65
資料資源描述: 
全字庫資料集的目錄檔案列表
資料資源更新時間: 
2019/02/13 10:02

經本平臺品質檢測後符合表格化資料之資料資源將會轉為CSV、XLSX、ODS、XML、JSON檔案格式,若所轉出之資料內容與機關所提供之原始資料有所出入,請以機關所提供之原始資料為主。

提供機關: 
提供機關聯絡人姓名: 
黃先生 (02-23165300#6822)
更新頻率: 
不定期
授權方式: 
政府資料開放授權條款-第1版
計費方式: 
免費
上架日期: 
2015/02/01
資料集類型: 
原始資料
詮釋資料更新時間: 
2019/08/14 10:04
主題分類: 
政府統計
服務分類: 
資料集分類: 
開放資料
備註: 

授權說明網址: http://data.gov.tw/license
如有關全字庫網站問題,請參考 http://www.cns11643.gov.tw/AIDB/service_consulting.do 網頁,歡迎來信: cnscode@ndc.gov.tw至 客服信箱或來電:(02)2598-7557轉217 洽詢,我們將為您解答。

活化應用: 

中華民國臺灣正體中文注音和國音二式輸入法表格檔

創作者: 
Ian Ho
摘要: 

中華民國臺灣正體中文輸入法表格檔,有「國語注音符號」、「國語注音符號第二式」兩種輸入模式。支援OpenVanilla for MacOSX、gcin for Linux兩種輸入法框架。
來源網址:https://sites.google.com/site/ianho7979/InputMethodTables

瀏覽次數: 250734 下載次數: 41848 意見數: 175 品質檢測金標章

回應

感謝您的留言。
關於您提到的字形,依據教育部公告的「國字標準字體<教師手冊>」,關於「心」作左偏旁時,作「忄」形,中豎不鉤 (https://language.moe.gov.tw/001/Upload/files/SITE_CONTENT/M0001/STD/f26.htm?open)。由於不同字體間所呈現之風格特性,在不影響其字義及字形判讀原則下,各字體間之筆形有細小差異。
感謝您的建議。
祝 安康 中文標準交換碼全字庫小組 敬上

我反應的問題是中間豎槓和右側點畫有黏起來和斷開兩種情境的問題,跟教師手冊的「中豎不鉤 」,沒有關係,是兩回事,請不要顧左右而言他,而教育部的豎心旁範本看來是黏在一起的,教育部和全字庫到底誰才是對的?一個國家兩套標準多頭馬車各自為政?

關於「忄」 (豎心旁)之右側點畫,依據教育部公告的「國字標準字體<教師手冊>」,並未予以規範。
感謝您的建議。
祝 安康 中文標準交換碼全字庫小組 敬上

教師手冊就都已經把豎心旁部件樣貌擺在哪邊了,全字庫本身的豎心旁部件也都跟教育部的樣貌長一樣。偏偏全字庫的unicode:5FC4「忄」的豎心旁就硬要長不一樣,明顯的樣貌差異。就是硬要一個國家兩套標準多頭馬車各自為政就是了!?

unicode:6236「戶」的明體、楷體、宋體上方「撇畫」都是右上左下。
unicode:2F3E「⼾」的明體上方「撇畫」是右上左下,楷體、宋體上方「點畫」則是左上右下!
unicode:2F3E「⼾」上方三種字體筆畫差了九十度,到底誰才是對的?

您好:
感謝您的留言。
您所提全字庫「⼾」的筆順不一致問題已完成修正。
感謝您的建議。
祝 安康 中文標準交換碼全字庫小組 敬上

注音符號聲調ˊˇˋ應該上移,根據《國語注音符號手冊》:「標注在字音最後一個符號右上角。」

感謝您的留言。
您所提的3個注音符號調號:[ˊ]( 1-256E/U+02CA)、[ˇ]( 1-256F/U+02C7)、[ˋ]( 1-2570/U+02CB),經查與經濟部標準檢驗局公布之《CNS11643中文標準交換碼》字型一致,關於聲調符號位置我們將與該局查證,視需要修改 。
再次感謝您的建議。

CNS的國家標準將符號與文字分開,例如「一」作為符號時,CNS碼為1-2721,而作為文字時,CNS碼為1-4421。
同樣的,國際標準Unicode碼也將符號與文字分開,同樣舉例「一」作為符號時,Unicode碼為2F00,而作為文字時,Unicode碼為4E00。
由此產生一個問題,兙、兡、兛、嗧、糎、兞、兝、兣、瓩等字在CNS的國家標準內被分類為符號,在Unicode碼卻被分在文字區。
此案例來看,這九個字是否該加收至CNS的文字區?或是否應該判定為文字?

您提到的9個單位符號,CNS碼為1-2279至1-2323列為單位符號,於Unicode文字區,與我國字型來源對應。由於字形提交 Unicode組織會議係經濟部標準檢驗局權責,我們將與該局反映。
感謝您的建議。如後續有關網站問題,請參考 http://www.cns11643.gov.tw/AIDB/service_consulting.do 網頁,歡迎以電子郵件: cnscode@ndc.gov.tw至 客服信箱或電話:(02)2598-7557轉217 洽詢。
再次感謝您的留言。
祝 安康 中文標準交換碼全字庫小組 敬上