跳到主要內容

CNS11643中文標準交換碼全字庫(簡稱全字庫)

資料集評分: 
平均 4.5 (325 人次投票)
資料集描述: 
zip壓縮檔,內容包含全字庫字型、屬性資料及中文碼對照表三部分,其中全字庫字型提供明體、正宋體及正楷體3種;屬性資料則涵蓋注音、倉頡、筆畫、部首、拼音、部件及筆順等7種;中文碼對照表則提供BIG5、Unicode、電信碼、地政自造字、財稅內碼、稅務碼及工商自造字等7種中文內碼對照。
主要欄位說明: 
資料下載網址: 
ZIP 檢視資料全字庫資料集,109年11月19日更新
資料資源欄位: 
檔案格式: 
ZIP
編碼格式: 
N/A
資料量: 
0
資料資源描述: 
全字庫資料集,109年11月19日更新
資料資源更新時間: 
2020/11/20 15:47
CSV 檢視資料全字庫資料集的目錄檔案列表
資料資源欄位: 
名稱、所屬、類別、說明
檔案格式: 
CSV
編碼格式: 
BIG5
資料量: 
65
資料資源描述: 
全字庫資料集的目錄檔案列表
資料資源更新時間: 
2019/11/26 13:51

以下連結為本平臺轉檔資料 (轉檔時間:2019/11/26 13:51),非即時資料, 請以機關原始連結為主。

提供機關: 
提供機關聯絡人姓名: 
黃先生 (02-23165300#6822)
更新頻率: 
不定期
授權方式: 
政府資料開放授權條款-第1版
計費方式: 
免費
上架日期: 
2015/02/01
資料集類型: 
原始資料
詮釋資料更新時間: 
2020/11/20 15:47
主題分類: 
政府統計
服務分類: 
資料集分類: 
開放資料
備註: 

授權說明網址: https://data.gov.tw/license
如有關全字庫網站問題,請參考 https://www.cns11643.gov.tw/AIDB/service_consulting.do 網頁,歡迎來信: cnscode@ndc.gov.tw至 客服信箱或來電:(02)2598-7557轉217 洽詢,我們將為您解答。

活化應用: 

中華民國臺灣正體中文注音和國音二式輸入法表格檔

創作者: 
Ian Ho
摘要: 

中華民國臺灣正體中文輸入法表格檔,有「國語注音符號」、「國語注音符號第二式」兩種輸入模式。支援OpenVanilla for MacOSX、gcin for Linux兩種輸入法框架。
來源網址:https://sites.google.com/site/ianho7979/InputMethodTables

瀏覽次數: 331381 下載次數: 72145 意見數: 314 品質檢測金標章

回應

回應: 
PMingLiu-ExtB,MingLiu-ExtB,MingLiU_HKSCS-ExtB,SimSun-ExtB。𢖬字皆爲匕聲。玉篇符彼切必。 全字庫參照康熙譌字,致誤書。請照玉篇正字,重寫爲匕。

回應: 
您好: 感謝您的留言。全字庫正編碼係實作經濟部標準檢驗局公布之《CNS11643中文標準交換碼》字形,您所提的CNS 5-216C之宋體形,經查與前述公布之字形一致。再次感謝您的建議。 祝 安康 全字庫客服小組 敬上

回應: 
𢿱全字庫从𣏟,左形𣏟肉,說文康熙正體。𢿨全字庫林月,从林如㪔。㪔隸从𣏟,又變成林,康熙正文从𣏟。 字庫混亂至極,究竟何據?

回應: 
您好: 感謝您的留言。 全字庫正編碼係實作經濟部標準檢驗局公布之《CNS11643中文標準交換碼》字形,經查您所提的2個字:CNS 7-2E47與前述公布之字形一致。另10-4C3D之楷體將盡快調整為與宋體一致。 感謝您的建議 祝 安康 中文標準交換碼全字庫小組 敬上

回應: 
散𢿱𢿨者,宋體𢿱正从肉,𢿨誤从月。楷體𢿱𢿨,皆誤从月。𢿱爲散正,𢿨爲𢿱正,請改錯誤正字。

回應: 
您好: 感謝您的留言。 全字庫正編碼係實作經濟部標準檢驗局公布之《CNS 11643中文標準交換碼》字形,經查您所提的2個字:CNS 7-2E47與前述公布之字形一致。另10-4C3D之楷體將盡快調整為與宋體一致。 感謝您的建議 祝 安康 中文標準交換碼全字庫小組 敬上

回應: 
從https://www.unicode.org/Public/MAPPINGS/OBSOLETE/EASTASIA/OTHER/BIG5.TXT,以及http://www.unicode.org/Public/MAPPINGS/VENDORS/MICSFT/WINDOWS/CP950.TXT等對照表中,big5 code : "C255"是對應到unicode "U+5F5D",顯然與全字庫網站上所查詢到的"U+5F5E"不同。 惠請協助釋疑,謝謝。

回應: 
您好: 感謝您的留言。 Unicode編碼之異動須提報Unicode組織進行討論及審查等過程,經濟部標準檢驗局每年有委託專家出席相關會議,相關問題我們將轉知並請協助處理。感謝您的建議。 祝 安康 中文標準交換碼全字庫小組 敬上

回應: 
您好: 感謝您的留言。 Unicode組織所依據Big5碼版本為CP950(微軟所使用版本),全字庫網站則是依據Big5-2003版本,此為2003年由經濟部標準檢驗局重整各業界版本之最新版本(詳細可見本網站「中文碼介紹」),其中碼位從A440至C67E是屬於常用字範圍,包括C255的「彞」字。該字是對應CNS 1-7641碼位,並依據Unicode所公告之碼本(https://www.unicode.org/charts/PDF/U4E00.pdf,第113頁),對應Unicode的5F5E碼位。而U+5F5D「彝」字之我國來源為CNS 3-5764,則是屬於罕用中文字範圍。 祝 安康 中文標準交換碼全字庫小組 敬上

回應: 
我在設計網頁時發現Chrome based的瀏覧器限制由CSS import的字型單檔大小< 30MB,否則無法使用,並在console顯示警告訊息: uncompressed length exceeds 30MB 由Chromium的原始碼也看得到此限制: https://chromium.googlesource.com/external/ots/+/v6.1.1/src/ots.cc 我目前解決方法是使用FontForge: https://fontforge.org 刪掉TW-Kai-98_1.ttf的CJK Unified Ideographs Extension A區字形,才能讓字型檔小於30MB,Chrome才可以使用。 請問貴資料集未來可否把A區的字形獨立出一個字型檔,其它過大的字型檔也可以用類似的分檔作法,讓每個字型檔的的大小< 30MB。