跳转到内容

常用国字标准字体表

维基百科,自由的百科全书

中华民国教育部在1973年(民国62年)委托台湾师范大学国文研究所成立专案小组,负责研订国民常用字标准字体。经长期的研订和试用,在1982年(民国71年)正式启用《常用国字标准字体表》,共计收录4808个字[1][2]。在1996年(民国85年),教育部公布《常用国字标准字体笔顺手册》,用国字标准字体说明常用字的笔顺

教育部正字及异体字表

[编辑]

中华民国教育部颁布的国字标准字体以及异体字,如下[1]

  • 常用国字标准字体表,简称甲表ISBN 9789570906646,教育部于1978年5月印行,内附“教育部社会教育司委托国立台湾师范大学国文研究所研订常用国字及标准字体总报告”。收到各界意见修订后,委由正中书局于1979年6月出版,于1982年9月1日作为常用字字体标准正式启用,内收4808字。
  • 次常用国字标准字体表,简称乙表ISBN 9786660913003,于1982年10月印行,12月出版的次常用字和字体标准,内收6341字。1993年公布的《国字标准字体楷书母稿》中,次常用字为6343字。在最新版的《异体字字典》附录,次常用字更订为6329字[3]
  • 罕用国字标准字体表,简称丙表ISBN 9786660913010,于1983年10月印行,隔年4月出版的的罕用字和字体标准,内收18388字。在最新版的《异体字字典》附录,罕用字更订为18318字。
  • 异体国字字表,简称丁表,于1984年3月印行的异体字标准,内收异体18588字,补遗22字。在最新版的《异体字字典》附录,收异体字74381字。

教育部国家教育研究院负责维护的《异体字字典》附录收有〈正字表〉。该表依据教育部常用字、次常用字、罕用字三个标准字体表订定;遇有具独立音义而三字表未收之字形,则补收为新正字。联绵词为描摹语音而设,故有多种字形,其异形之用字,原则上均视为独立正字,除非文献明示正异关系或字构可见孳乳线索[4][5]。据《异体字字典》正式七版(2024年)所收正字编录,计收29920字。

研订方法

[编辑]

常用国字标准字体表(甲表)

[编辑]

1973年2月,由“国字整理小组”扩编的“常用国字编纂处”在林尹周何李鍌陈新雄李殿魁张文彬于大成王熙元胡自逢许锬辉黄永武黄庆萱等文字学学者的领导下,着手进行常用标准国字的整理工作。其收字及选字标准为,从中文大辞典编纂处 “总字表”(49905字)、师大国文研究所“常用字表”(2408字)及教育部“国民学校常用字汇表”(4864字)中,合并统计其总出现次数,再参酌各方意见修订而成[4][6][1][7]

  • 总字表:从《中文大辞典》、《辞源》等十五种参考工具书[注 1],调查所出现的字,最后再累计某一单字于此十五种出现的次数,作为选字的参考。
  • 常用字资料来源及其出现次数表:从“总字表”出现次较多之字挑选出7980字,结合“常用字表”,并合并“国民学校常用字汇表”[注 3]之字频统计。
  • 国民常用字调查表:以“常用字资料来源及其出现次数表”选定之7980字为基础,将“常用字表”与“国民学校常用字汇表”二者出现次的总和作为总出现次。依出现总次的高低排序,合并正俗字,选出其中最常用的4708字制成,此为初步统计结果。1978年(民国67年)教育部参酌各方意见将字表增订至4808字,定名为《常用国字标准字体表》。

次常用国字标准字体表(乙表)

[编辑]

编纂团队继续研订出次常用国字10740字。在参酌各方意见后,依使用频率,区分为《次常用国字标准字体表》(乙表)6341字(含单位词9字)以及《罕用字体表》(丙表)4399字。甲、乙、丙三表之异体字,则另立《异体字表》(丁表)来收纳,以便检索查找[4]

乙表的选字原则为:

罕用国字标准字体表(丙表)

[编辑]

编纂团队研议扩充《罕用字体表》,丙表从原本的4399字增加为18388字(若含附录字18字、补遗74字,则为18480字)[4]

《丙表》扩充之收字审定原则为:

  • 凡具有独立音义,不属于甲乙两表之异体字者。
  • 若为一字多体,以合于六书、出现时代较早或笔划较不繁琐者优先。
  • 凡属姓氏、化学元素名、地名、水名等专有名词,虽为他字之异体字,然以专有名词不能两通,故皆独立为罕用正字。
  • 复音词联绵字,两字并收,如:誩、𠮳𠮴。
  • 凡音义不全或构形难解之讹字,概不收入。

字元编码及字体电脑化

[编辑]

1980至1987年间,由中研院中美科学学术合作委员会与文建会(后升格为文化部)赞助的“资讯应用国字整理小组”发布《中文资讯交换码》,纳编53940个汉字,包括:正体常用字4808、正体备用字17032、异体常用备用字11517和正体罕用字20583[11]。正体常用字即为《常用国字标准字体表》的4808字[12]

1986年,中央标准局公布《通用汉字标准交换码》(后更名为《中文标准交换码》)纳编“常用及次常用字”,共计13051字,成为中文资讯处理交换码纳编字数的国家标准[1]。该标准的第一字面字集(5401字)编入《常用国字标准字体表》及常见的“国中小教科书常用字”,第二字面字集(7650字)编入《次常用国字标准字体表》及使用频率较高的“罕用国字”[13]。《中文标准交换码》日后陆续扩编,目前大约有96600多个汉字[14][15]。繁体中文资讯处理编码业界标准五大专案码则是以《通用汉字标准交换码》的前身“常用字码集”为蓝本而设计,于1983年12月推出[16]

教育部在公开招标评比后,于1991年委托华康科技公司制作《常用字表》及《次常用字表》等体的电脑母稿。1993年6月,教育部公布了《国字标准字体楷书母稿》及《国字标准字体宋体母稿》。隔年,教育部发布其电子字型档[1]。1998年公布《国字标准字体方体母稿》(方体指不含圆体的黑体)和《国字隶书母稿》。1999年公布《国字标准字体宋体母稿增补编》。

比较

[编辑]

中央标准局所公布的《通用汉字标准交换码》(后更名为《中文标准交换码》,CNS11643)与1984年发布的业界事实标准五大码 (Big5) 有些许共同之处:两者都使用国字标准字体表为基础,但是《中文标准交换码》所定义的码位更符合国字标准字体表所选定的字形。国字标准字体表本身并未定义字形的码位,而是依赖于其他标准将字形赋予码位。

其中,五大码与现在的《中文标准交换码》有部分收字差异:

五大码与《中文标准交换码》(CNS11643)的差异[17]
国字 字表序号[18] CNS11643 Big5收录异体 备注
U+5F5E彝 A01266 1-7641 C255,U+5F5D彝
U+53C4叁 B00287 3-3455 五大码未收录
U+564D噍 B00439 3-4B43 五大码未收录
U+36B7㚷 B00635 3-2847 五大码未收录
U+5B0E嬎 B00715 3-4B5F E955,U+5B14嬔 CNS11643 第二字面 2-565F 疑似误收 U+5B14嬔 字,但是显示为无点的 U+5B0E嬎
U+5C14尔 B00760 3-223F 五大码未收录
U+3BA3㮣 B01783 3-4167 五大码未收录
U+7934礴 B03027 2-662B F2A1,U+7921礡 疑似 Unicode 统合时错误对应到统合汉字 U+7921礡 上
U+7DF5緵 B03452 3-4E2B EDDB,U+7E4C繌 CNS11643 第二字面 2-5E48 疑似误收 U+7E4C繌 字
U+9638阸 B05531 4-2833 五大码未收录
U+9C0C䲡 B05989 3-5D76 五大码未收录

其他

[编辑]

2000年,教育部出版《国小学童常用字词调查报告书》[19],该研究透过对学童常用读物的字频和词频统计,调查出当时国小学生常用的5021字。该报告书后来编纂为《教育部常用字库辞典》,成为教育部识字量测验的数据库来源。

2012年,中华文化总会推出中华语文知识库,其“汉字源流汇编”收录常用汉字3000字,并依次列举甲骨文金文 战国文字小篆隶书楷书六种字体,说明汉字形体之演变[20]

2013年,教育部委托国家教育研究院推动“建置应用语料库及标准体系”的华语文教育计划。研究团队召开多次学者专家的咨询会议,又依据语料库的统计成果并征求资深华语文教师的意见,在2020年完成了“台湾华语文能力基准”的订定,作为非母语人士学习华语的能力指标及分级标准之凭据。该指标分为三等七级,其字表部分总计收录3100字[21]

2018年,国家教育研究院出版《九十九年常用语词调查报告书》和《一○○至一○四年常用语词调查报告书》,调查2010年至2015年采录语料的字频、词频,并和《常用国字标准字体表》加以比较。以2015年为例,其字频表采集到5289字,字频10以上的字数为3404字,而《常用国字标准字体表》未收录但字频达10以上之高频字,共计117字。另外,在2010年至2015年各年度的字频表中,字频10以上的字数,介于3269字至3410字之间。与教育部《常用国字标准字体表》比较,每年均出现而未收录于该表的高频单字有21 个[22]

标准、课纲和华语考试

[编辑]

根据教育部在1994年委托执行的“我国失学国民脱盲识字标准及脱盲识字字汇之研究”,台湾一般成人日常生活所需之基本字汇为2328字,基本字为1659字,次基本字为669字。凡解读日常生活基本字汇之能力在 470 个字以下者,列为“不识字”;能认 870 个字以上,而未达 1680 字者为“半识字”;能认 1680 字,并具有书写日常生活之简单应用文字能力者为“识字者”,可视为脱离文盲[23][24]

十二年国民基本教育课程纲要(108课纲)规定在第一学习阶段(国小 1-2 年级)认识常用国字至少 1000 字,使用 700 字。第二学习阶段(国小 3-4 年级)认识常用国字至少 1800 字,使用 1200 字。第三学习阶段(国小 5-6 年级)认识常用国字至少 2700 字,使用 2200 字。第四学习阶段(国中 7-9 年级)认识国字至少 4500 字,使用 3500 字。

华语文能力测验所参照的台湾华语文能力基准(TBCL),是为外国人学习华语所制定,规定基础(1-3级)要了解246~801个汉字,进阶(4-5级)要了解1300~1900个汉字,精熟(6-7级)要了解2500~3100个汉字。

注释

[编辑]
  1. ^
    1. (总字):中文大辞典,中国文化研究所。
    2. (常用字):日本基本汉字,三省堂。国民学校常用字,国立编译馆。教育部常用汉字表,教育部。
    3. (字源):古代汉语,泰顺书局。角川常用汉字字源,角川书局。甲骨文字集释,中央研究院。金文正续编,联贯出版社。
    4. (通行字):辞源,商务印书馆。辞海,中华书局。国语辞典,商务印书馆。形音义综合大字典,正中书局。王云五综合词典,商务印书馆。辞汇,文化图书公司。最新汉英辞典,远东图书公司。
  2. ^
    1. 国民中学国文、历史、地理、生物、公民等各择一课为样本,选样原则以专业名词出现最少之课文为主。
    2. 高级中学国文、历史、地理三种课本各抽一篇或一章为样本,原则如上。
    3. 中央日报》、《联合报》、《国语日报》分择国际版、社会版、副刊、广告各一版为样本。
    4. 儿童月刊》、《中华杂志》、《读者文摘》、《香港时报》,各取其中一篇为样本。
  3. ^ 国立编译馆于1967年出版《国民学校常用字汇研究》(师范大学教育心理系黄坚厚教授主持此项研究)列入常用字3861字,次常用字574字,备用字429字,合计4864字。该书是根据国语日报、国民学校课本、儿童作品、课外读物、广播资料、民众读物等资料研订出的国民教育基础用字[8][9][10]

参考文献

[编辑]
  1. ^ 1.0 1.1 1.2 1.3 1.4 曾荣汾. 教育部標準字體研訂的概況簡介 (PDF). 辭典學論文集. 文字学学术研讨会. 1994 [2021-05-14]. (原始内容存档 (PDF)于2021-05-07). 
  2. ^ * 曾荣汾 & al., 国字标准字体(教师手册)页面存档备份,存于互联网档案馆),中华民国教育部,ISBN 957-00-4240-0
  3. ^ 次常用國字標準字體表. [2021-05-14]. (原始内容存档于2021-05-14). 其中有5字不可考(幽灵汉字)。在目前教育部异体字字典的附录中,已被改收至〈待考正字表〉。另有9字为单位符号,改收至〈单位词参考表〉。扣除这14字后,共6329字 
  4. ^ 4.0 4.1 4.2 4.3 李添富. 《異體字字典》的應用與未來. 东洋学. 2018, 71 [2021-05-14]. (原始内容存档于2021-05-14). 
  5. ^ 巫俊勋. 《異體字字典》未收字研究 ─以《字彙》為範圍 (PDF). 政大中文学报. 2019, 32: 315–358. 
  6. ^ 李添富. 《異體字字 典》正字選錄原則 (PDF). 世界汉字学会第四届年会“表意文字体系与汉字学科建设”国际学术研讨会. 2016-06-24~2016-06-28 [2024-01-15]. (原始内容存档 (PDF)于2024-08-12). 
  7. ^ 世界华文教育协进会. 第1屆世界華文教學研討會論文集. 世界华文出版社. 1985: 614-614 [2021-05-14]. (原始内容存档于2021-05-14). 常用字的选字即以中文大辞典编纂处的“总字表”(四九九O五字),委员会研订之“常用字表”(二四O八字),及教育部“国民学校常用字汇表”(四八六四字),合并统计其总出现次数,于民国六十四年九月十五日正式完成“国民常用字表” 
  8. ^ 国家教育研究院. 九十九年常用語詞調查報告書. 元照. 2018 [2021-05-14]. (原始内容存档于2021-05-14). 
  9. ^ 林佑玫. 國小國語教科書生字序列研究 (PDF). 国立台中教育大学语文教育研究所. 2010 [2021-05-15]. (原始内容存档 (PDF)于2021-05-15). 
  10. ^ 黄沛荣. 海峽兩岸整理文字的現況與省思. 华文世界. 1991, 62: 18–26 [2024-01-15]. (原始内容存档于2024-07-10). 
  11. ^ 曾世熊. 中文資訊交換碼 Chinese Character Code for Information Interchange,簡稱CCCII. 圖書館學與資訊科學大辭典. [2022-12-22]. (原始内容存档于2022-12-18). 
  12. ^ 中央研究院資訊科學研究所 20 週年慶特刊 謝清俊先生之簡介與訪談簡要. [2022-12-22]. (原始内容存档于2020-10-20). 
  13. ^ 認識全字庫- 中文碼介紹- CNS11643 中文全字庫. [2021-05-14]. (原始内容存档于2021-05-14). 
  14. ^ 全字庫現況. [2022-12-22]. (原始内容存档于2023-01-27). 
  15. ^ 全字庫中文標準交換碼 - 中文碼現況. [2022-12-22]. (原始内容存档于2022-12-17). 现有字数:现行全字库中,户政与地政部分用字经检查为认同字,因而删除该码位资料,但仍保留该码位的位置,现有字数即去除这些被认同掉的字码,所计算得到的总字数……全字库第八字面和第九字面所储存的是拼音文字,所以没有注音、仓颉等属性资料码位个数 
  16. ^ 行政院主计资讯处. 102 與文字共舞___中文數位化發展簡介. [2023-09-04]. (原始内容存档于2023-09-04). 
  17. ^ 次常用國字標準字體表 - 字嗨!. zi-hi.com. [2023-04-25]. (原始内容存档于2021-05-14). 
  18. ^ 国家教育研究院. 教育部异体字字典. [2021-05-14]. (原始内容存档于2021-05-15) (中文(台湾)). 
  19. ^ 國小學童常用字詞調查報告書. [2021-05-20]. (原始内容存档于2021-05-20). 
  20. ^ 中華語文知識庫 - 漢字源流. [2022-02-21]. (原始内容存档于2022-05-17). 
  21. ^ 遣辭用「據」-臺灣華語文能力第一套標準 (PDF). 国家教育研究院. 2020 [2021-05-20]. (原始内容存档 (PDF)于2021-06-25). 
  22. ^ 《一○○至一○四年常用語詞調查報告書》(下). [2023-12-16]. (原始内容存档于2023-12-16). 
  23. ^ 我國失學國民脫盲識字標準及脫盲識字字彙之研究. [2023-12-16]. (原始内容存档于2023-12-16). 
  24. ^ 黄富顺. 我國失學國民脫盲識字標準及脫盲識字字彙之研究 (PDF). 成人教育. [2023-12-16]. (原始内容存档 (PDF)于2023-12-16). 

参见

[编辑]

外部链接

[编辑]

字表

[编辑]

笔顺

[编辑]

其他

[编辑]