维基百科:繁简处理
| ||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| ||||||||||||||||
| ||||||||||||||||
| ||||||||||||||||
| ||||||||||||||||
| ||||||||||||||||
| ||||||||||||||||
|
在中文维基百科里,繁简处理和地区词处理是字词转换系统的两大组成部分。繁简转换旨在为用户提供只针对单字的转换(并包括繁简/简繁一对多的转换,例如简体“打斗”会正确转成繁体“打鬥”),是进一步实现地区词转换的基础。本页面提出一些繁简转换编辑维护的指引。
维基百科简体字与繁体字的转换,是指中华人民共和国所制定规范汉字与华语圈传统汉字间的转换,转换范围基本以《通用规范汉字表》为准,但亦会根据民间习惯和实际需要作弹性调整。
全局转换
维基百科的繁简转换总共通过三个转换表来实现:其一是MediaWiki内建的转换表ZhConversion.php,其二是在MediaWiki:Conversiontable/zh-hans中定义的简体中文转换表、其三是在MediaWiki:Conversiontable/zh-hant中定义的繁体中文转换表。
如果您遇到了以下三种情况,请提交Wikipedia:字词全局转换修复请求,管理员会尽快处理,而无需人手转换修复:
- 繁简/简繁一对多的转换出错。例:“乾隆”过度转成“干隆”(由于“繁体:乾=>简体:乾、干”的一对多转换);
- 全局转换地区词出错。例:“東加拿大”过度转成“汤加拿大”(由于“台湾繁体:東加=>大陆简体:汤加”的地区词全局转换),“撒贝宁”过度转成“撒貝南”(由于“大陆简体:贝宁=>台湾繁体:貝南”的地区词全局转换);
- 某一单字没有转换。例:“東”未转成“东”,但此种情况较为罕见。
注意事项
条目标题
用繁体或简体创建页面,相应标题必须全部为繁体或简体字。如果标题繁简混杂,例如“中國历史”,系统就无法自动转换。如果您发现这些页面,请将它移动到简体标题或繁体标题,然后将重定向页面挂上{{d|R3}}
标签;但系统会视作简体字的传承字、俗字(如“杰”、“灯”)除外(是否为简体字应视具体情况而定)。
如果文章有繁简两版本就必须合并,具体参见Help:中文维基百科的繁简、地区词处理#编辑一般文章时的注意事项。通常这些情况很少见,维基程序会自动在你创建条目时判断有无对应繁简的条目并做出处理,但通过移动等方式也会产生同一事物的繁简两个版本条目。
若页面已有繁中标题版,则不得创建相同内容的简中标题页面,反之亦然。例如,条目哈萨克已存在,则不得创建名为哈薩克的条目,但可以创建繁简重定向至哈萨克条目。
勿与地区词转换相混淆
虽然繁简转换与地区词转换都用相同的转换技术,但它们发挥的功能并不一样,因此,请勿将地区词的全局转换请求提交到Wikipedia:繁简体转换请求。如需了解更多相关内容,请参见Wikipedia:地区词处理。
勿人手转换条目繁简语句
编辑维基百科条目时,如果缺乏正当理由,请勿人手将条目原始码的繁体语句转为简体,反之亦然(广义也包括将一个地区用词转换成另一地区用词,如港澳繁体转换成台湾繁体),以免影响他人编辑和阅读。人手转换可能会视为“繁简破坏”,见Wikipedia:破坏#破坏类型中的“繁简、异体及地区用词破坏”一条。
对于读者来说,想只看繁体或简体,可以在界面上方选择“大陆简体”、“香港繁體”、“澳門繁體”、“大马简体”、“新加坡简体”或“臺灣正體”;对编者来说,若想修正自动转换出错的词汇,可以使用人手转换语法,形如-{zh-hans:一般简体词汇; zh-hant:一般繁體詞彙; zh-cn:大陆简体词汇; zh-tw:臺灣正體詞彙; zh-hk:香港繁體詞彙; zh-mo:澳門繁體詞彙; zh-my:大马简体词汇; zh-sg:新加坡简体词汇}-
,或者{{NoteTA}}模板。总之人手转换条目繁简语句没有必要。
请注意:若您的浏览器安装了中文繁简转换软件,或可以转换繁简中文的移动应用程式,请在编辑时将其关闭或移除。
简便地修复错误的繁简转换
一种例外是当繁简并非一对一转换,且该字不与上下文形成词汇而不适宜使用全文转换时,为了简便地修复错误的繁简转换,可改为不会转换出错的字眼。修复错误转换时,应优先使用没有歧义且不会转换错误的字形。例如在简体和港澳繁体有“着”、“著”两种字形,在台湾繁体只有“著”字形,在原始码输入“着”时可由系统自动转换成台湾繁体“著”,但反之则不会转换,因此以台湾繁体输入“吸著”一词时无法正确转换为简体和港澳繁体,此时容许直接将原始码修正为“吸着”以修正转换错误,如果在内文直接使用转换规则(例如“吸-{zh-hans:着; zh-hk:着;zh-tw:著;}-”)时,也允许将原始码简化为“吸着”。更详细的示例可参考Wikipedia:非一对一字词转换错误修正指南。
勿手动转换异体字
尽管异体字间的功能相近,且所代表的意义相同,但手动转换异体字,很可能引发编辑争议,甚至引起编辑战。因此在人手转换异体字之前,请先考虑以下两种情况:
一是在现代汉语中或者电脑输入中已经不再使用或者极少使用的异体字,如“靑/青”、“敎/教”、“囯/国國”,这种情况下,将异体字转换为正体字是值得提倡的,反之则视为破坏。因为此类异体字在电脑输入或者现代汉语中极少用到,使用此类异体字不便于阅读。
二是目前现代汉语中仍然有用的异体字,此类异体字由于较常用,或者是不同地区,对正体是哪个字的定义不同,例如“床/牀”,中国大陆和台湾把“床”视为正体,把“牀”视为异体,而香港则是相反,视“牀”为正体,人手转换此类异体字违反了避免地域中心方针。此外,“台/臺”这一对字由于政治原因常常成为修改对象,由于“台”字虽为俗写,但是在台湾已经广泛使用,因此不应人手转换,而是应该遵循先到先得的原则,因为人手转换这些字对条目没有实际改善作用。
概括来讲:
- 如果所有地区皆常用甲,罕用乙→可将原始码乙直接改为甲,不宜使用转换。
- 如果某些地区常用甲而罕用乙,某些地区常用乙而罕用甲→原始码文字先到先得,不得修改,同时全局转换。
- 如果所有地区混用甲/乙→原始码文字先到先得,不得修改,不得使用转换。
- 如果某些地区混用甲/乙,其他地区常用甲而罕用乙→原始码文字先到先得,不得修改,其他地区可使用转换。
日本汉字及其他不应转换繁简的情形
因为日本汉字不属于中文,所以日本汉字不应参与中文的繁简转换。但是,部分日本汉字与中文汉字存在重叠,系统可能误将其认作中文而转换。这种情况下,您应当使用{{lang|ja|日本语汉字}}
来防止误转。
如果是因为其他原因需要避免简繁转换(如在一些网站,简体和繁体的用户名属于不同账号),可以用-{汉字漢字}-
或<nowiki>汉字漢字</nowiki>
来达到禁止转换的效果。在使用cite系列模板标记参考来源时,遇日文汉字可使用|script-title=ja:XXX
展示来源标题。(韩文汉字情况同理,使用|script-title=ko:XXX
展示来源标题。)
大陆简体模式下的中国古代专有名词
在大陆简体模式下,对中国古代人名、地名等专有名词,若其中某一简化字属于两个或多个汉字的合并字,则该字可以保留原繁体字或异体字,如“凌濛初”可不简化作“凌蒙初”、“南壄”可不简化作“南野”、“昇平”可不简化作“升平”。若某一繁/异体字本身已在简体中文环境较常出现(如“濛”字),则该字本身便不应加入全局繁简转换(或应从已在的全局转换中移除);否则,对其中繁/异体字会被转换的专名而言,若通用度高可在全局转换进行相关处理以防被转换为简化字[注 1],其他情况则一般只在页面内手工转换或加入相关公共转换组。在条目内(尤其是以该专名为主题的条目)首次出现时,这些保留繁/异体字的专名须标注简化字写法。
注释
- ^ 这里说的“通用度”有两层含义,既包括了“简体中文环境下该专名繁/异体字写法出现的普遍程度”,也包括了“在中文维基百科出现的频率”,均高者称“通用度”高。
外部链接
- 《通用规范汉字表》(2013年08月19日发布,中国大陆用字规范)