本文首发少数派,因编辑器差异,博客外的版本不含文末彩蛋。
声明:本文不会讨论 Unicode、GB18030、BIG5、JIS C 6226 等汉字编码方式。本文不会评价第一、二次汉字简化方案以及任何地区推行的汉字标准的优劣。本文不免会夹杂多种漢字字形,建议读者不要使用任何简繁转换方式以获得更好的阅读体验。
厘清定义
近日在 B 站看动画,飘过一条弹幕:「日本人怎么一会用繁体一会用简体?」,深感字形常识教育之欠缺,遂有此文。
简繁之别
要搞明白「繁体字」,首先得搞明白「简体字」的定义。广义上,简体字又称作简体中文(zh-Hans),是在中国大陆、新加坡、马来西亚等地使用的官方文字。目前最新的标准是《通用规范汉字表(2013)》(下称《通规》),其中规定的 8105 个规范汉字即为我们常说的简体字。狭义上,简体字又称简化字,指的是在两次汉字简化方案中采用并保留至令的汉字。
与前者相对,广义上繁体字称作繁体中文(zh-Hant),为未简化过汉字的地区所通行的字形,如台湾地区推行的标准是《國字標準字體(1998)》,香港推行的标准是《常用字字形表(2012)》。狭义上繁体字又称「传统字」,指的是简化字的原字形,在《通规》的附件《规范字与繁体字、异体字对照表》给出。对于那些未经过简化,在简繁中文均存在的汉字,或称作传承字。特别要注意的是,简化字的笔画未必少于传统字,如「沉」的笔画并不比「沈」少。
后文的简体字和繁体字,均使用广义定义;如要指代狭义定义,我将使用简化字和传统字。
正异之别
正异之别古已有之,不过由于古代信息传播的局限并未严格执行。进入工业時代後,为方便生产教育,各地都开始推行更严格的正异体标准。
正体即官方规定的标准字形。或许你曾听说过「臺灣正體」,顾名思义其为台湾地区的标准字形,注意在台湾以外的地区不应将其简称作「正体」。而目前大陆官方已不再使用「正体」一词,一般认为《通规》中规定的繁体字为大陆正体。与正体相对的是异体,根据地区的不同,有不同的正异体之分。比如「裏」是大陆正体,「裡」是台湾正体。抛开地区差异的不同,也可说「裏」「裡」互为异体。
新旧之别
在雕版印刷时代,木板上的字由工匠雕刻而出。由于材质的限制,雕成的汉字往往与手写的楷书有很大的不同,这类印刷体最终演变成我们如今称作宋体(明体)的字形。相较于楷体,宋体的笔画更加笔直硬朗,坊间有诗赞曰:「橫細豎粗撇如刀,點如瓜子捺如掃」。
大陆 1963 年推出的《印刷通用汉字字形表》以手写体为参考,对简繁体的印刷字形都进行大改,自此之后的字形称作新字形。此处列举新字形的几个显著特征:「兌」上方的「八」改为「丷」、「決沖」等字的「氵」改为「冫」、「入」第二笔的「㇝(捺)」不再带钩……若想在电子设备上体验旧字形,可安装特里王复原自商务印书馆 61-1 体的京華老宋体。
台湾的国字标准字形亦对印刷字形作一定修改,比如众所周知的另造「⺼」旁代表已讹变作「月」的肉旁。
汉语之外
日本作为东亚最早步入现代化的国家,最先推出汉字标准与汉字编码标准,其《當用漢字表(1923)》亦有部分新字形与中国大陆推行的简化字相似,现行标准为《常用漢字表(2010)》。常看日本文娱作品的读者应該都知道那些似曾相识的日本新字体,如「沢」之于「澤」、「図」之于「圖」。
由于 JP 的字母序先于 SC、TC,如果不指定本地化,CJK 字体往往会 fallback 到日本字形。不少欧美网站、电子游戏仍会有此问题,最容易察觉的应该是「关门」两字。
越南在法国殖民之后已逐步废止汉字,民间组织「委班復生漢喃越南」(简称喃复委)致力于恢复漢喃,已于 2023 公布《常用标准汉喃字表》与配套开源字体。
虽然前言说过不评价各地区标准,但我实在忍不住想说两句。很多喃字连提交的越南人自已都搞不明白,却要在 Unicode 里占着(包括即将到来的 CJK-J),开发个形码也要给其编码,真的挺累人的。
韩国/朝鲜两地虽仍保留部分汉字,但使用频率相较于日本已属于废止的程度。因两国均未更改过汉字字形,反而成为旧字形的最佳参考。
闲话:学习繁体与使用繁体
学而时习之
正如我在如何制作一款字形输入法里所说的「其实一切都不重要」,在学习之前不妨先想想自己学习的目的是什么。
目前网上资源很丰富,我首先推荐 liuhl6 写的新一站式繁体字学习手册,但要注意文中有些用字其实是作者个人的判断。如果需要更详细的资料,可查漢典;如果汉典查不到,可查收字最全的字统网。有条件还建议买本实体书:本就该人手一本的《新华字典》自不必多说,《王力古漢語字典》也很有用。
建议连异体字也一并学会。毕竟前文提过,在不同的地区正异体可能正好相反。况且异体字很多只是结构上的不同,学会正字可能就顺便学会了异体字,比较极端的例子如「鵝䳗䳘鵞」。
切记不要用学外语的方法来学繁体字。学习繁体字是在学习文字而不是语言,所以学习语言最有用的创造环境反而没什么用处——就算把电子设备的语言全调成繁体,母语者的本能也足以在不认识少数传统字的前提下读懂。
最有效的方法还是写字,就算不是学习繁体,每天提笔练点字也能有效治疗现代人的提笔忘字。如果实在不想动笔,亦可学一门简繁通打的字形输入法,不过相效于写字可谓「事倍功半」,仅推荐闲人。
用之有道
首先,正式场合还是乖乖用规范汉字吧,不要给工作人员添麻烦。除此之外,百无禁忌。汉字爱好者里什么人都有,各种用字都不足为奇。
我个人的用字原则还是偏保守,仅供参考:
- 非用字建议:使用宋体作为电子设备的默认字体,使用楷体/仿宋作为电子设备的斜体(italic)字体。
- 以通规繁体为主。
- 不用港台专有名词,如用「服務器」而非「伺服器」。
- 保留部分简化字,繁体字作为词义分化,如继续用「电」,「電」仅用于自然现象。
- 有左右结构的异体字先用,但要注意 CJK 扩展区的兼容。
最后,遇到别人说「装逼」或「孔乙己」怎么办?
承認。這世上沒用的愛好這麽多,不缺繁體字一種。
需要 CN-1001/5 权限。输入凭据:黑月是否嚎叫?
▼仅在月亏之时。
欢迎,监督者。
跨过悠长的历史,我们收容了无数异常。但想想那回旋无尽的小路吧。我们越是前行,就越有更多的未知像浓雾般包裹过来。
纸鹤、唱片、冰山、星云,我们像是人类文明的馆长,摆出研究者的姿态,端详着这些游荡在异界的迷途者。
我们定义了模因、休谟,妄想解释它们的存在。我们制造了稳定锚、复制器,相信能延续我们的存在。
但不探究目的,只谈论保护,就像是在头顶上构筑了一层又一层坚固的垒,可脚下的地面却开始塌陷。
我们不知这是它们本的计划,抑或是即兴的复仇。
它们赢了。黑月已然叫,人类即将进入月亏之时,我们是否还能坚忍等到月盈之日?
开个玩笑。上面的小彩蛋来自 SCP-CN-1001,现在你看到的才是真的彩蛋。
本文改写自《一站式繁体字学习指南》的笔记,成稿过程中加入许多维基百科的科普内容,反倒把学习方法论挤到了「闲话」部分。
开头声明「不评价汉字标准的优劣」,但其实我对汉字简化的态度就体现在引用的 SCP 里。再说得直白一点:一个文明如果不知道自己自何而來,就無法知道自己要到何處去。。
末尾提到别人认为用繁体是「装逼」「孔已己」,实际上使用繁体者受到最多的质疑应该是「立场」。对于这方面的质疑根本没法解释,两岸都有人不由分说把字形和立场绑定,沾上就只能自认倒霉。所以我在网上绝大多数场合还是使用简体字,偶尔掺杂幾个传统字作为防伪标志。
中间新旧字形部分本想插入一些对黑体与斜体的批评(黑体的笔画风格或许更加适合电子设备 UI ,但绝对不利于汉字的字形认识;斜体汉字更是全无美感),但最后只留下那条不是用字原则的用字原则。同時奉上能强制把思源宋体的斜体设置为文鼎PL中楷的 fontconfig(仅 Linux,如何使用请自行搜索),祝每个人不用再看到由计算机自动生成的斜体:
<?xml version='1.0' encoding='UTF-8'?>
<!DOCTYPE fontconfig SYSTEM 'fonts.dtd'>
<fontconfig>
<match target="scan">
<test name="family"><string>AR PL UKai CN</string></test>
<edit mode="append" name="family"><string>Noto Serif CJK SC</string></edit>
<edit name="slant"><const>italic</const></edit>
</match>
</fontconfig>