文字 编辑

汉语词汇

文字文字

文字是人类用符号记录表达信息以传之久远的方式和工具。现代文字大多是记录语言的工具。人类往往先有口头的语言后产生书面文字,很多小语种,有语言但没有文字。文字的不同体现了国家和民族的书面表达的方式和思维不同。文字使人类进入有历史记录的文明社会。

基本信息

编辑

中文名:文字

外文名:characters

拼音:wén zì

定义:文字是语言的符号

例子:汉字、英文、俄文

要素:音(语音)、形(字符)、义(意义)

文字概念

编辑

定义

文字是人类用表义符号记录表达信息以传之久远的方式和工具。现代文字多是记录语言的工具,人类往往先有口头的语言后产生书面的文字,很多小语种,有语言但没有文字。

文与字

【东汉】许慎《〈说文解字〉叙》:“盖依类象形,故谓之文;其后形声相益,即谓之字,”也就是说,“文”是独体字(包含象形字和指事字),而“字”是由独体字组合的合体字(包含会意字、形声字、假借字)。

分类

文字按字音和字形,可分为表形文字、表音文字和意音文字。按语音和语素,可分为音素文字、音节文字和语素文字。

表形文字是人类早期原生文字的象形文字,比如:古埃及的圣书字、两河流域的楔形文字、古印度文字、美洲的玛雅文和早期的汉字。

表音文字用少量字母(大多不到50个)组成单词记录语言的语音进行表义的文字。表音文字可分为音节文字和音素文字。音节文字是以音节为单位的文字,如日文的假名。音素文字是以音素为单位的文字,比如英文字母26个,西文字母29个,俄文字母33个。

意音文字是由表义的象形符号和表音的声旁组成的文字,汉字是由表形文字进化成的表意文字。汉字也是语素文字,也是一种二维文字。

要素

语言的三要素是:语音、词汇和语法,文字的三要素是:音——语音、形——字符形状、义——意义。学习一门语言,往往连带学习它的文字,语言文字的要素有重复,合并同类型为四要素:语音、字符、词汇、语法。

属性

文字是不同国家和民族约定俗成的,由众多笔画简单的符号组成的,表达信息和传承文化的字符系统。

字符笔画简单

文字的笔画往往不多,复杂的符号就是图画了,虽然也能表义,但不便于书写和传播。

约定俗成

文字是不同民族和国家创造的约定俗成的字符系统,个人自创的不被民族和国家广泛认可的字符不算真正的文字。

系统

少数几个孤立的字符难以表达万事万物的海量信息,还不是文字,文字是由众多字符组成的一个表义的符号系统。基本的字符越少,意味字符的组合越长越复杂,基本字符越多,意味表达信息越简单。改革文字会牵一发而动全身。

发展史

编辑
文字突破口语受到时间和空间的限制,是人类可以在书面语的基础上完整地传承人类的智慧和精神财富,使人类能够完善教育体系,提高自己的智慧,发展科学技术,进入文明社会。

普通文字是用简单图形形成,早期更加接近图画,更加接近几何线条。例如拉丁字母是简单的直线、弧线和点构成。汉字主要是由直线构成,所以叫做“方块汉字”。古代的甲骨文汉字,埃及象形文字和玛雅文字等古老文字图画性比较强。

由于特殊人群视觉能力的局限,还可以发明变异的视觉符号或者触觉符号来代替普通文字。盲文是为了适应没有视觉能力的盲人发明的触觉符号。手语是为了适应没有语音能力的聋哑人发明的用手舞动的动态视觉符号。旗语是为了适应航海等远距离听觉和视觉局限发明的用旗子舞动的动态视觉符号。

在电子信息传输的初期,人们还采用阿拉伯数字代替汉字传输书面语。这种数字代码可以给任何文字编码。但是汉字因为数量多,需要专门的代码翻译人员才能使用。

有人把文字分成线性文字和非线性文字。这样有一定道理,但无论是普通文字还是代码文字都有线条和点等视觉元素。

1.表形文字/象形文字

描画事物形状的文字是象形文字或表形文字。像中文中的“日”“月”等字都属于象形文字。象形文字是文字萌芽时期的产物,主要的优势便是易于理解,一看便懂,用于记录语言会有些困难,尤其是记录虚词,可以分为四种类型——刻符、岩画、文字画和图画字。不过到今天,这种表达意义的符号依旧很常见。比如网络上流行的颜文字和绘文字(emoji)。

2.表音文字/拼音文字

拼音文字是一种使用少量的字母记录语言中的语音的文字,主要分以下四大类:

(1)Consonant alphabets/Abjads(辅音文字)

基本特征:正式书写系统只表记语流中的辅音音位;辅音字母依照在语流中出现的顺序,呈线性排列。

(2)Alphabets(音位文字)

基本特征:有独立的元音字母和辅音字母分别表记元音和辅音(有些语言中也存在既能表示元音又能表示辅音的字母)。字母依照所代表的音位在语流中出现的顺序,呈线性排列。元音字母和辅音字母在形态和位置上不带有各自的分类属性。元音字母可以独立表记音节,辅音字母通常要和元音字母拼合才能表记音节。

(3)Syllabic alphabets/Abugidas(音节拼写文字)

基本特征:音节的书写呈线性排列,每个音节内音位的书写并非呈线性排列。在每个音节中,以表记该音节起始辅音或零辅音的辅音字母(类似汉语拼音体系的声母)为中心,在周围特定方位(上下左右半包围等)以添加符号、符号组合、辅音字母、辅音字母和符号的组合等形式,表记韵头、韵腹、韵尾以及声调(如有)等。辅音字母可以单独出现,代表该辅音与特定元音拼合成的音节。元音符号不能单独出现,表记纯元音或以元音开头的音节时,必须伴随零辅音字母。当辅音字母和添加部分共同构成音节时,在有些文字中,为保持音节字形结构的平衡和美观,字母或符号的形态会发生变化。

(4)Syllabaries(音节文字)

基本特征:每个音节有一种或多种独立不可拆分的表记形式,音节文字中不含有任何表记元音辅音音位的部分。书写时,依照所代表的音节在语流中出现的顺序,呈线性排列。音节文字又分成整体音节文字和非整体音节文字。日语假名是整体音节文字。非整体音节文字又分成半音素化音节文字和全音素化音节文字。半音素化音节文字例如阿拉伯文字,每个字(字母)内部的主体部件写音节中的辅音音素,元音音素可以不写或者用附加部件写。

在音节文字中,韩文是例外。韩文(谚文)表示音素的字母按音节组合起来写成一个方块字,但其实它并不属于学术定义上的音节文字,而和拉丁字母一样属于音位文字,只不过它的字母排列不是线形拼写,而是依照音节块形拼写而已。谚文的方块字才能为字,把音素字母看成构件。所以谚文应该看作是音节文字。

3.语素文字/意音文字

意音文字,或称语素文字、语素——音节文字、语词-音节文字,是一种图形符号既代表语素,又代表音节的文字系统。一般来说意音文字可以分解为字位,一个字位代表一个语素。语素文字的文字本身可能有表示声音、意义或是形状的部份。

基本特征:每个单字表记独立语素,不直接表记发音(注意并不是“完全不表记发音”)。

每个单字创制时通常有唯一对应的音节,但由于语音历史演变、文字借用等因素,现今单字和具体发音之间的映射关系已非常复杂。

对应相同音节的可能有非常多的不同单字。在不结合语意的前提下,无法判断每个音节所对应的具体是哪个单字。

文字的三种类型

文字类型

代表文字

表形文字(象形文字)

圣书字、古汉字、玛雅文等

表音文字

(拼音文字)

辅音文字

阿拉伯字母、希伯来字母、塔纳字母、叙利亚字母

音位文字

拉丁字母、希腊字母、西里尔字母、亚美尼亚字母、格鲁吉亚字母等

音节拼写文字

天城文、孟加拉文、藏文、缅甸文、泰米尔文、高棉文、泰文、老挝文等

音节文字

日文平假名、日文片假名、切诺基文等

意音文字(语素文字)

汉字、喃字等

(二)文字的发展史

最原始的文字大多是图画符号,即通过象物来表达。古代埃及文字中,也有几个图画符号来表达其音组合后对应事物的做法。苏美尔文字也经历过这个时期。但值得注意的是,汉字的“象形”与古西方文字的“象形”是两个完全不同的概念,事实上古埃及文字中绝大部分图画符号并非以形表意,而是表音符号。实质上类似于字母文字。举个例子来说,在古埃及文字语法中,看起来像是各种鸟的符号,其实跟鸟无关,而是表示不同的的发音。所以所谓的“古埃及象形文字”,其实是世界上最早的拼音文字。(按:早年中国学者在翻译“hieroglyph”时错误的放弃了直译法,而是比较形象的根据古埃及文字的图画特征,套用汉字造字法中的象形,翻译为象形文字流传至今。)

随后楔形文字放弃了图画符号,不再以形表音,而是用线条来标音,我们看到的众多字母体系,从腓尼基字母借用古埃及象形文字的形而用其声,再经过一系列演变,分化出希腊字母,罗马字母,阿拉伯字母,西里尔字母等等,从古代到现在的字母文字,几乎都可追溯到腓尼基字母。在东亚,日本利用汉字,从其草书和楷书形态演化出平假名和片假名。

文字变化的机理和拼音文字存在的原因在哪里?很重要的一点是文字还没发生和成熟之前,言语已经高度成熟了,即使是没有文字的民族,它们的口语也能涵盖日常生产生活的诸多内容。在语言还没有产生之前,人们已经能认识周围事物,而文字则是对周围事物的抽象化体现,又比如在汉字这样的意音系统里,虚词普遍采用了“假借”手法,譬如“然”即是今天的“燃”的本字,火字旁乃是后人为了和“虚词”用法相区分而加上去的(容易注意到,火字旁其实是和“然”字的火字底(四点底)相重复的),以今人度之,即如画一个抽象符号即可。

中国汉字

编辑

汉字历史

汉字是世界上最古老的文字之一,对周边的影响也是非常巨大的,是其它文字的母字。它是记录事件的书写符号。在形体上逐渐由图形变为由笔画构成的方块形符号,所以汉字一般也叫“方块字”。它由象形文字

从汉字跟汉语的个体单位的对应关系看,汉字是一种语素文字(表意文字)。从汉字的内部构造来看,可以分成形旁(根据意义构造的有理偏旁)、声旁(根据声音构造的有理偏旁)和配旁(没有根据的无理偏旁)3种偏旁部件。早期汉字很接近图画,只有1个偏旁的字叫做独体字,多一个偏旁的叫做合体字。合体字可以分成指示字、会意字和形声字,主要是后面两种,特别是形声字占80%。

(1)形声字

形声字由表示意义的形旁和表示读音的声旁两部分组成。拿构造最简单的形声字来说,形旁和声旁都是由独体字充当的。作为形声字的组成部分,这些独体字都是有音有义的字。不过形旁只取其义,不取其音,例如“鸠”字的偏旁“鸟”;声旁则只取其音,不取其义,例如“鸠”字的偏旁“九”。 随着表达越来越丰富,形声字逐渐增多,汉字中甲骨文中形声字比例为20%,到了《说文解字》就占到了45%。由于字义和字音的演变,有些形声字的形旁或声旁已失去了表意或表音的功能。例如“球”本来是一种玉的名称,所以以“玉”为形旁。“球”字不再指玉,这个形旁就没有作用了。再如“海”字本来以“每”为声旁。由于字音的变化,“海”和“每”的读音相去甚远,声旁“每”也就不起作用了。有的时候,形旁和声旁都丧失了原来的功能,例如“给、等、短”。这一类字已经不能再作为形声字看待了。

(2)会意字

射的演变射的演变

古人说“止戈为武”,“人言为信”。对于“武”、“信”两个字来说,这种解释是错误的。不过汉字体系里确实有按照这种方式造的字,例如“不正为歪”,“不好为孬”。这一类字的特点是会合偏旁的字义来表现整个合体字的意义。这种字为数很少,只有个别的例子。

形声字和非形声字之间并没有明确的界限。造字之初,形声字和它的声旁的读音本来就不一定密合。发展到现代汉字,出入就更大了。有人拿7500多个现代合体汉字进行统计。就普通话读音来说,合体字跟声旁完全同音(声母、韵母、声调全同)的不到5%。声母、韵母相同而声调不同的约占10%。只有韵母一项相同的约占20%。如果我们只把前两类看作形声字,那么形声字大概只占通行汉字的15%。如果把以上三类全看作形声字,形声字大概会占通行汉字35%的样子。要是把标准再放宽或者完全根据来历确定形声字,那么通行汉字中形声字的百分比还要高得多。还有一些理据模糊的字,看起来是合体字。一种是由于变化,原来的声旁和形旁已经失去理据价值,例如“给、等、 短”等。一种是原来的独体字被分解成不同部件,例如“章, 按照汉代许慎《说文解字》的分析,“章”字从“音”从“十”。可是一般人说“立早章”(以区别于“弓长张”)的时候,是把它分析成“立”和“早”两部分。其实从古文字看,“章”本来是一个独体象形字,跟“音、十、立、早”都没有关系。

在汉字形成的过程中,由于部件的笔画化甚至讹化,以及古今异义等原因,很多字难解甚至错解,比如有个奇谈:用错互换的“射”字和“短”字。寸身不是很短吗?射字其实是短字。豆矢就是飞着的箭,短字其实是射字。实际上射在金文中就是引弓射箭的形象。不过在篆书中,左边被讹化成了“身”,右边的“寸”,“寸”作为构字部件同“又”一样是手的形象,而不是今天人们常用的“长度单位”义。短是个形声字,“豆”是声旁即便认为“豆”也可能是形旁,豆,食肉器也,造字部件中多为这个意思,而人们所熟知的“豆”义后起得多,是个假借用法。

下一篇 绘画

上一篇 篆刻