Quantcast
Channel: 政协委员何新授权的博客
Viewing all articles
Browse latest Browse all 4987

汉字,字母之间的区别与联系

$
0
0

汉字,字母之间的区别与联系(一)  

作者:长安今何在?


    9世纪左右,阿拉伯也大量翻译过中国的文化、科技等著作,在9-12世纪用阿语写成的著作,包括哲学、医学、历史、宗教、天文、地理各方学科,西欧的语言中至今仍有许多阿语词汇。15、16世纪后,西方学会造纸术和印刷术,通过接触明朝,直接受中国文化影响,翻译了大量中国的文化、科技典籍,导致大量单词出现,其语法应该也会受到中国一定影响。

    表音文字,无法表意,那么如何正确表达,避免歧义?一般是造新单词,使用长句、复合句,改变句子结构,从而改变了人们语言说话习惯等方式!经常说汉语没有逻辑,还有诸如“用汉语思维真的不如用英语思维逻辑清晰吗?”的言论,指责汉语汉字,所谓表音文字逻辑结构严谨,正是它们的缺陷造成的,准确性差,意思表达歧义多,为了避免歧义,才需要在句子结构中严谨表达,语法规则复杂,而汉字的表意特性则无需如此!

    汉语语法要求低,表达自由度高,汉语的话题可以和后续部分在逻辑关系极为松散的情况下,仍然组成句子而不引起误解,这就是经常诟病汉语的地方吧!很多人认为汉语的这种不严谨性会妨碍法律条文和合同,实际上,表音文字的严谨还需要结合上下文来实现,真的是表达严谨吗?表音文字的长句、复合句,各种句子结构逻辑严谨,这是句子结构的逻辑严谨,而不是表述严谨,这种指责真的严谨吗?表音文字通过句子结构来实现逻辑严谨,汉语是通过逻辑关系达到严谨目的,其实,想要做到严谨,都需要考虑到其他人阅读时的想法,然后用其他语句来消除歧义。

    汉语的音节少,还有四声调,表达抽象概念时,汉语用双音节词解决,英语则不能(就总数来说,英语音节十万个左右,汉语只有四百个左右)。汉语总的发音种类大约是英语的三倍,传递同样的信息,发音总数少的语言一定会用到更多的音节,所以用汉语的话,单位信息的表达速度以及思维速度更快。

    南北朝鲜自造语言文字后,南朝鲜尚用少量汉字词,其余大部分和日语一样直接朝鲜语音译外来词,北朝鲜据说完全弃用汉字词。

    南朝鲜的谚文拼音是一字一音,能读就能写,拼音通过组合字母的方式类似方块字,缩短了单词长度,相比日语、西方表音字母文字较为灵活,谚文字母没有意义,一音对多字使得同音字现象严重,也与西方表音字母文字新造单词不同,日语用汉字表意、片假名音译外来语,三者采取的方式各有优点,也都各有缺陷。

    还有,南朝鲜谚文是有过去完成,过去,现在,将来时态的,比英语的16种时态略少,时态也是表音文字解决歧义的一个办法。

    有些语言,没有时态的使用,如分析语的中文,但必要时,仍有时间副词的辅助。也有些语言,如日文,形容词的词形变化能表达出时间上的资讯,有着类似动词的时态性质。还有些语言,如俄文,一个单词就能表现出时态和体貌。

    表音文字缺失表意功能,不能“望文生义”,除了引入外来语,直接使用外来概念,不能重制旧词(旧概念)来表达新词义。这一点是表音文字所无法回避的问题,

    中国周边民族减少汉字词后,大多采取的方式是直接音译外来语,就是换成了本民族发音的外来语而已,日语也是如此,汉字的表意功能由片假名读音代替,不懂外语的人就不能直接看懂,这种现象南朝鲜也有,使用表音文字的很多民族都是如此的吧!当然,的确方便了读写,也方便引入外来词语,只是需要再次学习词义,花费更多时间理解内容,但容易变成西方几百年以后看不懂过去的书籍!

    汉字的难写,常常成为批评汉字的攻击点,汉字是以意象为基础构成的文字,只有中国将说话的语言和书写的文字分开,成为两套独立的系统,而世界上绝大多数的民族都是以语言发音作为文字,方便读写来解决认字问题。

    汉字是以意义、概念为主的书写文字,不影响发音,一个汉字通常表示汉语里的一个词或一个语素,这就形成了音、形、义统一的特点。汉字是“音、形、义”的结合体,大多数汉字是由形旁和声旁组成的。六书是汉字构字的基本原理。在《周礼》中就提到了六书,只是没有说明具体内容。到了东汉,许慎在《说文解字》 中,详细阐述了“六书”构造原理:象形、指事、会意、形声、转注、假借。

    汉字将发音、意义、形象通过偏旁、部首的形式抽象结合成方块字,发音、字形、意义本身并不另占空间,通过声旁也可猜中读音至少一半以上,一个汉字一个音节,汉字组合词语后,双音节词、多音节词不增加词长,音、意相关联的汉字组合词语后,也无需花费时间再学习,这些都减少了将来的学习成本和时间!

    但初学困难,不易掌握,可一旦熟练起来,掌握大量了基础汉字以后,就会易于理解文章的内容,望文生义,触类旁通,举一反三!以上都表示汉字将意义、发音、意象结合压缩在小小的方块字里了,信息量远远大于小小的方块字本身,就像今天人们把大量文件打包压缩后的文件!

    表音文字实际上是“音、义”的粘和物,就像把意义强行粘在发音上面,相对汉字而言,缺失形象、意象,不能“望文生义”,发音缺少形象关联词义!那么以发音为基础创造的文字,就是容易读写,理解不理解是另外一回事,但是好写易掌握,也方便大多数人学习。但发音与词义无关联,不利于记忆,就像拆分了汉字的音、义,为了方便写字,省却图像,每个新概念都需要重新造单词,读音和意义需要另占空间和时间来实现,固然是用词准确,却只能用时间和空间来弥补意象!

    未定型的表音文字,同音词太多,表音文字只是读写符号,而无含义,定型后的单词,开始一词一义,后期单词就需要承载更多意义,出现多义词,词义相联→不同单词,词义不相联→同一单词!因此,对于表音文字而言,联体(新单词)的词汇能够节省发音却要增加记忆,而分体(组合词)的词汇无需增加记忆却增加了发音的次数,只能尽量选择造新词。

    表述时就会发生困难,避免歧义的方式只能增加句子长度,或者更多其他避免歧义的表述方式;理解时也同样困难,大量的长句、复合句,复杂的句子结构,都让人困难重重,需要结合上下文理解词意,阅读效率低下!隔行如隔山,西方专业人士还需学拉丁文,不断增加的词汇量,就会增加掌握单词、读懂文章的难度,方便读写≠方便读懂文章,反而增加了学习掌握理解文章的难度!

    根据上面所知,表意文字和表音文字,汉字与表音文字的区别就在于“形”,汉字是“音、形、义”的结合体,表音文字是“音、义”粘和物,而这个“形”才是导致上面一系列问题的所在,这也是表音文字为什么需要不断造新词,无法“望文生义”的原因!汉字的字形可以负载独立于语音的额外信息。因此只有汉语可以把元素周期表里的元素全部用单音节来表示,而拉丁语里用后缀表示,并且体现在语音上的元素类别,在汉字里是用部首表示的,不占用语音的时间,表音文字还有不少无规律的单词,难于记忆!

    相比之下,汉语是把文字读出来,而表音文字是把语音写下来,两者有本质区别的。

    初期的汉字系统字数不足,很多事物以通假字表示,使文字的表述存在较大歧义。为完善表述的明确性,汉字经历了逐步复杂、字数大量增加的阶段。目前汉字书写的发展多朝向造新词而非造新字。 

    汉字与词语:汉字是汉文组成的最小单位。

    语素是汉文表意的最小单位,类比于英语的“词汇”和“词组”的总称。绝大多数汉字可以独立构成语素,比如“我”,类比于英语中的单一字母构成的词汇,比如“I”。现在白话文大多数词语都是由两个以上的汉字构成的,不过,和英语中“词汇”和“字母”的关系不同,语素的意思往往和其中各个汉字独立构成语素时的意思有相关性,因此相当程度上简化了记忆。 

    词语包括语素和若干个语素形成的短语。 

    汉字的高效率,体现在几百个基本象形字,可以合成表示天上地下的各种事物的上万汉字;几千个常用字,又可以轻松组合出数十万词语。汉语常用词汇约为几万条,总词汇量约有百万条,虽然从数量上来说显得有些令人望而却步,但由于大多数汉字构词法的表意性,要基本掌握并非遥不可及。因此,仅就词汇而言,其学习难度并不高;相比之下,掌握同样数量外文词汇的记忆强度则要大得多。

    汉字的数量:汉字的数量并没有准确数字,日常所使用的汉字约为几千字。据统计,1000个常用字能覆盖约92%的书面资料,2000字可覆盖98%以上,3000字时已到99%,简体与繁体的统计结果相差不大。历史上出现过的汉字总数有8万多(也有6万多的说法),其中多数为异体字和罕用字。

    汉字数量的首次统计是汉朝许慎在《说文解字》中进行的,共收录9353字。其后,南朝时顾野王所撰的《玉篇》据记载共收16917字,在此基础上修订的《大广益会玉篇》则据说有22726字。此后收字较多的是宋朝官修的《类篇》,收字31319个;另一部宋朝官修的《集韵》中收字53525个,曾经是收字最多的一部书。另外有些字典收字也较多,如清朝的《康熙字典》收字47035个;日本的《大汉和字典》收字48902个,另有附录1062个;台湾的《中文大字典》收字49905个;《汉语大字典》收字54678个。20世纪已出版的字数最多的是《中华字海》,收字85000个。 

    下面简单对比一下汉字、日语、英语的单词数量:

    汉字数量:汉字的总数已经超过了8万,而常用的只有3500字。

    日语汉字数量、单词量:日本人的平均词汇量水平是这样的,

    6岁之前,汉字无统计,5000单词

    小学阶段 1000汉字,5000~2万单词

    中学生阶段 2000汉字,2万~4万单词

    高中生阶段 2000以上汉字,4万~4.5万单词

    大学生阶段 2000以上汉字,4.5万~5万单词

    英语词汇量:英语单词从17万到100万不等,大部分母语为英语人的单词量为20000-35000之间。英语为母语的4岁儿童词汇量已经有5000个,8岁词汇量为10000个。(四级的词汇量大概为4000个左右,八级为10000个左右,也就是说4级词汇量相当于母语为4岁的儿童,8级词汇量相当于母语为8岁的儿童。)

    相比这些表音字母文字,汉字的数量真的是少多了,那么多词汇量,真是令人望而生畏,汉字的难写却易懂,牺牲表意功能换来的易写,也并不能让人快速掌握知识!

    这是因为基于特殊的结构,汉语可以很有效地控制自身增长,汉字则绝佳地契合了汉语的这一特点。以下以英语为例作对比。英语有26个英语字母,大小写加一起一共52个。但其实字母并不对英语汉字,更加类似(不完全对应)于构成汉字的笔画,汉字有31种笔画(其中基本笔画有5种),和英语字母的个数是类似的,如下图

    图 最全的汉字笔画表(共31种) 图片

    [img]http://img3.laibafile.cn/p/m/305624481.jpg[/img]

    英语:字母→单词→句,汉语:笔画→字→词→句,这使得汉语相较于英语可以更好地控制自身增长。

    目前,英语单词数量已经突破100万,其中常用单词2-3万,汉语词汇的数量并不比英语单词少很多,但和英语不同的是,汉语的基本语义单位不是词,而是字,汉字总数只有8万,其中常用字2000-3500,而字到词,由于字本身就有丰富的含义,远远比字母到单词的学习开销小,甚至大多数时候不需要专门去学,看到组成词的字,就知道词意了。

    我们举例来说明好了:

    女:woman,男:man,性:sex,女性:female,男性:male,孩:child,女孩:girl,男孩:boy;

    一:one,二:two,三:three,四:four,五:five,六:six,七:seven,八:eight,九:nine,十:ten;

    月:month,一月:January,二月:Febrary,三月:March,四月:April,五月:May,六月:June,七月:July,八月:August,九月:September,十月:October,十一月:November,十二月:December

    以上共出现了15个汉字,但对应的英语单词却有34个,如果进一步拓展(譬如由上面的孩、性、月等进一步展开),差距会越来越大,最终导致了2000-3500核心汉字和20000-30000核心英语单词的差别。

    回复 | 长安今何在 时间:2019-02-15 11:12:55

    汉字,字母之间的区别与联系(四)

    中国分为汉字书写系统和汉语发音系统,文字是后于语言出现的,在汉字还没有诞生的年代,就早已有汉语,汉族的先民们在没有文字时就已经倾向于尽量在已有的概念之上利用排列组合拓展词汇,而非不断创造新的词汇,这是汉语的自身属性,并非汉字带来的,但汉字却绝佳地契合了汉语的这种特性。

    文字产生之后,记录语言在书写载体上面,以口语的为基础,加工形成了书面语。书面语需要书写载体,将文字记录下来供“观看”,所以相对口语,有其内在的稳定性,不会轻易随时间、空间变化。西方表音字母类文字,需要以造纸术和印刷术,固定发音拼写产生文字,才能形成书面语,但随时间变化,发音拼写也随之变化,书面语也就无法稳定,文化难以传承。

    文言文是以古汉语口语为基础的书面语,在远古时代文言文与口语的差异微乎其微。春秋战国时期,记载文字用的是竹简、丝绸等物。随着历史变迁,口语的演变,文言文和口语的差别逐渐扩大,“文言文”成了读书人的专用。文言文是相对现今新文化运动之后白话文来讲的,古代并无文言文这一说法。其特征是注重典故、骈骊对仗、音律工整,包含策、诗、词、曲、八股、骈文等多种文体。经过历代文人修饰越显浮华,唐代起文学大家韩愈等发起“古文运动”,主张回归通俗古文。现代书籍中的文言文,为了便于阅读理解,一般都会对其标注标点符号。

    文言文的特色:言文分离、行文简练。

    文言的特点,是相对白话(包括口语和书面语)而言的,主要表现在语法与词汇两方面。

    “文言”两字,就是修饰过的语言,即书面语言,是相对于“口头语言”而言,文言文作为一种定型化的书面语言,沿用了两三千年,从先秦诸子、两汉辞赋、史传散文,到唐宋古文、明清八股……都属于文言文的范围。也就是说,文言文是中国古代的书面语言,是现代汉语的源头。所以,想要抛弃文言文,脱离古文的话,白话文就会变成无源之水、无本之木,今天的我们需要学习古文、诗词歌赋,才不会让白话文变得愈来愈拖沓无味!

    既然讲了汉字的书面语,就要讲口语,汉语是汉字的读法,经常提到汉字的同音字现象,其实这也与现在的普通话发音,还有不合理的简化汉字有一定关系,普通话里的同音字,在方言里可能就不是同音,就像今天理解诗词里的押韵与历史上的诗词押韵不是一回事!

    中国的四书五经、诗词文赋等的读法,因为废私塾大多数人都遗忘了,以前叫“吟诵”、“朗诵”等,“朗诵”后来分配给了西式读法,现在中国的读法只能叫“吟诵”了,同时还有文白读,有些地方还保留有这种习惯。

    我国传统读书人,常用朗诵(默诵)、吟诵和歌唱三种方法,去体味和欣赏古诗词,对各类古文,则只用朗诵和吟诵二法,鲜闻有歌唱的。

    什么是吟诵?吟诵是中华民族传统的对汉诗文的诵读方式,自先秦开始,口传心授、代代相传,流传至今。它是古代教育系统(私塾和官学)中唯一的诵读方式,也是创作诗词文赋的方式。直到一百年前,所有的中国读书人还都是吟诵的。吟诵是吟咏和诵读的合称。吟咏是有曲调的,它和唱的区别在于,唱的目的在曲,吟的目的在词。诵读是没有曲调的。除此之外,两者的规则是完全一样的。

    吟诵虽然注重语音因素,接近语言音调,但只要略为夸张,就音记谱,削语音之足适音乐之履,就可以合乐。吟诵音调大多是一字一音,即使多音,也是语音范围内的音,为了突出语言效果,才作较大的音程跳动。严格地说,吟诵可细分两种,一种接近语言,近似速度缓慢的朗读,另一种音乐性强,吟诵音调其实就是一首歌曲。歌唱音调完全可以合乐,节奏、旋律性强,乐曲形式的起、承、转、合、变化、终止,也比较完整。

    《周礼.春官.大司乐》称:「以乐语教国子,兴、道、讽、诵、言、语。

    兴,起兴,常以丰富想象之比喻引起,犹今之引子,开场白(曲)。

    道,引导,以古切今,报导国家、社会生活事物,传导官方消息,反映民众心声,犹今之新闻播讲。由于方言及书面语言难懂,必拉长语调,以吟唱方式处理,也以此吸引听众。

    讽,带有讽剌、劝谏内容,或复述口头、书面语言,陈说民情,有如今之韵白、道白或吟诵。如实唱出各地民歌,则音乐性极强矣。

    诵,有一定的音调节奏,近口语为朗诵,近歌唱为吟诵或吟唱,应用面极广,上自大雅之堂,礼仪、朝会,下至塾课、个人诵读文字数据,均用之。

    在周初前后颇长的一段时期内,吟诵音调还曾起到规范、沟通语音的作用,有点像后世的官话和今之普通话。当时「五方之民,言语不通」,吟唱《诗经》的「雅言」便成为上层社会人际沟通的桥梁,只不过官话和普通话是讲的,而雅言是吟诵的。上古时代,有文化的士人讲话,特别是后来国(诸侯)际交流的语言,大多是吟唱出来的,真是优雅极了!后世京昆戏剧中有韵白,日本「能乐」中也有类似的唱白,原来它们都与此有关。

    《诗经 述而》就有记载:「子所雅言,《诗》、《书》,执礼,皆雅言也」。不但吟《诗》诵《书》用雅言,就是在各类仪式中担任司仪的礼生,也要拖拉着腔调「执」行「礼」仪。《诗经.郑风.子衿》说得更明白:「古者教以诗乐:诵之、歌之、弦之、舞之」。《诗经》可以吟诵,可以歌唱,也可以用弦乐演奏、伴奏,还可以配合舞蹈。《墨子.公孟》称:「诵诗三百,弦诗三百,歌诗三百,舞诗三百」,也把吟诵和歌唱分得很清楚。古人认为诗乐皆音声之事,吟诵和歌唱是合乐的两种方式,故有「弦诵」、「弦歌」的说法,吟诵和歌唱同样可以配合弦乐演唱。(我们的诗、歌、乐、舞都是一体的,而不是现在宣称的那样,汉族没有音乐,没有舞蹈,只是废私塾后遗忘了!我们的诗、歌、乐、舞也都在这里!吟诵也与戏曲一脉相承!)

    诗乐、词乐失传,吟诵代之:中国是诗词歌赋原本都是有音乐的,但是音乐极易丢失,例如词因音乐而兴起,虽流行一时,但即使在宋代,很多词乐就已经失传,宋词付诸发声,便只能吟诵,凡失掉了音谱的韵文:诗经、楚辞、乐府、唐诗等,都是以吟诵为主要表达方式的。

    五四以来,人们喜欢用“摇头摆尾的”去形容那些迷恋古文的人。虽然吟文并不必需摇头摆尾,但摇头摆尾的吟诵诗词也并非罪过,只是从此青年国文教师都不敢在教室里吟诵古文,怕人笑话,怕人笑话他落伍,学生自然也就有了成见。把吟诵这个千百年来普遍使用、实践证明是行之有效的读诗读词读文的方法当作封建的东西加以废除,这不能不说是这场运动的一个遗憾。这是甚为可惜的!也许还丢失了更多的东西,但是在当时,满清的落后无能,人们找不到原因,只能归咎于整个华夏文明的错误,导致后人无能,古人受辱,华夏蒙羞!

    吟诵也影响了日本,吟咏在日本古代音乐的传承和变迁中,随着万叶歌、诗歌、汉诗等文学的发展,在平安时代基本成形。在儒学、朱子学等的口诵中,吟诵的旋律在江户时代产生,固定于今。日本大量减少汉字以后,受到现代娱乐冲击影响,日本的诗歌吟诵团体全国平均年龄超过60岁以上,青少年仅占5%左右。国内的吟诵也努力在恢复传播中,大家有兴趣的话,可以去了解下!

    那么汉字易于看懂,汉语的“吟诵”可以加深对诗词歌赋的理解,两者相辅相成,缺一不可!目前,废私塾后“吟诵”读法,极少人知道此事,使得国人读起诗词歌赋来,记忆相当不易,希望能够尽早推广,更多人知道,容易理解记忆这些古文、诗词歌赋了,所以,古人有神童,从小能熟读背诵四书五经等等,自然不足为奇啦!


    大致了解了汉字、汉语的情况,表音字母类文字,分为用汉字和不用汉字两种情况,使得它们的书写表达方式、习惯也不同,就拿同音字来说,朝鲜文、日文、西方表音字母文字都有类似情况!

    中国《施氏食狮史》是刻意之作,属于极端情况,现实中并不会如此说话写作。全文计94字(后扩充为103字,连同题目7字,共110字),每个字的普通话发音都是shi。如果用普通话读音来朗读,不懂古文的人读起来根本不懂,原因是当代普通话丢失了古汉语的入声和浊音。

    【原文】

    石室诗士施氏,嗜狮,誓食十狮。施氏时时适市视狮。十时,适十狮适市。是时,适施氏适市。施氏视是十狮,恃矢势,使是十狮逝世。氏拾是十狮尸,适石室。石室湿,氏使侍拭石室。石室拭,氏始试食是十狮尸。食时,始识是十狮尸,实十石狮尸。试释是事。

    【原文拼音】

    《sh shì shí sh sh》

    shí shì sh shì sh shì ,shì sh ,shì shí shí sh。

    sh shì shí shí shì shì shì sh。

    shí shí ,shì shí sh shì shì。

    shì shí ,shì sh shì shì shì。

    sh shì shì shì shí sh ,shì sh shì,

    sh shì shí sh shì shì。

    shì shí shì shí sh sh ,shì shí shì。

    shí shì sh ,shì sh shì shì shí shì。

    shí shì shì ,shì sh shì shí shì shí sh。

    shí shí ,sh shí shì shí sh sh,shí shí shí sh。

    shì shì shì shì。

    一般认为,包括一些学者在内,认为赵元任是希望用这个例子来证明汉字拼音化带来的荒谬。实际上,赵元任是汉字拼音化的支持者。《施氏食狮史》限制性地使用一组同音异形的汉字来行文,属于文言文而不是白话文,赵元任用这种在现实口语中根本不会出现的情况,来反面证明汉字拼音化的可能性。

    结果,为了证明拼音化可行而举的例子,根据原文汉字与原文拼音显示,汉字反倒不会误解,拼音化以后倒是一个读音,反而证明了拼音化不可行!

    外国也有同音,不过不一样,日语没有类似《施氏食狮史》的同音文,只有同音句,且不是完全意义上的同音句,比如下面三句:  

    李も桃、桃も桃、李も桃も桃の内。 // Sumomo mo momo, momo mo momo, sumomo mo momo mo momo no uchi.  

    母の母はハハハと笑う。 // Haha no haha wa hahaha to warau.  

    東欧を覆う鳳凰を追おう。 // T o u h o oou.  

    也有以多个连续音节为单位创作的同音句:  

    貴社の記者が汽車で帰社した。 // Kisha no kisha ga kisha de kisha shita.  

    裏庭には二羽、庭には二羽鶏がいる。 // Uraniwa ni wa niwa, niwa ni wa niwa niwatori ga iru.  

    韩语和越南语可能也有同音句吧,不过我不知道。  

    其实世界上不少语言都有同音句的现象。例如:  

    英语:  Buffalo buffalo Buffalo buffalo buffalo buffalo Buffalo buffalo.  

    法语:  Si six scies scient six cyprès, six cents six scies scient six cent six cyprès.  

    希腊语:  Οι υγιη γιοι η γη. // Oi ygii gioi í i gi.  

    塞尔维亚语:  Горе горе горе горе, него што горе горе доле. // Gore gore gore gore nego što gore gore dole.  

    芬兰语:  Kokko! Kokookko kokoon koko kokon?~ Koko kokonko?~ Koko kokon.

    看起来很好玩的样子,所以,同音现象不仅是汉语才有的,各种语言里也有,表音文字里的同音现象影响更大,汉语的发音并不影响汉字,汉语的同音≠汉字的同形,两者不可相提并论!表音文字的同音会让人产生误解歧义,才需要各种句子来解释确定词意!

    这是因为,汉语是分析语,有三到十五种声调。汉字是一种意音文字,兼具表意和表音功能。汉语包含书面语和口语两部分。古代书面汉语被称为文言文,现代书面汉语被称为白话文,以现代标准汉语为规范。

    汉语和英语相比较,英语单音节词资源比较丰富,但平均发音长度较长。英语里单音节词比例高于汉语,而多音节词的使用比例就小于汉语。

    比如我们可以很轻松地说“公鸡”、“母鸡”、“小鸡”、“鸡蛋”。而英语里就成了“Cock”、“Hen”、“Chick”、“Egg”,毫无联系。如果常用词要建立联系,那么英语就必须提高这些单词的音节数,那么平均词长就要上升,从信息论角度讲,信息传递效率就更低了。所以英语只能在组词的逻辑性上进行妥协。

    所以,汉语和英语都各自在组词上有一个弱点。汉语有大量的同音词,而英语有大量的多义词。汉语有“攻击”和“公鸡”,英语的Ball既可以是球也可以是舞会,当然还有相关的一些列动词含义。汉语中,曾经在文言文中大规模使用的单音节多义词现在大多变成了双音节单义词。汉语中真正的多义词(各个意思之间没有直观逻辑联系)是极少数。而英语里的同音词也是极少数。可以说这两种语言在各自的发展路径上都做了妥协。

    总的来说,由于汉语精简了发音,并且每音节信息密度较高,这就使得汉语可以有较长的平均词长,因此组词逻辑相比于英语就有了一定的优势。至于其他主要语言,信息传递效率与汉语相比差距更大。主要方面都无法相比,这种次要方面就不需要再比了。(不过,法语之类组词逻辑比英语要好)

    由于汉字并不受限于读音,因此可以创造出大量同音异形字,帮助汉语降低平均音节长度、提高组词的逻辑性。而且,虽然在口语上,汉语的同音异形词和英语的多义词都属于“同一发音可能包含不同含义”的情况,但写到纸面上,同音异形词就比多义词更容易辨识,减少歧义的可能。

    所以我们的文字、我们的语音以及我们整个语言整体,都是有机结合在一起的。推崇汉字的拼音化或拉丁语话,都是没有看清这种密切联系。因此去汉字化彻底的南朝鲜就会出现那种把防水材料搞成吸水材料的笑话(韩语里“防水”和“放水”读音拼写一致,结果建筑公司错误理解了图纸)。

    另外,由于汉字不需要空格,所以相比于类似字号的英文单词,同一个词要高而窄。这在排版上有很大的优势(行距要占用额外的空间,高而窄可以减少行数)。加上汉语本身信息密度高。所以一般我们看到的中文版的书面文件都比外文版的页数少。



 

Viewing all articles
Browse latest Browse all 4987

Latest Images

Trending Articles





Latest Images