Re: 拼音语言比汉语高明在哪里啊?
2011-09-28
约 3063 字
预计阅读 7 分钟
这个话题本来在水木上讨论的,这里记一下。
简单而抽象是智力的基本特征,汉字正好相反,复杂而具体
首先文字是与语言相匹配的,有时候不能完全将两者混起来谈,文字是因为语言的特点而被创造出来的。文字的形态是由语言的形态决定的(从语言的自然演化来考察,不包括靠行政命令强制转换文字体系的,当然有些后起文明直接借用的文字)。
从语言形态上来说,现在的语言分为两大类:分析语与综合语。综合语的语素要比词汇大的多,分析语中语素相对于词汇的比例没那么大。通俗的例子来看,印欧语系(拉丁语系) 中的拉丁语属于综合语,其名词有性(如阴性、阳性)、数(单数、复数)、格(主格、宾格、所有格等) 等多种变化,这就决定了其句子在表达特定意思的时候是形式严格固定的。而分析语没有这么多变化,比如汉藏语系中的汉语“我”没有性、数、格的变化。句子组成需要独立虚词和特定词序才具有语法意义。
至于说到智力,更确切的说应该是思维方式的差异。综合语具有严格的逻辑和结构,所以只要进行语义分析就可以理解了。而分析语语法较为灵活,没有严格的形态,所以多需要综合的跨度较大的思维。几千年来中国人更擅长于意象思维,而拉丁语系的欧洲由分析思维发展出来现代科学体系。
至于说汉字复杂具体,那是因为汉字兼具有词汇的成分,所以必然数量众多,又因为他是单音节的,无法通过音节变化来解决,所以只能是变化字形了。而拉丁字母确实少而简单,但字母跟汉字不同,如果要类比的话,倒可以跟偏旁部首类比。
有个很有意思的问题相比许多人都知道,就是一篇英文文章中所有长的单词保证首尾两个字母正确,哪怕是单词中有很多错误,也不大影响正常的阅读理解。这说明人类对文字的使用是很灵活的,文字表达的自由度仅仅受我们思维的约束。
实际上从历史上来看,语言的进化都是从综合语向分析语进化。古代汉语也有一些词根与前后缀,但现代汉语已经没有了,用“的”、“被”这类独立虚词来代替了。再一个例子就是英语正在由综合语向分析语发展的过程中。有些地方特别是口语中有摆脱严格语法特征的倾向。比如我们说 cat tail 而不说 cat’s tail,说 go home,也说 go to school. 没有见到过有人类语言从分析语向综合语发展的例子。倒是汉字中被一帮学者按照西方语言硬生生的区分开“的”“地”“得”,区分了“他”“它”“她”“牠”,甚至于直接造字。但注意这是文字的更改,语言上并没有任何变动,而且这是靠国家机器推行的。
实际上这种向分析语方向的发展正说明人类的思维更趋向于发达和复杂,基于共同的知识积累和文化,不需要非常形式化的词汇及语法要素既可以达到交流的目的。从另一方面来说,综合语因为具有严格的形式所以更易于机器(计算机)处理,但未必说明其优越。现在的计算机跟人类智慧比起来还是太弱了,处理不来复杂的语言。
从两类语言反映出来的人类思维的概念分析逻辑和想像综合两种思维模式都是并存和必须的,只是程度不同罢了。牛顿爵爷及以前的那个时代科学著作多是以拉丁文写的,因为拉丁文表达严格明确,而早期的英文还发展的不够。虽然拉丁语形式规范,但并不表示用它写不出优美的诗篇。而作为分析语典型代表的汉语也可以用于科学表述。
语言表示信息的基本要素是音节,文字只是这些要素的可视化符号。如果你的处理机足够智能,能够根据上下文区分相同或相近的音节,那么就可以使用相对较少的音节变化进行交流(如汉藏语系)。如果处理机比较简单结构清晰,不适合处理太多相同或相似的音节,那么就必须使用较多的音节变化来传递信息(如印欧语系)。
人类对语言的使用是趋于简化的,从发音和语素上都是。以英语的发音为佐证,英语的尾 辅音失爆弱读、单词连读(前一单词词尾辅音与下一单词词首元音)、俩元音间会加一个弱 辅音(如create的读法),都符合音节正在向一个辅音加一个元音的方式变化,这个发音模 式比较简单。汉语正式这种典型代表(声母加韵母)。
我得提醒你,文字是信息的载体,信息多少不是文字决定的,载体的复杂程度决定了存储 的复杂程度,要不计算机咋用2进制呢,存储最简单
信息多少确实跟文字没关系,是语言的音节决定的,并且与你能处理的相同或相似音节有关系。但计算机的例子显然不合适。虽然历史上不同的文明都曾使用过二、八、十二、十六、二十、六十四进制等等,但近代以来基本都改为了十进制,只有少数领域好保留其他进制。如前面有人说的,计算机只是因为当时只能造出两个稳态的电路来。如果任意个稳态的电路都可以很方便的实现的话,我敢说首选肯定是十进制。
实验表明,要表达一个完整的意思,比如文章中的一个段落,不同语言要表达完毕大概需要的时间差不多。但有些语言(如英语、日语等)却比另外一些语言(比如汉语)需要更多的音节变化,也就是说需要更快的语速。从信息论和通信原理上来理解,在码元状态(如只有 0、1两个电平)较少的情况下,需要提高波特率(即音节速率)来传递等量的信息,并且需要用多变的音节变化来对信息进行编码;说汉语的人的处理机(大脑)对等量的码元状态的变化解码和纠错能力强,所以需要相对较低的波特率。但不能说谁比谁的大脑发达,因为他们用的是大脑不同区域,用脑方式不同。
语言是语音交流的形式,而文字是其可视化反映。印欧语系借助于拉丁字母将其较多音节变化用词汇的形式表示进而组成句子,每个单词对应不同的音节变化(也有少数同音词)对信息进行编码。而汉语的一个音节对应一个汉字,同一个音节可以用多个汉字来对应表示不同的意思,效果上相当于增加了码元状态,所以平均说来可以使用较低的波特率。
你的意思是简单的存储方式反而不容易理解?
存储的方式与前面说的通信的原理是一样的。码元状态少对应高波特率,码元状态多对应低波特率通信,不同语言的平均比特率是差不多的。
那你就是说人类犯贱呗,越难记的越记得住
不能以计算机的体系架构去理解人脑的思维。现代计算机做的事对人来说仅仅是麻烦而不是困难,而以计算机的视角去看人类思维那绝对是困难的。让计算机去区分圆形的还是方形的物体,那是相对困难和麻烦的,而人类抬抬眼皮就给区分开了。计算机解起来“难”的事情,许多时候人类就是“贱”轻松就可以解决。
是个人就得承认汉语拼音比汉字好记,简体字比繁体字好记
汉语拼音虽然也可以跟汉字一样表示音节,对语言交流没影响,但对文字交流影响却很大。印欧语系的词汇因为对应其语言的音节多变,在视觉表示上提供了很多信息冗余(比如不同的字母组合可以有相同的发音),所以阅读的时候不需要每个字母都要看清楚,而写作的时候拼写错误也是很常见的,去问问欧美人经不经常写错单词就是了,计算机文字处理软件自动拼写检查那几乎是必备的功能。同样的道理,汉字在对应同一音节之上采用不同的字形提供了视觉信息冗余,阅读时也很容易获取信息。如果把“记”理解成能够写出来的话,那么英文与汉字难度都差不多,只是记忆所需的思维方式不同,所以作为非第一语言去学习的时候都会因为不习惯而感觉难。在不影响冗余度(易识别辨认)的前提下适当简化汉字或者英语单词是必要的,但不应该是草率的简化。而且简化字未必一定比繁体字好记,写的快是优势。
复杂,不是难
不难是真的。达到同样的程度,复杂度其实也差不多了,只是阶段性的学习曲线不同。有些真的只是善用的自己的头脑的过程。学习骑个自行车,要是用物理的手段去分析其动力学的话可是麻烦的很,甚至有点难度了。但大脑的综合思维与小脑的机体控制却做的很完美。以逻辑与分析的思维来看待这个世界,如果不做简化模型的话,随便一个东西都是巨复杂的,对多数人来说都有难度。同样在投机市场,有人在用技术分析,有人使用自己的经验与洞察力。