|
[李宇明]六、关注国际语言生活中国正在走向世界,我们正在研究世界、认识世界,去年对国际语言生活特别关注,我们要了解世界的语言生活状况,要借鉴它的经验,要避免它的失误。去年国际上语言问题还是比较多的,比如比利时现在因为语言冲突,政府危机还没有解决,比利时政党都是语言政党,是以语言来划分政党的,主要是南部的法语区、东部的德语区,在布鲁塞尔是一个双语区。在加拿大,他们非常重视华人语言的教育,把华语叫做华人语言遗产。在美国出现了重要的语言政策的转向,美国对内是加强英语,对外加强外语学习,制定了很多他们认为对国家很重要的关键语言,有十几种,要学得好可以加工资,比如说外交官、安全部门等等。另外,美国还有一个全球语言监测机构,监测全球出现的新词语、新事件。将来大家看我们正式出版的《2010年中国语言生活状况报告》参考篇,这里面会介绍更多情况。
[李宇明]七、媒体用字用语调查这部分是我们国家语言资源监测研究中心做的,下面有几个分中心,平面媒体语言分中心、有声媒体语言分中心、网络媒体语言分中心、教学教材语言分中心、少数民族语言分中心,还有海外华语研究中心。主要的语料来自于报纸、广播电视和网络新闻,我们把它叫做媒体用字。整个语料是天文数字,十亿多汉字词。去年在媒体上出现的汉字是一万多个,其中覆盖90%的字是972个,词总数(词次)共出现了6亿多,因为词有相同的,一个词是一个词的是217万多个,其中很多是专用名词,人名、机构名等等。基本的规律是,高频词是很稳定的,一般覆盖到99%的语料用字用了2431个字,跟2009年相比差不多,2009年是2400个。
[李宇明]所以我们说,汉字的使用,基本上数量是稳定的。词语覆盖90%的高频词数量基本稳定在1万条左右。在这1万条词里,用字是2700个。所以,这些年来我一直在新闻发布会上说,学习汉语不难。掌握好汉语也就是千字万词,掌握一千个字,掌握一万个词,读我们汉语的新闻,就能读到90%了。所以,千字万词这个规律从2006年的统计里就发现汉语这样的一个规模和状况,这也说我们的统计调查是很有用处的。当然,在高频的汉字里、词语里,有一些字一些词的变化比较大,主要是当年的语言生活变化比较大,比如说字里进入高频字的有玉、树、世、博,主要和玉树地震和世博会有关系,通过这些字词的变化,可以看到去年我们的语言生活。另外一个特点,由于上网的人数多了,媒体关注面多了,信息来源多了,因此,高频字高频词虽然稳定,但是低频的字和词范围在扩大,刚才我说了,字去年是用了一万多字,这是比较多的,过去是用八千多字。
[李宇明]去年产生的新词语,比较稳固的是五百条,这五百条新词语当中,按照词语的长度非常有意思,三音节词占52.8%,然后是四音节词,最后才是双音节词。我们知道,古代汉语是以单音节词为主,到了近代汉语,汉语开始双音节化。现代汉语以双音节为主。但是近年来我们发现新造词三音节比较多,今后汉语词汇面貌会不会发生大的变化,我们拭目以待,我打了一个问号。在构词方式上,偏正式构词是最多的,有两个例子,一个是“潮丐”,一个是“慢城”,我查了一下,“潮丐”是一个很流行的乞丐,“慢城”是从意大利开始的一种新的生活方式,他们觉得世界的节奏太快了,它希望增加人的幸福指数,提倡慢城市生活,现在大概有30多个城市加入了“慢城”系列。另外,用一些熟悉的东西构词,比如说“犀利哥”、“章鱼哥”、“某某姐”、“羊羔体”等等。新词语也是这样,使用最高的词和使用最少的词都是比较少的,两头小中间大,频率特别高和频率特别低的词都比较少,也许这里面都有诸位的功劳。
[李宇明]今年我们还调查了一些媒体里面出现姓氏的情况,在我们语料里,有将近70万个不同的姓名,这70万个不同的姓名当中,出现的姓是752个,其中单姓492个,双字姓250个,三字姓10个。有一些2字姓和3字姓是外来的,我们知道日本有这个姓。(图)这是排在前100位的单姓,王、张、李、陈、刘、黄、周、杨、赵、吴排在前十名。出现的二字姓有20个,欧阳、诸葛、司马等等。当然,这个不能完全反映我们的人口状况,因为很多新闻媒体报道的是新闻事件出现的情况。
|