|
二、媒体用字用语状况
(一)国家通用语言媒体用字用语调查
汉字使用情况。本次调查全部语料中共出现了10 590个字种,覆盖率达到80%、90%、99%的字种数分别为593、957、2396个。媒体汉字的使用特点是:高频汉字使用稳定;在高频汉字中使用频率变化较大的汉字体现了年度用字特点,记录了社会生活;低频汉字数量大。
词语使用情况。全部语料中共出现了2 369 349个词种,覆盖率达到90%的高频词语有13 656个。高频词语使用了2732个汉字,其中有2658个出现在年度用字总表的前3000位高频汉字中。媒体词语的使用特点是:高频词语数量及高频词语用字数量较稳定,高频词语数量稳定在1万余条,高频词语用字数量稳定在2700个左右;高频词语中使用频率变化较大的词语体现了年度的社会生活。
2011年从国家语言资源监测语料库中提取出新词语594条,并将整理出版新词语编年本。
姓氏。在全部语料中提取出姓氏785个,其中单字姓 497个,二字姓 278个,三字姓10个。
推荐内容>>中国语言生活状况报告发布 2011"降生"594条新词
推荐内容>>2011年中国语言生活状况报告
推荐内容>>教育部:通缉令不宜用淘宝体 消除了司法严肃性
(二)中文博客语言状况
以新浪、网易和搜狐三家网站公布的名博列表中的用户发布的博客帖为调查对象,从发帖量、博客帖长度分布、不同性别博客用户语言使用状况等方面进行了调查和分析。
(三)藏文媒体用词调查
第一次对藏文的报纸、网络媒体词语的使用情况进行了调查。语料源自2010年度 4种藏文报纸的全部文本、3家网站的新闻报道,共计2 247 821词次,31 403个词种。对全部语料覆盖率达到90%的词种数是2326个。
|