网络流行语嬗变与审视
上QQ阅读APP看书,第一时间看更新

1.5 语料来源及选取标准

由于网络传播环境的复杂性与多样性,使得网络流行语的择选方式很难统一。随着网络技术的进步,互联网的应用日新月异,媒介产品推陈出新,网络流行语的载体更新频繁,使得网络流行语语料的选取标准呈现出多元化与不规范化,在学术研究中也表现出很大的随意性。考虑到语料收集的客观性与科学性,本书研究所使用的语料来源主要来自以下三个方面。

1)已有文献

主要包括有关网络流行语的词典、专著、论文、统计报告及语料库。词典方面包括《网络时尚词典》《中国网络语言词典》《最新网络交际用语辞典》等中关于网络流行语的部分,还包括北京康世经济发展研究所编辑的《网络流行语》(内蒙古人民出版社,2001年4月)、成蕾主编的《网络流行语》(机械工业出版社,2004年4月)以及王骁炜主编的《实用网络流行语》等。专著方面包括上文已述的《网络语言概说》《网络语言》《网络语言研究》等论著中收集的网络流行语。论文方面包括与网络流行语、网络热词相关的学术期刊论文及硕博士论文中提及的网络流行语。报告方面包括教育部发布的《中国语言生活状况报告》(2005—2013)在中文网络用字用语专项调查中统计出的高频网络用字用语、喻国明主编的《中国传媒发展指数报告》(2008—2013)、《中国社会舆情年度报告》(2010—2013)中涉及的网络流行语部分。语料库方面主要参考教育部语言文字信息管理司与华中师范大学建立的“国家语言资源监测与研究中心网络媒体分中心”有关网络流行词的数据库以及上海交通大学新媒体与社会研究中心在建的网络流行语词数据库中的资料。

2)网络流行语的评选与发布

目前网络流行语的评选与发布主要来自三类主体:媒体(门户网站、网络社区)、学者或学术机构、普通网民。影响较大的有学术机构评选的“中国主流媒体十大流行语发布”和“十大网络流行语发布”。国家语言资源监测与研究中心自2002年首次发布主流报纸流行语以来,一直对主流媒体流行语进行跟踪监测和发布。近年来《南都周刊》《北京晚报》《咬文嚼字》编辑部、搜狐网、互动百科等主流媒体以及天涯论坛、人人网、新浪微博等网络社区也纷纷评选出年度网络流行语排行榜。其中较为科学的评选方式如互动百科主要依据用户浏览数和网民投票评选出年度网络流行语;天涯社区根据网民提名,先遴选出一部分网络流行语作为备选,再通过投票的方式确定每年的十大网络流行语;汉语盘点则经过网民推荐、专家评审、网络投票等过程来进行评选。还有很多热心网民从自身的感悟出发,整理出形形色色的年度网络流行语,散见于论坛、博客、贴吧等网络空间。

3)动态语料搜集

在已有文献和年度评选的基础上,从BBS、博客、贴吧、跟帖、社交网站、微博等不同媒介载体上采集网民广泛运用的网络流行语进行语料补充和完善,也是十分必要的一种手段。BBS包括人民网强国论坛、西祠胡同、新华社区论坛、天涯论坛、猫扑论坛等;博客包括新浪博客、天涯博客、搜狐博客、腾讯QQ空间等;贴吧主要指的是百度贴吧;跟帖包括网易新闻跟帖以及优酷、土豆、搜狐视频、乐视网、爱奇艺等视频网站跟帖;社交网站包括开心网、人人网、朋友网、豆瓣网等;微博包括新浪微博、搜狐微博、腾讯微博等,以新浪微博为主要搜集对象。此外,对于手机短信、微信朋友圈里广泛使用的网络流行语,也进行了动态采集。

以上语料来源已基本涵盖各样式的网络流行语,但由于语料的过于庞大和芜杂,我们还需要以一定的标准进行择选。运用百度指数的搜索指数和新闻指数功能,可以较为直观地显示研究对象的活跃程度。具体操作上,遵循以下三个原则进行语料筛选。首先,研究对象在一定时间范围内被关注的程度要有显著的上升过程,并且上升的速度较快。其次,研究对象的上升过程需具有一定的“绝对高度”,即出现的次数较多。最后,研究对象的上升过程到一定高度后,需保持一段被关注的时间。在此基础上,通过对网络使用者的访谈,从网民的主观印象和流行语的使用频率等方面进行综合考量,得出本书所需要的语料样本。