失衡的天平:科技产品与中国人的日常生活(T调查2017)
上QQ阅读APP看书,第一时间看更新

三、研究方法

(1)基于大数据的文本分析

本次研究的数据源主要包括新浪微博和今日头条,并以微信公众号作为补充,监测时间段为2016年11月1日-2017年10月31日,收集数据一级空间大小为8,422,195条。

本研究中基于大数据的文本分析的主要思路是:通过数据处理和自然语言分析技术,将中文的语句切成各个有意义的词组,再与词库匹配寻找词组的含义。然后通过文字联想&关系建立——机器学习训练——评估,进行态度分析与词义聚类。

(2)传统问卷调查

本次问卷调查通过电话访问与网络调查相结合的方式形式进行,共发放网络问卷3000份,经系统甄别和人工审核后,共回收有效问卷2051份,问卷有效回收率为68%。

(3)焦点小组与深度访谈:

本研究在两个阶段采用了深度访谈,第一阶段,在问卷制定阶段,通过对9人预访谈,和焦点小组为问卷的初稿提供意见;第二阶段,基于对年龄、性别、学历和居住地(城市/村镇)的初步配额,选择了16人进行深度访谈,为量化结果提供一定程度的阐释。

(4)专家评估:

本次研究在问卷设计阶段采用专家评估法对态度与关注度测量的对象进行修正。