国家形象:“一带一路”与品牌中国
上QQ阅读APP看书,第一时间看更新

基于LDA的“一带一路”国家品牌形象传播与主题模型计算的实证研究(1)

段淳林(2) 吕 笑(3)

【摘要】 移动互联网和智能终端的普及带来了传播方式的变革,从而使生成和传播中国品牌形象的信息形式更加丰富和多元化。运用LDA(Latent Dirichlet Allocation)主题模型整合政治营销传播理论,进行数据深度挖掘,对社会化媒体上有关“一带一路”的网络舆情及群体态度进行情感计算。实验发现,“一带一路”倡议驱动开放包容、肩负责任、推动世界和平的国家品牌形象构建,成功实现国家品牌形象转换。

【关键词】 LDA、一带一路、国家品牌形象、政治营销

2016年9月21日,新华网发布的重要文章——《“一带一路”:习近平打开的“筑梦空间”》——成功掀起了“一带一路”倡议发布以来的新高潮。截至2017年5月10日,该文章在今日头条上的阅读指数达到15 123 520,这意味着许多人对“一带一路”倡议之初的心存疑虑成功转化为广泛的响应和支持。“一带一路”作为中国在21世纪采取的重大策略,参与主体的认知和评价,直接影响传播效果的评估。对此,本文从数据挖掘的角度入手,尝试运用LDA(Latent Dirichlet Allocation)主题模型进行深度情感计算,从网络舆情监控延伸到实体空间计算国家品牌形象的构建,探索中国国家品牌形象构建与传播的现状,并就中国国家品牌维护与升级提出借鉴性意见。

一、“一带一路”倡议与国家品牌形象构建

“一带一路”贯穿亚欧非大陆,一头是活跃的东亚经济圈,一头是发达的欧洲经济圈。“一带一路”作为中国面对全球化时代挑战的伟大布局,无疑是塑造并传播“负责任”大国形象的关键之举。

(一)国家品牌形象

作为世界上最早研究国家品牌形象的学者,安霍尔特在1996年提出国家品牌(National Brand)概念。他认为国家声誉与公司或产品的品牌形象一样,品牌管理方式和内容不尽相同,如果能够运用智慧来使用品牌管理技术便可以使品牌更具竞争力。也有学者将整个国家看作一个整体,代表的是国家的无形资产,与特定的产品没有关系。笔者认为,国家品牌形象的构建一定是基于一定的产品来实现的,是一个建立在政治产品、文化产品、经济产品以及公共产品等多元化产品基础之上的复杂综合体,由此延伸出的政治品牌形象、经济品牌形象以及文化品牌形象等直接驱动国家品牌形象的实现。

(二)“一带一路”倡议的双重属性

2013年9月,中国国家主席习近平出访中亚和东南亚国家,在此期间,先后提出共建“丝绸之路经济带”和“21世纪海上丝绸之路”的重大倡议,简称为“一带一路”,这是中央领导人在古丝绸之路概念的基础上提出的全新构想。作为中国为应对全球化挑战提出的重要倡议,“一带一路”具有公共产品和政治营销传播策略的双重属性。

1. 公共产品

公共产品(Public Good)是与私人产品相对的,英国哲学家、历史学家休谟最早明确阐述公共产品的公共性特征,他在《人性论》一书中用草地排水的例子对公共产品的公共性特征加以分析,并认为公共产品具有私人供给困难的特征。马尔科的《公共财政学基本原理》的出版,使得作为西方经济学用语公共产品被广泛认知。简单来说,公关产品是指具有消费或使用上的非竞争性和受益上的非排他性的产品,其本质是指能为绝大多数人共同消费或享用的产品或服务。“一带一路”通过双边合作,开展多层次、多渠道沟通磋商,惠及欧亚,辐射40多个国家,覆盖30多亿人口,从而共同面对全球化时代的挑战。可以说,共建“新丝绸之路”作为国家公关产品,是中国政府构建“负责任大国”品牌形象的一剂“强心针”,直接推动了中国国家综合国力的提升与国家品牌形象的传播。

2. 政治营销传播策略

“一带一路”倡议的提出,一开始就肩负着政治营销传播的重任,这也是“一带一路”倡议的第二重属性。“政治营销”一词是由美国学者斯坦利·凯里在1956年出版的《专业公共与政治权力》一书中首先提出。凯里认为,政治家必须采用劝说与说服的方式——借助营销的理念和工具,才能赢得广大民众的支持。同样的,从国家领导人政治竞选的路径中延伸到整个国家品牌形象的构建领域,将国家作为一个组织主体运用营销手段传播国家品牌信息,能够有效实现国家品牌形象构建。简单来说,政治、经济、历史和文化等维度是影响国家品牌形象构建的复杂变量,在此基础上实施的“一带一路”倡议是围绕国家本身所进行的,其一系列传播设计和路径构想都成为国家品牌形象塑造的重要因素。

二、基于LDA“一带一路”倡议的主题模型计算

本研究的一大特点就是运用大数据研究方法,实现情感计算。首先,通过数据获取模型抓取社会化媒体上的大量数据,建立分析数据库,并在此基础上通过文本分析、统计分析、仿真分析等后期数据处理方法进行加工提炼,从而达到理论建构与对策研究的有机结合,保证结合实际来分析问题,提出更具操作性的政策建议。其次,动态模型计算是本研究另一大突破点。本研究通过建立LDA主题模型进行分类,获得民众心目中道德评价和情感认知的总和,以发现其中有价值的热点信息,借此评估“一带一路”倡议的价值,从而促进国家政治营销策略转型升级。

LDA(Latent Dirichlet Allocation)作为一种文档主题生成模型,也被称为三层贝叶斯概率模型,是由Blei,David M.、Ng,Andrew Y.、Jordan于2003年首次提出。三层贝叶斯主题模型主要通过无监督式学习,挖掘文本内在的主题分布,从而达到以无监督方式提取给定文本的隐含语义(即主题或概念)的目的。

(一)LDA模型原理

要完全理解LDA主题模型就要先了解文本语义分析。在计算机学领域,语义(semantic)是指数据本身承载的含义以及这些含义之间的关系,是数据在某个领域上的解释和逻辑表示。换句话说,数据作为一种符号本身没有任何实用价值,只有被赋予特定含义的数据才能够被使用,从而转化为有价值的信息,而驱动数据转化为信息的特殊含义就是语义。在此基础上发展而来的文本语义分析就是指识别文本的意义、主题、类别等语义信息的过程。作为自然语言理解的根本问题,它是指通过分析文本自身固有词项(Term)的特征来发现文本的主题(Topic),如图1所示。

图1 LDA主题模型计算原理图

在介绍LDA主题模型计算流程之前,我们需要对参数进行一定的说明:

K:主题数

M:文档总数

T:词项

Nm:第m个文档的单词总数

:每个主题下词的多项式分布的Dirichlet先验参数

:每个文档下主题的多项式分布的Dirichlet先验参数

LDA文档生成模型认为,每一篇文章Mi的每一个词Ti都是通过“以一定概率选择一个主题Ki,然后再在此主题中以一定概率选择某一个词项Ti”如此重复的过程获得的。假设文档下的主题满足多项式分布,主题下的词项满足多项式分布。基于此原理可以推出,主题的概率分布构成了文章,词项的概率分布构成了主题。

若要对上述文档主题的多项式分布参数进行求解,我们通常会采用Gibbs抽样法。Gibbs抽样法在本质上归属于马尔科夫链蒙特卡洛算法,是随机模拟抽样算法中的一种。Gibbs采样需要知道样本中的一个属性在其他所有属性下的条件概率,然后利用这个条件概率来分布产生各个属性的样本值。基于此,在LDA主题模型中为待求参数向量,对于每一个待求概率向量,运用Gibbs抽样法每次选取该向量的其中一个维度,固定其他维度抽样当前维度。照此方式不断迭代,直到出现参数收敛时输出结果,具体过程如下:

(1)初始化,为文章中的每一个词随机分配主题z(0)

(2)对于文档中的每一个单词t,统计每个主题z下出现t的次数以及每个文档m中出现主题z的次数,根据Gibbs更新法则计算词到主题的概率分布,根据该分布重新估计单词t属于各个主题的概率分布ρ。

(3)根据ρ执行概率抽样为单词t重新分配主题z(1)

(4)最后,判断是否达到最大迭代次数或概率分布是否收敛,是则输出分布参数结果,否则更换下一单词t,返回第二步重新进行计算。

(二)LDA模型相关应用分析

网络舆论土壤的肥沃催生了巨大的文本信息积累,利用自然语言处理方式挖掘其背后的价值显得至关重要。LDA作为一个文本主题模型,有别于传统的文本层次上的模型,它可以更好地发现文本信息中潜藏的语义信息,故在文本分析挖掘领域自然有着广泛的应用,总体来说可以分为文本聚类和文本分类两大类。

1. 文本聚类

舆情文本通常出现在各类文章新闻的社评之中,将大量的社评文本按照语义主题进行归类,从而为舆情判断提供强有力的决策支持。传统模式下,我们通常采用TF-IDF算法来将文本映射到向量空间,但此种方法存在仅从词语维度进行考虑的局限。LDA将传统的文本向量化推向语义维度。LDA可将文本转化为关于主题的特征向量,在此基础之上,结合传统的TF-IDF向量以及机器学习聚类算法,最终达到对舆情文本聚类的目的。

2. 文本分类

文本分类是指根据给定文本呈现的特征,对其所属类别进行预测判断,该举措可以有效实现文本的归档,并提高文本的检索效率,包括垃圾邮件识别、网页分类、个性化新闻推荐等众多领域都应用了文本分类方法。学者刘海旭在对文本分类应用进行了探索的基础上,提出了利用LDA所包含的主题模型,通过挖掘文本隐藏的主题特征,在辅以PCA对特征进行降维,最终利用提取的文本特征训练SVM分类器用于文本分类。该研究同时表明,LDA模型提取的文本特征可以显著提升文本分类的准确率和召回率。

(三)“一带一路”社交媒体数据样本采集

本文用于研究的数据一部分来源于自主采集,对象为社会化媒体包括腾讯新闻、知乎、Facebook,Instagram;另一部分数据由今日头条与华南理工共建的国家品牌大数据实验室提供。数据来源包括三家国内社交媒体,两家国外媒体,从而保证了实验结果更加真实有效。经过数据抓取、数据清洗后,本研究共获得5 218条有效数据。

数据来源自主采集流程如图2所示,首先以“一带一路”“丝绸之路经济带”和“21世纪海上丝绸之路”为关键词,通过爬取网络上包含媒体数据的相关网页实现进行本地存储,随后利用计算机程序筛选抽取网页评论区评论内容实现评论数据抽取,最后,将抽取的评论信息进行重新编排,生成格式化存储xml文件实现评论数据的格式化保存,以便投入计算。

图2 “一带一路”数据采集流程

(四)基于LDA的“一带一路”主题模型计算

数据采集完成之后,开始“一带一路”媒体数据主题模型构建工作,其构建过程包括媒体数据载入、中文分词处理、文本TF-IDF向量化处理、LDA模型拟合、获得主题及关键词五个部分,如图3所示。

图3 “一带一路”媒体数据主题模型构建过程图

从“一带一路”媒体数据主题模型构建过程图可以清晰看到整个模型构建过程。首先,通过媒体数据载入,加载采集已经经过预处理的格式化“一带一路”用户评论数据。然后使用结巴分词库对评论数据进行词语分割实现中文分词处理,从而使得每一条评论被分割为零散的词语集合,在此基础之上使用文本TF-IDF向量化处理将每一条评论数据转化为由l×d个实数表示的特征向量。假设我们共有n条评论数据,那么将会产生一个n×d的特征矩阵,以供后续处理。然后将文本特征矩阵作为输入放入LDA拟合算法中,进行LDA模型拟合操作。根据拟合完成的LDA模型输出媒体评论数据的主题分布及其相对应的关键词,至此,整个基于LDA“一带一路”倡议的主题模型计算已全部完成。

三、“一带一路”倡议有效驱动国家品牌形象构建

经过LDA主题模型计算后发现,社会化媒体上的用户对“一带一路”倡议的关注点主要集中在8大主题(如表1所示)。我们根据每个主题中的关键词的热度指数进行降序排列,然后对每一组网络舆情文档集中的关键词按照语义划分,得到由语义相关的词表达的若干个隐含主题,基于此,将8个主题整理成抽象概念:公众态度、民族自信、军事、经济、全球化、国家领导人、区域发展、旅游。通过对比8大主题发现,主题6的热度指数最高达到了3 006(如表2所示),热度占比达57.6%(如图4所示),这意味着,“一带一路”作为中国国家领导人面临全球化时代的宏观决策获得高度的支持与拥护,也从侧面证明,“一带一路”的实施对整个国家品牌形象建设起到积极的促进作用。基于对实验结果的深度分析,我们发现“一带一路”成功地推动了开放包容、肩负责任、推动世界和平的国家品牌形象。

(一)开放包容的国际形象

实验发现,“全球化”“区域发展”“旅游”等主题成为人们关注的热点,主题指数热度分别达到了199、158、157(如表2所示)。与此同时,各大主题也分别出现对多个国家、多个地域共同发展的关注,“新疆”“珠三角”“柬埔寨”等地域关键词也充分表明,在“一带一路”构想下,不管是内陆腹地还是沿海区域都相互联系、借鉴、支持。与此同时,“一带一路”沿线国家也成功加入相互融合与特色发展的行动中,此种格局成功地为中国发展开放多元、包容的文化提供了传播的土壤。美国学者托马斯·麦克费尔认为,在传播领域内,对于全球大赢家来说,战略性计划就是“全球性”计划,而不是“国家”计划。很显然,“一带一路”倡议的提出也是党和国家在全球化时代提出的全新“全球化”计划。通过“一带一路”,将沿线国家的多元文化吸纳进来,同时,又将中国博大精深的文化传递出去,开启跨文化传播的成功实践。

表1 “一带一路”LDA主题分布

表2 LDA主题热度分布表

图4 LDA主题热度比重图

(二)推动沿线国家经济共同发展的负责任大国形象

国家经济品牌形象依赖于中国的产品而实现。《网上丝绸之路大数据报告》显示,阿里巴巴旗下全球速卖通平台“一带一路”国家和地区消费者占比45.4%。2016年,以跨境电商形式进行的进出口交易达到6.3万亿元人民币;2017年突破7万亿元人民币;2018年可能达到8.8万亿元人民币。由此可见,通过“一带一路”倡议成功地将国内自主产品品牌推向海外市场,发展了国家经济。“一带一路”倡议一直倡导企业深度参与。除了欧美等传统“海淘”热门市场外,“一带一路”沿线国家和地区的商品逐渐成为热捧对象,从LDA主题模型计算结果可以发现,经济(占比3.9%)、区域(占比3.8%)、全球化(3.03%)、旅游(3.01%)等成为国内外关注的焦点,这也从侧面印证了“一带一路”倡议的实施对中国国内外经济发展带来的变化。

(三)促进世界和平发展的大国形象

中国作为迅速发展和崛起的国家,国际社会对中国形象充满了矛盾。一方面,聚焦于中国崛起带来的威胁,国际上掀起“中国威胁论”;另一方面,国际上对中国发展过程中出现的冲突信息也感到不解,于是一部分学者唱起“中国崩溃论”。在西方政治话语中,一个国家的崛起,就意味着权力转移和霸权交替。中国的现实主义学派代表阎学通倾向于将“崛起”解释为:“新兴大国实力与其他强国的差距迅速缩小,或者超过其他强国。”所以,“崛起”意味着后进国家的赶超过程。新自由制度主义者从现存国际体系的改变方面论述国家崛起的影响。国家实力的增长会导致权力的重新分配,最终会促使现存体系内部的变革,所以,从国际政治的理性主义视角出发,当一国处于权力上升阶段时,本身就有了对别国构成威胁的必要条件。因此,崛起国家一定会带来“挑战”、起到“破坏者”作用的观点在国际学术界非常流行,从而演化为米尔斯海默所说的“大国政治的悲剧”。在LDA主题分类中也可以看到,主题2及主题4中出现了“我们”“共同”“发展”等热点关键词,也表明,此次和平发展之举受到了更多的支持和拥护,从而加速了构建促进世界和平发展的大国品牌形象的进程。

图5 “一带一路”主题词词云

通过实验分析发现,“一带一路”倡议从政治、经济、文化三个方面驱动国家品牌形象的构建与传播,成功塑造了开放包容、肩负责任、推动世界和平的中国国家品牌形象。

四、基于“一带一路”倡议的国家品牌形象维护与升级

学者曼海姆(Jarol Manheim)曾经提出了非常著名的“国家形象转换模式”理论。该理论以能见度(Visibility)和评价(Valence)这两项指标来说明当国家形象转换时的运转和发展历程。其中,“能见度”按照媒体报道的多少来区分高低,而“评价”则代表报道内容的正负态度。当国家品牌形象的传播被大数据、互联网乃至移动互联网重塑的同时,我们需要从内在机理的角度梳理国家形象转换路径的嬗变。也就是说,在数字化环境下,“能见度”以用户参与并创造内容的多少来区分高低,而“评价”则由用户态度决定正负,因此,依据这两个赋予新内含的指标,我们可以划分出四个象限,再由这四个象限组成一个新的国家品牌形象发展转换图(如图6所示)。

图6 国家品牌形象转换路径模式图

通过图6可以发现,处在第二象限(A)阶段的国家形象最差,完全没有建立国家品牌形象,相应的,从第三象限(B)到第四象限(C)再到第一象限(D)的形象转换过程就是国家品牌形象建立的过程。经过前面的实验分析发现,当前中国已经建立了开放包容、肩负责任、促进世界和平的大国形象,成功转换到第一象限,但值得注意的是中国国家品牌构建工作远没有停止。新的媒介环境的变化会促使国家品牌形象也随之改变,要继续维护中国良好的国家品牌形象还有很长一段路要走,必须继续在政治、经济、文化等各个领域继续发力,负面形象的改善与正面形象的丰满必须同时抓住,只有这样才能实现中国国家品牌形象的升级,从而使中国国家品牌形象永远维持在第一象限。

总之,“一带一路”是中国为应对全球化时代挑战作出的关键抉择,也是中国国家品牌形象构建的重要之举。在复杂的互联网媒体环境下,这一倡议面临机会与风险的双重冲击,而时刻关注传播效果是实现策略调整和升级的重要影响因素,要评估实施效果用户态度无疑包含着巨大的价值,基于此,明辨发展方向就显得尤为重要。未来,“一带一路”倡议还将继续关系着国家品牌形象的构建,我们要通过数据挖掘与情感分析来实时实现调整与策略升级。

参考文献

[1] 匡文波,任天浩.国家形象分析的理论模型研究——基于文化、利益、媒体三重透镜偏曲下的影像投射.国际新闻界,2013(2).

[2] Fan. Y. Nation Branding. What is Being Branded. Journal of Vacation Marking, 2006, 12(2): 5-14.

[3] Ying Fan. Branding the Nation. What is Being Branded? Journal of Vacation Marketing, vol. 1, 2006. p. 10.

[4] [英]大卫·休谟.人性论.贾广来译.北京:商务印书馆,1997,578、579.

[5] 1877年德国地理学家李希霍芬最早提出“丝绸之路”,人民网,http://culture.people.com.cn/n/2014/0401/c172318-24795711.html.,2014.04.01,2017.05.23。

[6] [美]布鲁斯·埃·纽曼.营销总统:选战中的政治营销.张哲馨译.上海:上海人民出版社,2007,100~120.

[7] David M. Blei, Andrew Y. Ng, Michael I. Jordan. Latent Dirichlet Allocation. Journal of Machine Learning Research, 2003(3): 993-1022.

[8] 秦春秀,祝婷,赵捧未,张毅.自然语言语义分析研究进展.图书情报工作,2014(22).

[9] 王少鹏,彭岩,王洁.基于LDA的文本聚类在网络舆情分析中的应用研究.山东大学学报:理学版,2014(49).

[10] 刘海旭.基于PCA和LDA的文本分类系统设计与实现.北京邮电大学硕士学位论文,2013,15~18.

[11] [美]托马斯·L.麦克费尔.全球传播理论、利益相关者和趋势.张丽萍译.北京:中国传媒大学出版社,2016,56.

[12] 推动共建丝绸之路经济带和21世纪海上丝绸之路的愿景与行动.新华社,http://www.mnw.cn/news/china/878066.html,2013.3.28,2017.5.23.

[13] 闪耀“一带一路”的中国品牌.一带一路进行时,https://mp.weixin.qq.com/s/1DX3NDAao1xW9QKRrP66qA,2017.05.15,2017.06.02.

[14] 任东来.大国崛起的制度框架和思想传统——以美国为例的讨论.战略与管理,2004(4).

[15] [美]约翰·米尔斯海默.大国政治的悲剧.王义桅、唐小松译.上海:上海人民出版社,2008,78~105.

[16] Jarol B Manheim. Strategic Public Diplomacy and American Foreign Policy: The Evolution of Influence. New York: Oxford University Press, 1994, p. 134.


(1) 本文主要内容已发表在《现代传播》2018年1期。

(2) 段淳林:华南理工大学新闻与传播学院教授。

(3) 吕笑:华南理工大学新闻与传播学院研究生。