本书根据《中国青年报》发布的“全国普通高校微信公众号综合影响力排行榜TOP100”,选取 2021 年一年内共 44 周排行榜的有效数据,筛选出每周都在榜单内的高校,得到 16 个研究样本,它们分别为:清华大学、北京大学、浙江大学、上海交通大学、华中科技大学、武汉大学、四川大学、南开大学、厦门大学、天津大学、郑州大学、华南师范大学、哈尔滨工业大学、北京科技大学、湖北大学、扬州大学。 这一样本选取结果分为两个层面进行解读:
(1)整体来看,微信公众号一年内都稳定在综合影响力前 100 的高校仅有16 所,说明排行榜的数据波动较大。
(2)比较每所高校的情况来看,研究样本中的 16 所高校在排行榜中的位置参差不齐,表明高校微信公众号综合影响力之间差异显著。笔者根据 47 周的排行榜数据,对 16 所高校在排行榜中所处的位置进行了整理,大致划分为以下三个等级:
①位置常出现在前 20 的高校:清华大学(均进入前 10)、北京大学(均进入前 10)、武汉大学(均进入前 10);
②位置常出现在前 40 的高校:上海交通大学(均进入前 40)、浙江大学(除 1 周之外均进入前 40)、四川大学(除 1 周之外均进入前 40)、华中科技大学(除 4 周之外均进入前 40)、华南师范大学(除 2 周之外均进入前 40);
③位置波动幅度较大的高校:南开大学(最好排第 7,最差排第 92)、厦门大学(最好排第 1,最差排第 97)、天津大学(最好排第 6,最差排第 90)、郑州大学(最好排第 6,最差排第 66)、哈尔滨工业大学(最好排第 4,最差排第89)、北京科技大学(最好排第 4,最差排第 72)、湖北大学(最好排第 2,最差排第 80)、扬州大学(最好排第 7,最差排第 90)。
进一步对上述 16 所高校微信公众号的推送信息进行抓取,全部数据收集时间段为 2021 年 1 月 1 日 0 时至 2021 年 12 月 31 日 24 时止。 这一时间段与选取的榜单数据相吻合,且为完整的一年,跨度和连续性均有保障。
本研究是对高校传播策略的探索性研究,笔者将统计工作总结为以下三个方面:微信推文数据和文本的采集、数据的处理及分析、文本的处理及分析。根据需求,本书选取了以下软件进行统计分析。
因本研究需统计的样本数量较多,时间跨度较大,因而笔者选择直接购买孤狼工作室的微信热门文章采集器(软件界面如图 2-1 所示),对 16 所高校微信公众号 2021 年的微信推送数据和文本分别进行采集和抓取。
图2-1 孤狼工作室出品的微信热门文章采集器操作界面
就数据层面而言,微信热门文章采集器可以对微信公众号指定时间段内推送文章的阅读数、点赞数、发布位置、发布时间进行抓取;就文本层面而言,微信热门文章采集器可以对微信公众号指定时间段内推送文章的标题及内容进行抓取。保存形式包含TXT、XLS、HTML、MDB等格式,可自由选取,便于之后的数据、文本处理与分析。
对于采集到的微信推文相关数据,本研究采用微软办公系统中的数据处理软件Excel进行统计分析。数据录入Excel后,以合适的图表形式,一方面呈现各类指标的分布与变化,辅助深入分析与探讨的进行;另一方面合并展示多个研究对象的指标,以便执行比较研究的操作。
对于采集到的微信推文相关文本,本研究选取武汉大学编码研发的用以辅助人文社会科学研究的内容挖掘软件ROST CM6(软件界面如图 2-2 所示),分别对研究对象的微信推文标题和内容进行处理。
图2-2 内容挖掘系统ROST CM6 操作界面
本书在对采集到的文本进行语义网络分析时,通过ROST CM6 软件的功能性分析,并结合可视化软件,完成如下三步操作:
(1)对文本进行分词,生成分词后的TXT文件;
(2)对分词后的文本进行词频分析,生成高频词列表,并结合在线词云生成工具Tagxedo Creator对词频分析结果进行呈现;
(3)对分词后的文本进行语义网络分析,并结合可视化软件NetDraw呈现关键词之间意义关系的分析结果。