购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

2.1.1 基于用户特征的用户画像

近年来,一些学者成功地将用户画像引入健康医疗领域,通过构建用户画像模型探究不同用户群体特征上的差异。目标画像群体既包括老年人、大学生等重点健康关注群体,也包括糖尿病、抑郁症、AIDS等慢性疾病患者(王若佳等,2022)。

2.1.1.1 不同用户群体的用户特征研究

根据中国发展基金会发布的《中国发展报告2020:中国人口老龄化的发展趋势和政策》,我国在2022年正式进入老龄社会,人口老龄化所带来的问题在社会上引起了广泛的讨论。老年群体作为易识别的数字贫困群体,是数字化转型治理的重点对象(匡亚林,2022)。LeRouge等(2013)基于以患者为中心(Patient-Centered)的模式,构建了糖尿病老年患者群体的用户画像,探究城乡老年群体的特征差异,在此基础上改进了智能手机应用程序的设计和开发。研究表明,城市的老年群体会定期进行糖尿病护理,他们更有可能在家中使用血糖仪测试血糖水平,农村的老年群体只有在并发症变得严重时才去看医生,他们更倾向于依靠个人感觉和症状评估其血糖水平。总的来说,城市的老年用户比农村的老年用户更愿意使用智能手机获取健康信息。同时,二者也具有一些共有的特征,例如大都为空巢老人、乐意学习如何使用记忆辅助工具、了解调整生活方式以控制糖尿病的必要性、认为糖尿病管理很麻烦、患有并发症等,他们都希望社区医院有更好的医疗质量,有更多的健康特定的社区资源可以利用。Li和Tang(2020)基于老年护理专业知识,提出了智能老年护理框架(Framework of Smart Geriatric Nursing),其中包括基于用户画像对老年用户进行心理健康智能护理,最终得出了老年群体的用户特征,包括性格特征、退休前后的爱好、教育水平以及职业状况等。

随着经济的迅速发展,生活和工作压力也在不断攀升,年轻一代也常常出现健康问题,健康信息不再只是老年人日常关注的事情,青年人也开始关注养生保健、疾病预防及身体不适时的线上线下就医信息等(李颖等,2016)。高校大学生群体作为当代社会青年的重要组成部分,具有高学历的背景,他们往往会通过网络去搜寻和获取知识。构建在线健康社区大学生用户群体的画像模型,能够协助平台管理者了解大学生群体的特征,为其提供更加精准化、个性化的健康服务。郭顺利和张宇(2021)结合VALS2市场细分与用户生命周期理论(Theory of Customer Life Cycle),构建了在线健康社区大学生群体的用户画像模型,通过调查问卷实证研究后得出结论:大学生用户可分为他人引导型、广告导入型、社交活跃型、资源获取型、服务感知型和成熟参与型六类差异化画像群体。他人引导型用户是经过线上和线下同学、朋友、家人或师长等交流、推荐和宣传而发展成的在线健康社区用户;广告导入型用户是指被营销广告、热点主题推荐、软文推广等方式吸引而发展成的在线健康社区用户;社交活跃型用户是指运用在线健康社区社交互动功能获取知识资源或共享知识资源的用户群体;资源获取型用户是指借助在线健康社区获取专业性知识资源和服务的大学生用户群体;服务感知型用户较资源获取型用户更加注重对平台服务性能的感知与评价;成熟参与型用户是在线健康社区最为忠实的粉丝群体,也是所有用户中最为成熟和活跃的种子用户群体。

2.1.1.2 不同疾病类型的用户特征研究

糖尿病是一种典型的慢性非传染性疾病,具有发病时间长、病因复杂、治愈难度高等特点,可能会引发100多种并发症(司莉和舒婵,2019)。因此,糖尿病患者需要持续关注自己的健康,他们常常在医疗社区浏览和发布信息(Wang et al.,2020)。司莉和舒婵(2019)针对糖尿病患者在在线健康社区上的问答互动行为进行了医患群体的特征研究。通过收集“好大夫在线”平台近10年与糖尿病相关的问答数据,从糖尿病患者、医生以及医患问答三个维度进行特征分析。研究发现,“好大夫在线”上的糖尿病患者人群覆盖所有常见的糖尿病类型,并且出现了多种并发症,患病时间较长的用户更愿意在网上咨询,少部分患者有过敏现象,大多数属于食入式或注射式过敏。医生的临床职称与教学科研职称呈现一定的正相关关系,教学科研职称越高,临床职称也越高;医生所属的医院具有明显的集中与分散的特点,多数患者集中于少部分医院进行咨询,医生所属的科室较为分散,活跃的医生主要来自三级医院,且大多数属于内分泌科。糖尿病患者用户提问数量有时间周期性波动的特点,大致每5年达到一个高峰值,提问主题可以分为7类,围绕糖尿病及其并发症的治疗方法展开。大部分患者的提问意图是希望得到关于治疗过程、手段和程度等方面的帮助。

抑郁症是一种常见的心理疾病,发作的主要表现为心情低落、思维迟缓、意志活动减少等(刘忠宝和赵文娟,2021),在线健康社区提供的多种社会支持能够帮助抑郁症患者缓解烦躁、焦虑等负面情绪,因此患者经常会萌生到在线健康社区进行自我管理的意愿(潘涛涛和吕英杰,2022)。Nimrod(2013)探讨了在线抑郁症社区的成员对社区讨论的问题是否有不同的关注点。该文献基于对16个在线抑郁症社区793名成员的在线调查,将用户分成4个抑郁症患者群体:关注日常生活组(占27.6%)、信息寻求组(占21.1%)、对所有主题感兴趣组(占40.1%)和相对较少参与组(占11.2%)。在基础背景特征方面,信息寻求组中男性相对较多,关注日常生活组的成员比信息寻求组和对所有主题感兴趣组的成员年轻。在参与模式特征方面,信息寻求组往往是轻度抑郁用户,而对所有主题感兴趣的用户往往是重度抑郁用户,此外,关心日常生活组的成员明显比其他组更抑郁。在感知利益方面,各群体之间存在显著差异,对所有主题感兴趣组的成员比信息寻求组更能感受到社区提供的社会支持,相对较少参与组的成员比关注日常生活组的成员更能将参与在线社区的好处反映在线下的个人生活中。

根据社会支持理论(Social Support Theory),在线健康社区中最重要的两种社会支持类型是信息支持和情感支持(Zhou and Wang,2020)。其中,情感支持的作用是当用户处于不好的情绪状态时,平台会关心、鼓励用户,减少其对病情的焦虑,增强自信心(Liu et al.,2020)。王帅和纪雪梅(2022)从用户基本信息、情感、主题和信息行为4个特征维度构建用户画像,基于用户画像模型对用户的情感特征进行分析,利用DBSCAN聚类算法,根据情感特点挖掘出5类情感角色:焦虑型、愤怒型、祈祷型、乐观型和悲哀型。焦虑型的情感极性是负向,情感类别是“惊”“惧”,情感特征词是“心慌”“害怕”;愤怒型的情感极性是负向,情感类别是“怒”“恶”,情感特征词是“烦躁”“恼火”;祈祷型的情感极性是正向,情感类别是“乐”“好”,情感特征词是“希望”“期待”;乐观型的情感极性是正向,情感类别是“乐”“好”,情感特征词是“踏实”“宽心”;悲哀型的情感极性是负向,情感类别是“哀”“惧”,情感特征词是“绝望”“无语”。在线健康社区平台可据此用户特征,针对不同用户角色制定不同的情感支持和引导策略。

Liu和Lu(2018)基于自然语言处理和社会网络结构分析的技术,对HIV人群的心理、行为以及需求特征进行分析,通过挖掘百度贴吧的艾滋病吧产生的海量数据,提取HIV患者群体各个方面的特征,包括在线活动的时间模式、社交网络结构、社区结构及其情感倾向等,以了解HIV人群的网络生活现状和情感状态。研究表明,负面情绪在HIV社区中占主导地位,而这些情绪大多与最初感染患者的焦虑有关,他们倾向于第一时间在社交网络平台上寻求帮助和建议。为了更好地进行社会管理,相关机构应该更多地关注消极社区,对这些潜在的HIV感染人群进行持续监测,了解他们的需求,及时提供相关的指导和干预措施。 mbSFIo0JxsV+RmTYyrwuAAjalsHIPoMOGSEuTzDUE/PECB++cHkghpszFvGk7TG3



2.1.2 基于用户信息行为的用户画像

近年来,该领域的相关研究主要通过对在线健康社区的用户进行用户画像建模,揭示不同用户群体下用户行为的差异,并且在此基础上充分了解在线健康社区用户的信息需求以及信息行为。

2.1.2.1 基于用户信息行为特征的用户画像

盛姝等(2021)结合在线健康社区典型用户识别指标和主题分类体系,构建了用户画像概念模型,并将用户群体划分为四类角色:信息提供者、信息寻求者、信息接收者、信息分享者。信息提供者与在线健康社区交互频繁,他们会自主产生内容,且能够根据其他用户角色行为做出有效回应,如发帖、回复、主动评论以及收藏等,他们是社区内有较高威望的群体。信息寻求者在追求信息时动机较为强烈,具有鲜明的目的性,需求认知程度较高,该类用户的主要信息行为是发帖提问。信息接收者的信息需求相较于信息提供者与寻求者较为模糊,在信息需求认知较弱的情境下,偶遇并浏览信息,一般在看到能引起共鸣的信息情况下,会对信息内容进行收藏。信息分享者与信息接收者行为类似,区别在于信息分享者具有一定的目的性与动机去主动分享知识,用户参与感相较于信息接收者更强。实证结果表明,在医享网结直肠癌圈中,信息寻求者占比高达46%,信息分享者占比27%,信息接收者占比23%,信息提供者占比4%。用户数量分布结果表明,信息搜索及浏览行为占比较高,社区运营人员应关注网站服务质量、增强信息服务效率,使得用户能够快速找到自身所需的信息,从而提升用户网络留存黏性。吴江和周露莎(2017)对在线健康社区中的用户知识互动行为进行了类似研究,通过挖掘用户特征和主题特征来分析不同用户群体的活跃时长差异和不同主题的关注度差异,为社区知识分享的可持续发展提供建议。

吴江等(2017)设计了一个中文用户文本挖掘流程,实现了在线健康社区的用户文本分类及用户聚类。首先采集了甜蜜家园论坛上用户发帖或回帖的内容,完成数据预处理工作后,用LDA等文本分析技术进行特征提取,结合基本特征向量和人工标注结果形成分类模型,最后采用K-means聚类算法,得到甜蜜家园的4类用户:第一类是信息需求者,该类用户发表的内容主要是寻求信息支持;第二类是信息分享者,他们在在线健康社区上的行为主要是分享信息、提供信息帮助;第三类是社区陪伴者,他们经常在社区中活动,以分享生活、娱乐聊天以及交友陪伴为主;第四类是社区散步者,他们在在线健康社区中没有明确目的,以“散步”的心态参与社区交流。

2.1.2.2 基于用户信息行为规律的用户画像

张海涛等(2018)从用户行为、用户角色、用户需求三个维度出发,构建用户细分标签概念格,然后进行群体用户聚类并对各个群体的用户画像进行描述,进一步分析不同群体用户在不同情境下的用户行为规律。爬取医享网糖尿病圈所有用户的信息以及用户发帖主题及其评论数,基于概念格将用户分为三类群体:关注疾病预防信息的群体、用户圈职位为圈友的群体和关注疾病管理信息的群体。关注疾病预防信息的群体的标签包括治疗、疾病预防、病因及病理知识、信息浏览者等,其标签数量是三个类别中最少的,说明用户参与行为较少;用户圈职位为圈友的群体的标签包括治疗、圈友、老年、信息搜索者、男、病因及病理知识、并发症、信息浏览者等,用户以老年男性居多,用户认知水平较高,多数为信息搜索者,该用户群体分享经验和提供问题答案的行为较少,更倾向于通过追踪、搜索等方式获得相关信息;关注疾病管理信息的群体的标签包括疾病管理、社会生活、信息搜索者、男、信息提供者、并发症、管理者、中年等,群体中的用户以中年男性居多,且部分用户身份为管理者,用户的认知水平普遍较高,多数为信息提供者,善于通过搜索、追踪获取所需信息,乐于参与社区交互,经常通过发帖、评论的方式分享知识经验,并且帖子具有较高的人气,在社区中处于核心领导地位。

许云红等(2020)从增长模型(Growth Model)的视角探究不同级别用户的发帖行为规律。选取甜蜜家园为研究平台,依据用户在甜蜜家园的社区等级,将用户划分为三类:初级组、中级组和高级组。在采集到5981名用户的数据后,为每一名用户设定相应的级别,然后研究不同级别用户的参与行为模式。研究结果表明,不同组别的用户其参与行为模型分布存在差异,初级组和高级组的用户群体的发帖数增长模型的分布规律基本相同,发帖数增长模型属于波动模型的用户占大多数,其次为属于正态模型的用户,属于阻尼指数模型的用户占比最少;在中级组的用户群体中,发帖数增长模型属于波动模型的用户也占了大多数,但属于阻尼指数模型的用户占比却高于属于正态模型的用户。此外,用户积分、活跃度、好友平均隐私数、好友平均发帖数、空间访问量、好友数这些变量均有可能对用户发帖数增长模型的类别产生影响,而且对于初级组、中级组和高级组用户,这些变量的显著性和影响程度均有差异。

目前,多数在线健康社区仍存在用户黏性不高、用户容易流失的情况(王若佳等,2022)。预测用户流失可以帮助管理者及时制定合理的措施,以提高用户留存率,当前主要应用于电信服务(Droftina et al.,2015)、社交网站(徐孝娟等,2017)、游戏行业(Musta et al.,2022)等。针对在线健康领域,王若佳等(2022)提出了一种基于用户画像的用户流失实时预测方法,在构建在线健康社区用户的多维度画像标签体系的基础上,通过聚类分析、文本挖掘等方法确定每个标签指标的计算公式,并基于可视化技术展现用户画像结果,然后采取滑动窗口方法,标注用户在不同时段上的流失情况,将多维用户画像标签作为模型输入,建立并比较多种机器学习模型的预测效果。采集华夏中医论坛上的用户数据后,将用户分为5种类型,分别是沉没用户、边缘用户、权威用户、活跃回帖用户和活跃发帖用户。在线健康社区的管理者基于用户流失预测模型可在早期阶段识别出即将流失的用户,以便于及时采取措施留住用户。

2.1.2.3 新冠肺炎疫情下的用户信息行为画像

从2019年年底开始,新冠肺炎疫情大范围暴发,各个国家突发公共卫生事件管控能力都面临着巨大的考验,越来越多的人开始从在线健康社区中获取相关健康知识。在大规模公共卫生事件爆发的环境下,构建用户画像能够更有效地识别用户需求和用户行为,一定程度上帮助识别疫情风险。

王帅(2022)以COVID-19为例,结合多个在线健康社区(如丁香园、好大夫在线等传染病板块)的数据特点,从用户基本特征、用户兴趣主题、情感倾向、用户问诊需求和用户交互网络角色5个角度出发构建画像标签,并利用DBSCAN聚类实现用户画像,根据画像结果呈现用户概貌,利用AP算法在画像基础上实现用户分群,得到5种用户类群:患者、疑似患者、医师、奉献者以及社区管理员,最后通过社会网络分析找到最具疫情风险发现价值的用户类群。研究结果表明,对奉献者进行观测有利于感知和提前捕获疫情风险,而对疑似患者进行监测则有助于确定疫情风险事件。

钱旦敏等(2022)基于TOPSIS熵权法构建了帖子热度评价模型,并运用用户画像定义用户角色,以充分了解公共卫生事件下的用户需求。以丁香园论坛中与新冠肺炎疫情相关的最新数据为研究对象,从用户行为属性、自然属性、角色属性三个维度,利用用户画像将用户分为高影响力用户、专业型用户、长期用户、高产量用户、高潜力用户、机构类用户、强互动型用户7大类。高影响力用户主要是丁香园的官方号,用户角色为信息浏览者和信息提供者,该类用户专栏/专题数、粉丝数、帖子被浏览量、被收藏数高;专业型用户的社会身份以医学生、医师、医疗行业从业者为主,聚集了90%左右的信息浏览者和信息分享者,用户行为处于低水平,且用户黏性低;长期用户的用户等级均高于普通用户,聚集了大量的版主/荣誉版主等级的用户,50%用户为医师、医疗行业从业者,60%为信息提供者,其用户行为数据均处于中上水平,即为长期使用丁香园的用户;高产量用户的用户等级、认证信息和论坛信息分布较为均匀,用户角色主要为信息分享者和信息提供者,其发帖量、被浏览量居7类之首,说明这类用户以发布信息和信息交流为主;高潜力用户的用户等级为空值,论坛信息以版主为主,角色信息以不典型用户为主,其专栏数、粉丝数较高;机构类用户以机构为主,其用户行为处于低水平,用户黏性低;强互动型用户的身份等级主要为空值,无机构号和官方号,其回帖数、关注数、获赞数居7类之首,其他行为数据也在较高水平。 zcAcmuJucnHq5AyaVJ9UwPzNXW2xdtGdTY/+zWO/WIIY69JLxpdfzUG/yJ+CWvFf



登录后阅读更多精彩内容
登录
点击中间区域
呼出菜单
上一章
目录
下一章
×