购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

第三节
中医药数据的特点及应用

伴随大数据时代的深入发展,为深度发掘中医药宝库资源,健全中医药现代化评价体系,强化中医药信息网络系统研究,运用信息技术实现中医药大数据的融合、集成与智能决策已成为促进中医药现代化发展的重要技术支撑。面对中医药领域海量复杂的多源数据体系,人工智能算法为中医药信息的分析处理提供了科学工具,其通过对庞杂数据的深度挖掘与系统整合,可实现中医药信息资源的优化配置与有效利用。该技术已广泛应用于中医药研究的多个层面,如运用机器学习算法(包括聚类分析、分类建模、预测推演等),对中药新药研发、方剂配伍规律、作用机制解析、活性成分辨识及组效关系探究等关键领域开展系统性研究。

一、中医药数据的特点

人工智能算法在中医药领域的应用尚处于起步阶段。医疗卫生系统本身具有复杂性和动态变化的双重特性,加之中医药学作为一门验证性科学,其技术体系具有显著的实践性、实验性和经验性特征。这使中医药领域的数据挖掘与分析既具有独特性,又展现出显著的应用价值和广阔的发展前景。中医药学信息资源完整记录了医疗过程、医患互动、中药学研究与应用的全维度数据,既包含临床诊疗信息,又涵盖科研分析数据,充分体现了中医药学科的系统特性。这些信息具有数据形态的多态性(涵盖数值、影像、信号、文本等类型)、信息完整性不足(既包括疾病表征的客观缺失,也涉及主观描述的不完整)、显著时效性、系统复杂性和信息冗余性特征。加之其数理特征较弱、规范化程度不足,以及医患信息不对称和涉及伦理法律问题较多等现实因素,共同构成了中医药数据挖掘的特殊性。

由于中医药数据来源广泛且体量庞大,常包含模糊信息、噪声干扰和冗余数据,这要求在进行数据挖掘时需要采用专门的技术方法。如通过数据预处理实现信息清洗与过滤,确保数据质量;运用信息融合技术实现多模态数据的属性趋同或一致,从而进行综合;针对中医药数据库类型多样、覆盖面广、信息量大的特点,为确保挖掘效率,相关算法应具备良好的容错机制和稳健性;同时,如何保证挖掘结果的准确性、可靠性和科学性,有效控制挖掘风险,是决定其能否为医疗实践和管理决策提供有效支持、实现实际应用价值的关键所在。

中医药数据按照文本属性分类可分为数值型、文本型、符号型和图像型四类。如9g(中药剂量)、30mL(溶剂体积)、5.6%(成分质量百分比)等属于数值型数据;黄芪(中药名称)、乌头碱(化学成分名)、痰多稀白(中医证候特征)等属于文本型数据;IL-6(中药作用靶点)、NF-κB(信号通路名称)、C 14 H 14 O 4 (化合物分子式)等属于符号型数据;此外还有舌诊图像、中药指纹图谱、植物结构图及各类知识图谱等图像型数据。中医药数据的特点主要体现在4个方面:其一为数据体量庞大,涵盖中药材基源鉴定、方剂配伍、临床诊疗、实验研究等多元领域;其二为数据形态多样,包含结构化数值、非结构化文本、图形图像等多模态形式;其三为数据来源广泛,既包含医院电子病历系统、科研机构实验数据库,也涉及互联网健康平台等新型数据源;其四为数据维度丰富,在单一样本中常整合理化性质、生物活性、临床疗效等多层次信息,支持多维度的关联分析与知识发现。

二、中医药数据的应用

中医药数据不仅能够为临床研究提供支撑,协助科研思路构建与研究主题遴选,更能通过系统化数据处理与结果解析,构建专业数据库以开展深度分析,从而更精准地揭示疾病传变规律与中药作用机理。这些数据在前瞻性研究中展现出重要价值,既可辅助医师评估不同疗法对恶性肿瘤的疗效差异及不良反应特征,又能通过回顾性研究解析疾病发展轨迹与干预效果关联性。研究过程中,数据还可用于多维度疗效评估,包括不同地域环境、人群特征对治疗方案的响应差异,为临床实践优化和科研方向选择提供实证依据。基于数据驱动的诊疗决策,医师可根据患者个体特征选择更适宜的治疗方案,在控制病情的同时,兼顾生存质量提升与预后改善。此外,动态数据监测系统可实时追踪疾病进展与患者健康状态演变,为个性化健康管理提供技术支持。值得注意的是,中医药数据的应用范畴已突破临床诊疗边界,在基础研究领域同样具有重要价值。中医药数据的应用方向主要包括以下几个层面。

(一)建立专题数据库

专题数据库为疾病诊断和治疗提供有力的支持,使医药研究人员能够便捷地检索相关信息,食药物质安全性专题数据库首页如图2-1所示。数据库管理系统需要采用高效的存储算法,以便有效提高数据存储效率,从而保障数据检索的速度和精度。同时,利用先进的检索算法,可以快速实现数据查询和搜索操作,从而有效满足用户的多维度需求。收集到的大规模数据往往具有高度异质性,因此需要进行分类整理,以去除无关的信息,并确保数据的准确性和完整性。在整理数据的过程中,可以借助人工智能技术,提升数据处理效率和结果可信度。在确保数据质量和溯源性的前提下,可基于临床反馈和用户需求,对数据库架构进行迭代优化。根据中医疾病分类标准,可按疾病的类型、中医证型、治疗方式、预后等方面,结合患者的年龄、性别、体重、身高、病程、转移特征、生存状态等临床参数进行多模态数据存储,以便更高效地实现数据的知识化管理和临床应用。

图2-1 食药物质安全性专题数据库首页

(二)探究方剂配伍规律

图2-2 肾虚中医方剂配伍规律的关联规则图

对中医方剂数据进行挖掘,可从多维角度展示方剂配伍规律,有助于总结中医诊治疾病的经验。肾虚中医方剂配伍规律的关联规则图如图2-2所示。通过数据挖掘算法,可对药物进行合理分类,并为药物在方剂中地位的确立提供依据,进而分析药物间的关联性,包括单一病证下药物间的关联性及多病证下药物间的关联性,同时探究同种药物对应病证间的关联规则,最终确定药物的最适应病证。如通过对喉癌中药方剂的挖掘研究发现,中医治疗喉癌的核心用药规律以清热解毒药为主,金荞麦、锦灯笼、重楼、蛇莓、龙葵等作为重要道地药材,在喉癌治疗中具有显著疗效,可为喉癌中医诊疗及中成药研发提供参考;对卵巢癌中药方剂的挖掘研究表明,中医药治疗卵巢癌以补虚扶正为核心,但有毒中药因安全剂量范围较窄,现代医家对其应用仍存在局限,可通过古代方剂数据挖掘研究有毒中药的配伍规律或炮制方法,开展效-毒安全性研究,这对恶性肿瘤新药研发具有重要意义;对胰腺癌中药方剂的研究显示,其治疗以补虚、清热、活血化瘀为主,配合补气养血形成消补兼施之法,从而达到抑癌止痛效果;通过对乳腺癌中药方剂的挖掘研究,可明确柴胡-郁金药对在乳腺癌治疗中的用药规律,且不同分期核心药物的应用存在显著差异。癌病方剂配伍规律的研究能充分发挥中医理论在癌病治疗中的优势,对癌病治疗和病痛缓解具有重要指导意义。

(三)疾病预测模型

对中医疾病方剂数据进行挖掘,需对医案中的临床表现、治法、方药等信息进行规范抽取,并采用机器学习方法建立疾病分型症状与中医方药功用之间的预测模型。通过预测结果分析疾病分型与方药功用的关联关系,最终构建基于中医症状的方药功用预测分析模型(图2-3)。如利用随机森林和循环神经网络对大肠癌病例数据进行证候辨证分型和病机量化赋值,建立大肠癌中医证候分类模型,通过对比特征优化前后的分类效果提出模型分类策略;运用随机森林、梯度提升树、逻辑回归及支持向量机等机器学习算法,构建肝癌中医预后模型及中西医结合预后模型,探索适合我国肝癌患者特点的中医药主导多模式治疗预后模型;结合深度神经网络与大规模生物医学数据,构建高效、快速、精准且不受药物数量限制的协同抗肿瘤多药组合深度学习预测模型,为特定肿瘤细胞筛选最优抗肿瘤药物组合。

图2-3 基于中医症状的方药功用预测分析模型

经机器学习模型处理后的病历数据精度更高,更贴合临床实际。所建模型数据处理更精细、结果更准确、时效性更强,不仅为癌病临床诊疗提供可靠依据,也为中医辨证论治规律研究提供有效参考。

(四)中药智能推荐系统

随着人工智能技术的发展,中医药领域已广泛运用深度学习技术挖掘临床诊疗案例经验,为医师提供辅助决策支持及中药方剂推荐,有效提升了中医临床诊疗质量和效率。在万维网(Web)检索及通用领域,已构建多个大规模知识图谱库,包括中药知识图谱(“山药-体质-证候”知识图谱如图2-4所示)、方剂知识图谱及养生知识图谱等,为知识发现与中药决策服务提供了技术支持。有研究团队基于中医舌诊理论,构建以“理、法、方、药”为核心的中医舌诊知识图谱,为肿瘤舌诊中药推荐模型提供“舌象-药物”特征关联分析。另有研究通过基因本体论(Gene Ontology)功能富集分析和蛋白质相互作用网络(protein-protein interaction network)筛选关键靶点基因,结合药物数据库进行化学药物与中药功效的匹配推荐。此外,基于肿瘤中医证候特征建立的方药功用预测分析模型,可输出适配度较高的方剂组合及其功效建议。

图2-4 “山药-体质-证候”知识图谱

随着计算机技术的快速发展,采用人工智能算法从中医药领域庞大而复杂的数据中挖掘知识,具有显著的应用价值和发展前景,但同时也是极具挑战性的研究课题。中医药数据挖掘是计算机技术、人工智能、数学与统计学同中医药学交叉融合的产物,是面向中医药信息数据库进行知识提取的过程,是中医药服务整体决策科学化的重要组成部分。由于中医药数据挖掘对象具有广泛性特征,算法需要实现高效知识提取,决策建议需满足更高准确性要求,加之现有中医药信息数据库在数据结构完整性和标准化方面仍存在提升空间,这些都需要计算机科学、数学、统计学及中医药研究人员的多学科协作,从而在信息融合技术、算法效率优化、知识获取准确性等关键领域实现突破。随着人工智能算法的广泛应用、算法模型的持续改进及相关软件系统的开发完善,人工智能技术在中医药领域的应用将不断深化拓展,有望产生显著的社会效益与经济效益。

思考题

1.哪些医学典籍的问世,标志了中医理论的基本确立?

2.中医理论体系的特点是什么?简述其内容。

3.何为阴阳?阴阳学说的基本特点有哪些?

4.请概括中医药信息数据的特点。

5.请简述大数据背景下中医药信息化建设的必要性。 Cd7DP2TgAhk59+UkrUZj/bEy1GJLT9FMiJcvHpIPiVep/rdiuMZEZBt8/n6xWkj6

点击中间区域
呼出菜单
上一章
目录
下一章
×