人工智能时代的解题思路使用机器学习技术解决病案问题
背景
病案首页信息是医保付费、卫健委医疗质量评价、医院等级评审的重要数据基础,尤其是近年来国家大力推行按疾病诊断相关分组(DRGs)付费*策,对病案首页的质量提出了更高的要求。
为了方便对病案的信息化处理,目前要求在病案首页中按照国家相关标准以标准码的形式表示诊断信息以及手术信息。但受医生工作负担繁重、病案学知识复杂、专业编码人员缺乏等因素影响,病案首页中的诊断信息和手术信息普遍存在错填、漏填等问题。目前,医院仅依据传统的规则校验对病案首页数据进行校验,主要存在“规则数量少、适用面窄、开发新规则难”等缺点,而机器学习技术可以规避上述缺点。因此,利用新技术解决“医疗信息化老问题”势在必行。本文依次介绍了神经网络算法、如何用新技术解决问题,最后展示真实数据的预测案例分析。
算法介绍
神经网络算法是一种监督学习算法。它从信息处理角度对人脑神经元网络进行模仿,可以按不同的连接方式组成不同的网络。神经网络的“网络”部分由大量“神经元”相互联接而成,训练过程中这些“神经元”的权重不断更新,最终迭代出一个相对较好的权重矩阵,达到准确预测结果的目的。这里用BP神经网络举例,过程由前向传播、反向传播与参数迭代组成。下面分别介绍各个过程:前向传播反向传播4迭代
与传统规则校验相比,利用神经网络模型对病案数据进行校验,主要有以下三个方面的优势:
1)传统规则校验规则数量有限;神经网络模型可以在大量数据中,全面的寻找规律。
2)传统规则校验面对复杂场景时,适用局限性大;神经网络模型可以通过大量计算找到复杂场景的解题路径。
3)传统规则校验新规则开发时间长,且需要病案专家耗费大量时间;神经网络训练时间相对较短,更可以通过GPU加速网络训练进程。
解决思路
数据预处理与特征工程
首先,由医学专业人员与业务人员共同完成对病案首页数据与医保结算收费明细数据的审核,最大程度保障建模数据准确性。然后,特征工程部分以医学知识为主,以统计方法为辅,对患者诊断手术编码标签有的放矢。最后将数据按照特征工程的结果整理成为特征矩阵,给到算法训练模型。
模型搭建与迭代
分析lightGBM、Xgboost与多层神经网络算法的结果后,经过综合评价,多层神经网络的结果较好。再由医学知识与统计技术完成结果分析与特征补充,迭代后模型的预测能力可覆盖上万编码,准确度接近人工水平。但是,对比人工校验,该算法具有人工无法达到的反馈速度与始终如一的稳定性。对比规则性校验,该算法具有更深的规则挖掘能力,与更灵活的复杂业务场景适应能力。下图是思路的流程图:
案例展示
以下案例为年某地真实数据,通过神经网络模型对病案填写情况进行校验的结果。
案例
主诊断编码
主诊断名称
其它诊断编码
其它诊断名称
案例1
k29.
慢性胃炎
j98.
肺部感染
m48.
颈椎椎管狭窄
m50.
颈椎间盘突出
n62.x00x
乳腺增生
n85.
子宫萎缩
r90.
脑缺血灶
案例2
k60.
复杂性肛瘘
k62.
肛乳头肥大
案例3
k29.
糜烂性胃炎
e04.
甲状腺结节
e78.
高脂血症
k26.x
十二指肠溃疡
k52.
慢性结肠炎
k57.
回盲部憩室
k76.
脂肪肝
n42.
前列腺结石
案例
主手术编码
主手术名称
其它手术编码
其它手术名称
案例4
55.
腹腔镜下单侧肾切除术
07.2
腹腔镜肾上腺病损切除术
41.5x01
腹腔镜全脾切除术
54.4x15
腹腔镜下腹膜后病损切除术
案例1中病案错填:病案原始填写诊断编码“j98.肺部感染”。医保结算收费明细数据进入算法后形成特征矩阵,经由神经网络预测,提示“j98.肺部感染”错填。
案例2中病案漏填:病案原始填写诊断“k60.复杂性肛瘘”和“k62.肛乳头肥大”,医保结算收费明细数据进入算法后形成特征矩阵,经由神经网络预测,提示存在“肛门和直肠区脓肿-蜂窝织炎及其他感染性皮肤病”相关诊断漏填(如:肛周脓肿)。案例3中病案漏填:病案原始填写手术为空,医保结算收费明细数据进入算法后形成特征矩阵,经由神经网络预测,提示存在“外耳手术-其他外耳及耳部手术”相关手术漏填(如:耳游离皮瓣移植术)。案例4中病案错填:病案原始填写手术编码“07.2腹腔镜肾上腺病损切除术”。医保结算收费明细数据进入算法后形成特征矩阵,经由神经网络预测,提示“07.2腹腔镜肾上腺病损切除术”错填。
#人工智能#
#AI#
#机器学习#
#神经网络算法#
#病案#
#错填#
#漏填#
预览时标签不可点收录于话题#个上一篇下一篇