CN112447270A - 一种用药推荐方法、装置、设备及存储介质 - Google Patents
一种用药推荐方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN112447270A CN112447270A CN202011370981.0A CN202011370981A CN112447270A CN 112447270 A CN112447270 A CN 112447270A CN 202011370981 A CN202011370981 A CN 202011370981A CN 112447270 A CN112447270 A CN 112447270A
- Authority
- CN
- China
- Prior art keywords
- medication
- data set
- training
- medication recommendation
- recommendation model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 239000003814 drug Substances 0.000 title claims abstract description 361
- 229940079593 drug Drugs 0.000 title claims abstract description 359
- 238000000034 method Methods 0.000 title claims abstract description 58
- 238000012549 training Methods 0.000 claims abstract description 194
- 201000010099 disease Diseases 0.000 claims abstract description 115
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims abstract description 115
- 238000000605 extraction Methods 0.000 claims description 30
- 230000015654 memory Effects 0.000 claims description 26
- 230000008569 process Effects 0.000 claims description 16
- 239000013598 vector Substances 0.000 claims description 13
- 238000004590 computer program Methods 0.000 claims description 9
- 230000004927 fusion Effects 0.000 claims description 7
- 238000012216 screening Methods 0.000 claims description 3
- 238000003745 diagnosis Methods 0.000 description 27
- 239000008280 blood Substances 0.000 description 20
- 210000004369 blood Anatomy 0.000 description 20
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 18
- 239000008103 glucose Substances 0.000 description 18
- 238000012360 testing method Methods 0.000 description 16
- 238000010586 diagram Methods 0.000 description 12
- 206010067584 Type 1 diabetes mellitus Diseases 0.000 description 10
- 238000012545 processing Methods 0.000 description 10
- 108010023302 HDL Cholesterol Proteins 0.000 description 9
- 230000006870 function Effects 0.000 description 9
- 208000017667 Chronic Disease Diseases 0.000 description 6
- 206010012601 diabetes mellitus Diseases 0.000 description 6
- 206010020772 Hypertension Diseases 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- PNNCWTXUWKENPE-UHFFFAOYSA-N [N].NC(N)=O Chemical compound [N].NC(N)=O PNNCWTXUWKENPE-UHFFFAOYSA-N 0.000 description 4
- HVYWMOMLDIMFJA-DPAQBDIFSA-N cholesterol Chemical compound C1C=C2C[C@@H](O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2 HVYWMOMLDIMFJA-DPAQBDIFSA-N 0.000 description 4
- 230000010354 integration Effects 0.000 description 4
- 238000010606 normalization Methods 0.000 description 4
- 230000000737 periodic effect Effects 0.000 description 4
- 102000004169 proteins and genes Human genes 0.000 description 4
- 108090000623 proteins and genes Proteins 0.000 description 4
- 208000001072 type 2 diabetes mellitus Diseases 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000007774 longterm Effects 0.000 description 3
- 101710120037 Toxin CcdB Proteins 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 235000012000 cholesterol Nutrition 0.000 description 2
- 238000013480 data collection Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 108010026228 mRNA guanylyltransferase Proteins 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000001575 pathological effect Effects 0.000 description 2
- SGUAFYQXFOLMHL-UHFFFAOYSA-N 2-hydroxy-5-{1-hydroxy-2-[(4-phenylbutan-2-yl)amino]ethyl}benzamide Chemical compound C=1C=C(O)C(C(N)=O)=CC=1C(O)CNC(C)CCC1=CC=CC=C1 SGUAFYQXFOLMHL-UHFFFAOYSA-N 0.000 description 1
- 102000003914 Cholinesterases Human genes 0.000 description 1
- 108090000322 Cholinesterases Proteins 0.000 description 1
- 208000026292 Cystic Kidney disease Diseases 0.000 description 1
- 206010067286 Left atrial dilatation Diseases 0.000 description 1
- 206010038423 Renal cyst Diseases 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 229940048961 cholinesterase Drugs 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 239000002552 dosage form Substances 0.000 description 1
- 238000002592 echocardiography Methods 0.000 description 1
- 238000007499 fusion processing Methods 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 208000019622 heart disease Diseases 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 229960001632 labetalol Drugs 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 238000002604 ultrasonography Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H10/00—ICT specially adapted for the handling or processing of patient-related medical or healthcare data
- G16H10/60—ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H20/00—ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
- G16H20/10—ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to drugs or medications, e.g. for ensuring correct administration to patients
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Public Health (AREA)
- Medical Informatics (AREA)
- Epidemiology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Primary Health Care (AREA)
- Biomedical Technology (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Biophysics (AREA)
- Medicinal Chemistry (AREA)
- Bioinformatics & Computational Biology (AREA)
- Chemical & Material Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Databases & Information Systems (AREA)
- Pathology (AREA)
- Medical Treatment And Welfare Office Work (AREA)
- Measuring And Recording Apparatus For Diagnosis (AREA)
Abstract
本申请提供一种用药推荐方法、装置、设备及存储介质,涉及计算机技术领域,用于解决用药推荐方案精准度低的问题。该方法包括:根据为当前用药场景选定的用药方案推荐相关的特征维度,获取各个特征维度对应的特征数据集;根据所述各个特征维度的特征数据集与训练得到初始用药推荐模型时所用的特征数据集,获得对所述初始用药推荐模型进行模型再训练所需的第一训练数据集;根据所述第一训练数据集对所述初始用药推荐模型进行模型再训练,得到目标用药推荐模型;根据输入的待推荐的病情参数数据组合,通过所述目标用药推荐模型得到对应的用药推荐方案。
Description
技术领域
本申请涉及计算机技术领域,提供一种用药推荐方法、装置、设备及存储介质。
背景技术
目前,高血压与糖尿病已经成为慢性病中十分具有代表性的疾病,由于这两种病的表现为病程长、病因复杂、受生活方式影响较大,所以导致两病(即高血压与糖尿病)患者的疾病相关信息具有长期性、时序性的特点,且数据类型呈现多样化,而治疗方式与用药方案也都随着患者长期的病情变化不断地进行及时的调整,此外,患者生活方式的有效干预对疾病的进展与恢复也具有重要的作用。
在现有的两病患者的健康和疾病管理中,临床医护人员在对两病患者进行随访与数据采集之后,会根据自己的临床经验,对患者的用药方案进行相应的建议,其中,部分经验丰富的临床医生能够给出比较专业的建议,但大部分临床资历较浅的医生给出的用药建议可能就不够专业。尤其是,现在大部分两病的就诊和管理均下沉至社区医院,而社区医院的医生资历参差不齐,有很大一部分医生的临床经验都不足以对患者的用药方案给出较专业的建议,因此,对患者全面的、个性化的病情无法给出精准的用药建议。
因此,如何对患者精准地进行用药方案推荐是一个亟待解决的问题。
发明内容
本申请实施例提供一种用药推荐方法、装置、设备及存储介质,用于解决用药推荐方案精准度低的问题。
一方面,提供一种用药推荐方法,所述方法包括:
根据为当前用药场景选定的各个特征维度包括的病情参数,获取各个特征维度对应的特征数据集;其中,一个特征维度为一类病情参数数据或者一种用药推荐方案;
根据所述各个特征维度的特征数据集与训练得到初始用药推荐模型时所用的特征数据集,获得对所述初始用药推荐模型进行模型再训练所需的第一训练数据集;其中,所述第一训练数据集包括多个训练样本,每一训练样本包括一个患者的多次就诊时的病情参数数据组合和每一次就诊时的用药方案;
根据所述第一训练数据集对所述初始用药推荐模型进行模型再训练,得到目标用药推荐模型;
根据输入的待推荐的病情参数数据组合,通过所述目标用药推荐模型得到对应的用药推荐方案。
一方面,提供一种用药推荐装置,所述装置包括:
第一获取单元,用于根据为当前用药场景选定的各个特征维度包括的病情参数,获取各个特征维度对应的特征数据集;其中,一个特征维度为一类病情参数数据或者一种用药推荐方案;
第二获取单元,用于根据所述各个特征维度的特征数据集与训练得到初始用药推荐模型时所用的特征数据集,获得对所述初始用药推荐模型进行模型再训练所需的第一训练数据集;其中,所述第一训练数据集包括多个训练样本,每一训练样本包括一个患者的多次就诊时的病情参数数据组合和每一次就诊时的用药方案;
训练单元,用于根据所述第一训练数据集对所述初始用药推荐模型进行模型再训练,得到目标用药推荐模型;
用药推荐单元,用于根据输入的待推荐的病情参数数据组合,通过所述目标用药推荐模型得到对应的用药推荐方案。
可选的,所述训练单元,还用于:
针对每一训练样本,按照就诊时间顺序依次通过所述特征提取单元对每一次就诊时的病情参数数据组合进行特征提取,得到每一次就诊对应的病情特征向量;其中,一次就诊时的病情参数数据组合对应一个特征提取单元,每一个特征提取单元的输入为上一特征单元的输出以及对应的病情参数数据组合,第一个特征提取单元的输入为第一次就诊时的病情参数数据组合;
分别根据每一次就诊对应的病情特征向量进行用药方案的预测,得到预测的用药方案;
根据预测的用药方案与训练样本包括用药方案之间的差异确定当前的用药推荐模型收敛时,结束训练;或者,
根据预测的用药方案与训练样本包括用药方案之间的差异确定当前的用药推荐模型未收敛时,更新当前的用药推荐模型,并基于更新后的用药推荐模型进入下一次训练流程。
可选的,所述装置还包括:
确定单元,用于根据配置信息确定是否将所述第一训练数据集与距离当前时刻的时间间隔大于设定时间阈值的第二训练数据集进行融合;
融合单元,用于在确定将所述第一训练数据集与距离当前时刻之间的时间间隔大于设定时间阈值的第二训练数据集进行融合时,将所述第二训练数据集加入所述第二训练数据集中,以获取第三训练数据集;
所述训练单元,还用于根据所述第三训练数据集对所述初始用药推荐模型进行模型再训练,得到所述目标用药推荐模型。
可选的,所述确定单元,还用于根据历史预测时各个病情参数对于用药方案预测的预测结果的重要程度确定各个病情参数的权重;
所述第二获取单元,还用于将所述第一训练数据集中权重值小于预设的权重阈值的病情参数筛除,以获得第四训练数据集;
所述训练单元1003,还用于根据所述第四训练数据集对所述初始用药推荐模型进行模型再训练,得到所述目标用药推荐模型。
可选的,所述第一获取单元,还用于:
获取当前用药场景的就诊数据集;
针对所述就诊数据集中的每一就诊数据进行数据类型识别,并根据数据类型将就诊数据添加至对应类型的特征数据集中。
可选的,所述数据类型包括如下类型中的一种或者多种:
身份数据;
检验数据;
检查数据;
诊断病情数据;
用药方案。
一方面,提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述任一种方法的步骤。
一方面,提供一种计算机存储介质,其上存储有计算机程序指令,该计算机程序指令被处理器执行时实现上述任一种方法的步骤。
本申请实施例中,通过结合当前用药场景和训练初始用药推荐模型所使用的训练数据,得到新的训练数据集,来对初始用药推荐模型进行再训练,以获取针对当前用药场景的目标用药推荐模型,进而可以使用训练得到的目标用药推荐模型来进行用药推荐。其中,训练目标用药推荐模型包含了较多的训练样本,且每一训练样本包括一个患者的多次就诊时的病情参数数据组合和每一次就诊时的用药方案,使得训练的目标用药推荐模型考虑了患者病情时序性与周期性的特点,以及通过大量的样本学习可以提升目标用药推荐模型的用药方案推荐的精准度。此外,由于目标用药推荐模型是在初始用药推荐模型上进行再训练获得,可以减少模型参数收敛的速度,大大的减少模型训练的时长。
附图说明
为了更清楚地说明本申请实施例或相关技术中的技术方案,下面将对实施例或相关技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请实施例提供的一种应用场景示意图;
图2为本申请实施例提供的用药推荐方法的一种流程示意图;
图3为本申请实施例提供的构建特征数据集的一种过程示意图;
图4为本申请实施例提供的划分数据子集的一种示意图;
图5为本申请实施例提供的数据子集的一种示意图;
图6为本申请实施例提供的选定特征维度的一种示意图;
图7为本申请实施例提供的再训练过程的一种流程示意图;
图8为以用药推荐模型为LSTM模型为例的训练流程示意图;
图9为本申请实施例提供的用药推荐系统界面的一种示意图;
图10为本申请实施例提供的用药推荐装置的示意图;
图11为本申请实施例提供的计算机设备的一种示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚明白,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互任意组合。并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
长短期记忆(Long Short-Term Memory,LSTM)神经网络,为循环神经网络(recurrent neural network,RNN)的其中一种,适合被用于处理和预测时间序列中延迟和间隔非常长的重要事件,避免长期依赖性问题。本申请实施例中,LSTM神经网络可以将与诊断有关的因素以及历史的用药信息都利用起来,使得网络模型即考虑了过往病情,又能够引入了规律性用药的因素。
目前,现有的用药推荐模型大都存在如下问题:
1)两病作为典型的慢性病,它具有时序性关联与周期性用药等特点,而常见的用药推荐模型通常缺乏对患者历史就诊数据以及用药情况的利用。或者仅仅通过一些统计的历史用药数据就用来代表患者的过往就诊情况,忽略了患者病情与用药随着时间的推进而不断变化,又或者通过病理相似性的方法进行用药推荐,但是,在医学场景下,病理相似性的度量本身就存在很难定论的问题。
2)绝大多数的用药指导模型都是针对通用的场景进行设计的,在提前预设了采集的字段条件下,根据历史用药数据来训练用药推荐模型,进而将训练好的用药推荐模型应用到各个就医场景下。然而,这样进行用药推荐模型的训练需要相关医院具有完善的用药信息系统,以保证足够的数据采集。但是两病的用药推荐模型通常应用于社区医院,而各地各社区医院的用药信息系统多种多样且质量参差不齐,以使得基于这些用药信息系统而收集的信息训练所得的用药推荐模型的应用效果大打折扣。
3)对于不同的地区、不同医院甚至同一医院的不同年份、季节等,同类疾病患者的用药情况均是有一定差异的,例如,当患者病情进展具有一定的季节性或者医院药品采购供应商的变更等情况下时,患者的用药情况是不相同的,所以,将全量用药数据进行训练,以给出的用药预测结果是不够精准和适用的。
因此,本申请实施例提供了一种用药推荐方法,在该方法中,通过结合当前用药场景和训练初始用药推荐模型所使用的训练数据,得到新的训练数据集,来对初始用药推荐模型进行再训练,以获取针对当前用药场景的目标用药推荐模型,进而可以使用训练得到的目标用药推荐模型来进行用药推荐。其中,训练目标用药推荐模型包含了较多的训练样本,且每一训练样本包括一个患者的多次就诊时的病情参数数据组合和每一次就诊时的用药方案,使得训练的目标用药推荐模型考虑了患者病情时序性与周期性的特点,以及通过大量的样本学习可以提升目标用药推荐模型的用药方案推荐的精准度。此外,由于目标用药推荐模型是在初始用药推荐模型上进行再训练获得,可以减少模型参数收敛的速度,大大的减少模型训练的时长。
针对由不同的地区、不同医院或者同一医院的不同年份、季节等情况造成的同类疾病患者的用药情况存在差异的问题,在本申请实施例中,可以针对特定的场景选定相应的训练数据,即患者具体在不同的地区、不同医院或者同一医院的不同年份、季节等情况下的用药数据,结合模型历史训练时使用的数据对用药推荐模型进行再训练,得到能够适用于当前场景的目标用药推荐模型,使其所推荐的用药方案更符合该具体场景下的用药情况,进而提高了用药推荐方案的精准度。
此外,针对两病等慢性病的病情进展的时序性关联与周期性用药的特性,可以利用LSTM模型适合处理和预测时间序列中延迟和间隔较长的重要事件的特性,来全方位挖掘用药数据与就诊时间之间的关系,因此,在本申请实施例中,将患者的用药数据依据就诊时间顺序划分为呈现时间序列形式的多个数据子集,再采用LSTM模型对划分的多个数据子集进行学习,以使获得的用药推荐模型能够考虑到病情进展的时序性关联与周期性用药的特性,进而推荐出精准度更高的用药方案。
在介绍完本申请实施例的设计思想之后,下面对本申请实施例的技术方案能够适用的应用场景做一些简单介绍,需要说明的是,以下介绍的应用场景仅用于说明本申请实施例而非限定。在具体实施过程中,可以根据实际需要灵活地应用本申请实施例提供的技术方案。
如图1所示,为本申请实施例提供的一种应用场景示意图。该用药推荐的应用场景可以包括用药推荐设备10以及终端11。
用药推荐设备10是具有一定处理能力的计算机设备,例如可以为服务器等。用药推荐设备10包括一个或多个处理器101、存储器102以及与其他设备交互的I/O接口103等。此外,用药推荐设备10还可以配置数据库104,数据库104可以用于存储本申请实施例提供的方案中涉及到的用药数据与训练数据集等数据。其中,用药推荐设备10的存储器102中可以存储本申请实施例提供的用药推荐方法的程序指令,这些程序指令被处理器101执行时能够用以实现本申请实施例提供的用药推荐方法的步骤,以推荐出精确度较高的用药方案。
终端11同样可以为具有一定处理能力的计算机设备,例如可以为手机、个人计算机(personal computer,PC)或者笔记本电脑等。
在一种可能的使用场景中,患者可以在终端11上安装用药方案推荐应用(application,APP)或者打开相关网页页面,用药方案推荐APP或者网页页面例如可以为医院对应的APP或者页面,进而患者会在用终端11的用药方案推荐APP或者网页页面上提供相应的病情参数组合,进而终端11会向用药推荐设备10发送推荐请求,用药推荐设备10响应推荐请求,通过已训练好的用药推荐模型根据相应的病情参数推荐出精确度较高的用药方案,并将推荐的用药方案通过服务器11反馈至终端11中。
在另一种可能的使用场景中,终端11可以为医生使用的终端设备,医生在为患者进行诊治时,可以根据该患者的病情向用药推荐设备10发起用药推荐请求,该用药推荐请求可以携带患者的病情参数组合,进而用药推荐设备10可以根据病情参数组合确定出对应的用药方案,并反馈给终端11,则医生可以查看推荐的用药方案,进而医生可以参考推荐的用药方案为患者确定最终要使用的用药方案。
当然,本申请实施例提供的方法并不限用于图1所示的应用场景中,还可以用于其他可能的应用场景,本申请实施例并不进行限制。对于图1所示的应用场景的各个设备所能实现的功能将在后续的方法实施例中一并进行描述,在此先不过多赘述。下面,将结合附图对本申请实施例的方法进行介绍。
如图2所示,为本申请实施例提供的用药推荐方法的一种流程示意图。该方法可以通过图1中的用药推荐设备10来执行,该方法的流程介绍如下。
步骤201:创建当前用药场景在各个特征维度上的特征数据集。
在本申请实施例中,为了使训练出的用药推荐模型能够适配当前用药场景与需求,可以采用当前用药场景相关的用药数据结合训练模型历史数据进行结合来对模型进行再训练,因此,首先需要准备当前用药场景相关的用药数据。
以当前用药场景为医院为例,当需要进行用药方案推荐的医院具有包含了该医院全科室就诊数据的医院信息集成平台时,训练模型所需的就诊数据可以直接采集于该医院信息集成平台,或者,当需要进行用药方案推荐的医院不具有包含了该医院全科室就诊数据的医院信息集成平台时,而是只具有小的慢性病管理系统或者单科室信息平台时,训练模型所需的就诊数据可以只从相应的慢性病管理系统或者单科室信息平台获取,但这样获取的就诊数据可能会缺少一部分特征数据,例如缺少部分检验或者检查数据,那么此时可以将缺少的数据通过其他方式获取,例如可以通过物理接口将相应数据上传用药推荐设备或采用人工输入的形式导入。此外,当需要进行用药方案推荐的医院不具备任何与就诊数据相关的平台与系统时,可以整理数据后,可以直接通过物理接口将相应数据上传用药推荐设备或采用人工输入的形式导入。
通过上述方式对当前用药场景的就诊数据进行采集之后,则可得到当前用药场景的用于模型训练的就诊数据集。
在本申请实施例中,为了便于训练出的用药推荐模型能够实现模型的可配置化,进而能够与不同的业务场景及需求进行匹配,就需要根据患者的就诊数据的特征维度,建立对应的多个特征数据集。而最初获取的数据中多种特征维度数据混合到一起,因而可以对初始获取的当前用药场景的就诊数据的每一就诊数据进行数据类型识别,并将数据类型识别后的就诊数据根据数据类型添加至对应类型的特征数据集中。
示例性的,由于患者相关的各类就诊数据包括患者基本信息、检验信息、检查信息、诊断信息、用药信息等,所以数据类型具体可以包括为如下的类型的一种或者多种的组合:
(1)身份数据,用于指示患者的基本信息,例如可以包括年龄、性别、身高和体重等。
(2)检验数据,用于指示患者的各个检验项目的检验结果,例如可以包括总胆固醇值或者高密度胆固醇值等。
(3)检查数据,用于指示患者的各个检查项目的检查结果,例如可以包括超声结论(左肾囊肿)或者超声心动图(左房扩大)等。
(4)病情诊断数据,用于指示医生对于患者的病情诊断结果,例如可以包括I型糖尿病、高血压三期或者冠心病等。
(5)用药方案,用于指示基于患者的诊断结果开具的用药方案,例如可以包括:拉贝洛尔,1片/次,口服,3次/1日,共28天等。
如图3所示,为本申请实施例提供的构建特征数据集的一种示意图,根据数据类型先将患者的就诊数据分为5个大特征数据集,分别为身份数据集、检验数据集、检查数据集、病情诊断数据集以及用药方案数据集,每个大特征数据集中又可以分为多个特征数据子集,如检验数据集中可以包括生化11数据子集、血糖数据子集以及胆碱酯酶数据子集等。
所以,在一个就诊数据为“血糖值”被识别为“检验数据”类型中的血糖数据子集时,就可以将“血糖”添加至“检验数据集”的血糖数据子集中。
此外,为了防止在使用过程中对数据的造成丢失或无意识的篡改,通常情况下,会对上述划分了数据子集的特征数据集建立中间数据库,使得在使用就诊数据时,就从中间数据库中调取相应的就诊数据,以确保原始数据库中就诊数据的安全性。
在本申请实施例中,由于在不同信息系统中,数据的表示形式是不相同的,如空腹血糖可以用一个连续的数据“3.9mmol/L~6.1mmol/L”进行表示,也可以用呈“阴性”或者“阳性”这样的文本值进行表示。所以,为了后续能够这些就诊数据合理的进行特征提取与筛除,就需要对各特征数据集的就诊数据进行预处理,预处理可以包括数据转换处理和归一化处理等处理过程。
其中,数据转换处理是指将文本类型的数据转换为数值型数据,例如就诊数据中可以包括患者的空腹血糖呈现“阴性”,为了方便后续的训练时的数据处理,可以将“阴性”转化为对应的数值区间,即“3.9mmol/L~6.1mmol/L”,相应的,“阳性”则可以转化为空腹血糖为“≥6.1mmol/L”的数值区间,进而就可以统一将空腹血糖用数值进行表示,然后将数据化的空腹血糖值进行归一处理。
归一化处理是指将数据映射到0~1的范围内进行处理,例如,可以采用“min-max标准化”方法,同样以空腹血糖为例,就诊数据中空腹血糖最大值28mmol/L,最小值为3.0mmol/L,则当空腹血糖为8.0mmol/L时,对该空腹血糖归一化处理,就可以得到无量纲化且在0~1范围内的数据值0.2。
本申请实施例中,根据获取的各个特征维度的特征数据集可以创建训练样本集,每一个训练样本是包括一个患者多次就诊的就诊数据,一次的就诊数据可以包括病情参数数据组合和用药方案。
由于糖尿病与高血压等慢性病具有显著的时序关联以及周期性用药等特点,且患者的就诊也并不一定都与糖尿病或者高血压相关,所以,针对每一个训练样本,可以根据每个患者的就诊时间的先后顺序对每个训练样本的数据进行划分,换句话说,可以根据就诊时间先后顺序对患者的就诊数据进行建批次,一个批次为一个数据子集,一个数据子集为该患者的一次的就诊时的就诊数据。
以患者小张在A社区医院就诊的历年部分就诊数据为例,如图4所示,为本申请实施例提供的划分数据子集的一种示意图,小张一共在A社区医院就诊5次,就诊时间分别为2019年1月1日、2019年3月1日、2019年6月1日、2019年7月1日以及2019年12月6日,就诊数据包含有空腹血糖、总蛋白以及高密度脂蛋白胆固醇。其中,患者EID为A社区医院给患者小张在的A社区医院信息集成平台中赋予的患者身份编号,报告SN-id为患者小张检验报告的编号,项目sn-id为患者小张所做的检验项目的编号。
根据小张就诊时间的先后顺序,可以将小张在A社区医院就诊的历年就诊数据划分为5个数据子集,每一个数据子集包括以此就诊的病情参数数据组合,分别可以为数据子集n+1、数据子集n+2、数据子集n+3、数据子集n+4以及数据子集n+5,如图4所示。
一个数据子集对应一次就诊时的病情参数数据组合和相应就诊时的用药方案,如图5所示,为本申请实施例提供的数据子集的一种示意图,同样以患者小张的就诊数据为例,患者小张从2019年1月-2020年3月一共就诊了m+1次,所以,根据时间划分获得了m+1个数据子集,其中,每一数据子集中都包含患者小张在相应就诊时间的身份数据、检验数据、检查数据、诊断数据以及用药数据。
步骤202:根据为当前用药场景选定的用药方案推荐相关的特征维度,获取各个特征维度对应的特征数据集。
其中,一个特征维度为一类病情参数数据或者一种用药推荐方案,例如,一类病情参数数据对应一个特征维度,例如可以为身份数据或者检验数据等特征维度。
在本申请实施例中,为了适用当前用药场景以及当前场景的用药推荐需求,因此,在进行模型的再训练时,可以根据当前用药场景以及当前场景的用药推荐需求等选择相应的特征维度,进而可根据选定的各个特征维度的就诊数据来进行后续的模型训练。
示例性的,以A社区医院为例,A社区医院想要为糖尿病和高血压的两病患者进行用药推荐时,就需要训练一个两病用药推荐模型。
如图6所示,为本申请实施例提供的选定特征维度的一种示意图。例如,在A社区医院的医院信息系统中,选定身份信息、检验信息、检查信息、诊断信息以及用药方案信息这5大类信息。由于A社区医院受医疗设备的限制,无法对患者的“高密度脂蛋白胆固醇”进行检测,所以,根据A社区医院的实际情况,可以不选择“高密度脂蛋白胆固醇”这一子特征维度。相应的,后续在获取A社区医院的检验数据集这个特征数据集中,则不会获取“高密度脂蛋白胆固醇”相关数据。
步骤203:根据各个特征维度的特征数据集与训练得到初始用药推荐模型时所用的特征数据集,获得对初始用药推荐模型进行模型再训练所需的第一训练数据集。
其中,第一训练数据集包括多个训练样本,每一训练样本包括一个患者的多次就诊时的病情参数数据组合和每一次就诊时的用药方案。
在本申请实施例中,为了减少后续模型再训练所需的时长,可以对用药推荐模型进行初始的训练,来得到一个较为通用的初始用药推荐模型,进而在实际应用至某个用药推荐场景时,则可以根据当前的用药推荐场景配置当前场景训练所需的特征数据集,将初始用药推荐模型的历史训练的特征数据集与当前场景训练所需的特征数据集进行融合处理,以获取能够对初始用药推荐模型进行模型再训练时所需的第一训练数据集,以初始用药推荐模型的基础上进行模型再训练,进而得到适用于当前场景的目标用药推荐模型。
表1
年龄/岁 | 性别 | 空腹血糖mmol/L | 总蛋白G/L | 诊断信息 | 用药信息 |
50 | 女 | 11 | 57.8 | I型糖尿病 | 方案1 |
55 | 女 | 9.4 | 54.7 | I型糖尿病 | 方案2 |
65 | 男 | 8 | 60.5 | II型糖尿病 | 方案3 |
60 | 女 | 10.5 | 52.4 | I型糖尿病 | 方案4 |
表2
示例性的,假设B医院的两病用药推荐模型为初始用药推荐模型,现在,需要根据B医院的用药推荐模型训练出适合A社区医院的两病用药推荐模型。如表1所示为B医院的两病用药推荐模型的部分就诊数据,以及如表2所示为A社区医院的部分就诊数据,其中,B医院的两病用药推荐模型的就诊数据为(年龄,性别,空腹血糖,总蛋白,高密度脂蛋白胆固醇,诊断信息,用药信息)这些特征维度对应的就诊数据,而A社区医院的就诊数据为(年龄,性别,空腹血糖,总蛋白,诊断信息,用药信息)这些特征维度对应的就诊数据。
由于A社区医院受医疗设备的限制,无法对患者的“高密度脂蛋白胆固醇”进行检测,所以,在将B医院的两病用药推荐模型的就诊数据与A社区医院的就诊数据进行处理时,可以将B医院的两病用药推荐模型的就诊数据的“高密度脂蛋白胆固醇”去除,或者,也可以将A社区医院的就诊数据中“高密度脂蛋白胆固醇”进行赋空值或者赋经验值等处理,然后再将B医院的两病用药推荐模型的就诊数据与A社区医院的就诊数据进行了融合,且在融合时还可以进行去重处理,以获得第一训练数据集,即适用于A社区医院所用的用药推荐模型的训练数据,部分数据参见表3所示,其中,表3具体是以去除B医院的两病用药推荐模型的就诊数据的“高密度脂蛋白胆固醇”为例进行示出。
年龄/岁 | 性别 | 空腹血糖mmol/L | 总蛋白G/L | 诊断信息 | 用药信息 |
50 | 女 | 11 | 57.8 | I型糖尿病 | 方案1 |
55 | 女 | 9.4 | 54.7 | I型糖尿病 | 方案2 |
65 | 男 | 8 | 60.5 | II型糖尿病 | 方案3 |
60 | 女 | 10.5 | 52.4 | I型糖尿病 | 方案4 |
53 | 女 | 10.4 | 56 | II型糖尿病 | 方案5 |
55 | 男 | 11.2 | 61 | I型糖尿病 | 方案6 |
62 | 男 | 9.5 | 57.8 | I型糖尿病 | 方案7 |
58 | 女 | 8.9 | 45.6 | II型糖尿病 | 方案8 |
表3
本申请实施例中,考虑到患者的病症的表现形式以及药物名称等可能在不断变化着的,所以在进行模型训练时,通常情况下,会采用较近时间段的就诊数据构成的数据集来对模型进行训练。但为了提升数据的全面性,还可以结合历史数据结合进行模型训练,也就是说,可以将历史的就诊数据构成的数据集与较近时间段的就诊数据构成的数据集进行融合,以获取更全面的训练数据。
因此,在本申请实施例中,还需要确定是否要将第一训练数据集与距离当前时刻之间的时间间隔大于设定时间阈值的第二训练数据集进行融合,例如,第一训练数据集可以是根据患者近2年的就诊数据获取的,第二训练数据集可以是根据患者2年之前的就诊数据获取的。在确定需要将第一训练数据集与距离当前时刻之间的时间间隔大于设定时间阈值的第二训练数据集进行融合时,就将第二训练数据集加入第二训练数据集中,以获取第三训练数据集,该第三训练数据集就相当于包括了患者所有的就诊数据。进而就可以根据第三训练数据集对初始用药推荐模型进行模型再训练,以得到符合业务方需求的目标用药推荐模型。
本申请实施例中,由于患者的就诊数据中可能存在一些作用较小的、无用的或者重复的病情参数,这些病情参数的存在增大了模型训练的数据量,进而增长了模型训练的时长,且增大了模型训练的难度。因此,在本申请实施例中,可以根据历史预测时各个病情参数对于用药方案预测的预测结果的重要程度确定各个病情参数的权重,进而将第一训练数据集中权重值小于预设的权重阈值的病情参数筛除,以获得第四训练数据集,进而根据第四训练数据集对初始用药推荐模型进行模型再训练,得到目标用药推荐模型。
示例性的,患者小张患有糖尿病,其病情进展具有一定的季节性,在冬季的时候病情容易加重,检验项目中“尿素氮”指标不再是病情比较相关的重要因素,相应的就诊频率和用药方案也会有相应的变动,可知“尿素氮”在冬季对于用药方案预测的预测结果的重要程度较低,按照历史预测“尿素氮”的权值为0.01,而预设的病情参数权重阈值为0.05,所以需要对“检验信息库”中的“尿素氮”这个病情参数进行筛除,以获得经过筛除后的第四训练数据集,进而使用筛除后的第四训练数据集来进行模型再训练,以减小模型训练的时长、降低模型训练的难度。
其中,一些病情参数数据在某些病表现为无效的形式,但该病情参数数据与其他病之间存在较高的相关性,所以,在针对不同病症的用药推荐模型训练时都可以进行病情数据筛选的过程,以选择与病症相关性更高的病情参数数据,筛除相关性更低的病情参数数据。
步骤204:根据第一训练数据集对初始用药推荐模型进行模型再训练,得到目标用药推荐模型。
其中,步骤204中也可以采用上述的第三训练数据集和第四训练数据集对初始用药推荐模型进行模型再训练,以得到目标用药推荐模型。
如图7所示,为本申请实施例提供的再训练过程的一种流程示意图。其中,初始用药推荐模型可以包括多个级联的特征提取单元,则每一次再训练过程介绍如下。
步骤2041:针对每一训练样本,按照就诊时间顺序依次通过特征提取单元对每一次就诊时的病情参数数据组合进行特征提取,得到每一次就诊对应的病情特征向量。
其中,一次就诊时的病情参数数据组合对应一个特征提取单元,每一个特征提取单元的输入为上一特征单元的输出以及对应的病情参数数据组合,第一个特征提取单元的输入为第一次就诊时的病情参数数据组合。
步骤2042:分别根据每一次就诊对应的病情特征向量进行用药方案的预测,得到预测的用药方案。
步骤2043:根据预测的用药方案与训练样本包括用药方案之间的差异确定当前的用药推荐模型收敛时,结束训练。
步骤2044:根据预测的用药方案与训练样本包括用药方案之间的差异确定当前的用药推荐模型未收敛时,更新当前的用药推荐模型,并基于更新后的用药推荐模型进入下一次训练流程。
用药推荐模型具体可以采用能够提取时序性特征的神经网络模型,例如可以为LSTM模型。如图8所示,为以用药推荐模型为LSTM模型为例的训练流程示意图。一个训练样本为一个患者的多次就诊时的病情参数数据组合和每一次就诊时的用药方案构成,以患者小张为例,可以将患者小张的病情参数按照就诊先后顺序划分为t个病情参数数据组合,分别为X1,···,Xt,其中X1为小张第1次就诊时的病情参数数据组合,Xt小张第t次就诊时的病情参数数据组合,以此类推。
在进行训练时,将X1对应输入第1个特征提取单元中,会通过第1个特征提取单元对小张第1次就诊时的病情参数数据组合进行特征提取,以得到X1对应的病情特征向量,进而再将第1个特征提取单元输出的病情特征向量以及X2输入至第2个特征提取单元,以输出X2对应的病情特征向量,以此类推。其中,由于后续2至t个特征提取单元均结合上一个特征提取单元的输出,因而输出的病情特征向量均是融合了之前的就诊数据的信息的,并可以提取病情发展的时序性特征。
在得到t个病情特征向量之后,可以通过预测层预测得到t个用药方案,然后可以通过损失函数对预测的用药方案和已有用药方案进行对比,并获得预测的用药方案和已有用药方案的差异值,即计算出的相应的损失值,损失值越小,表明预测的用药方案和已有用药方案之间的差异就越小。
其中,损失函数可以为0-1损失函数、绝对值损失函数、平方损失函数以及交叉熵损失函数等。
步骤205:根据输入的待推荐的病情参数数据组合,通过目标用药推荐模型得到对应的用药推荐方案。
表4
延续上述A医院的例子,在获得了A社区医院的目标用药推荐模型之后,在A医院的用药推荐系统界面中,输入相应的病情参数数据,如图9所示,为本申请实施例提供的用药推荐系统界面的一种示意图,例如可以在身份信息栏输入“65岁,男”,在检验信息栏输入“空腹血糖11mmol/L,总蛋白57.8G/L”,检查信息栏输入“无”,在诊断信息栏输入“I型糖尿病”,则该用药推荐系统可以调用已训练的目标用药推荐模型根据输入的病情参数数据推荐出相应的用药方案,并在用药推荐系统界面中进行显示,具体的用药推荐方案可以如表4所示。
此外,还可以在用药推荐方案中,推荐方案具体可以包括各个药品的包装规格、剂型和厂家等信息。
在具体应用时,可以输出多个用药方案,并给出各个推荐方案的推荐率,推荐率可以与目标用药推荐模型预测的与病情参数数据组合之间相关度有关。
综上所述,本申请实施例中,通过结合当前用药场景和训练初始用药推荐模型所使用的训练数据,得到新的训练数据集,来对初始用药推荐模型进行再训练,以获取针对当前用药场景的目标用药推荐模型,进而可以使用训练得到的目标用药推荐模型来进行用药推荐。其中,训练目标用药推荐模型包含了较多的训练样本,且每一训练样本包括一个患者的多次就诊时的病情参数数据组合和每一次就诊时的用药方案,使得训练的目标用药推荐模型考虑了患者病情时序性与周期性的特点,以及通过大量的样本学习可以提升目标用药推荐模型的用药方案推荐的精准度。此外,由于目标用药推荐模型是在初始用药推荐模型上进行再训练获得,可以减少模型参数收敛的速度,大大的减少模型训练的时长。
如图10所示,基于同一发明构思,本申请实施例提供一种用药推荐装置100,该装置包括:
第一获取单元1001,用于根据为当前用药场景选定的各个特征维度包括的病情参数,获取各个特征维度对应的特征数据集;其中,一个特征维度为一类病情参数数据或者一种用药推荐方案;
第二获取单元1002,用于根据各个特征维度的特征数据集与训练得到初始用药推荐模型时所用的特征数据集,获得对初始用药推荐模型进行模型再训练所需的第一训练数据集;其中,第一训练数据集包括多个训练样本,每一训练样本包括一个患者的多次就诊时的病情参数数据组合和每一次就诊时的用药方案;
训练单元1003,用于根据第一训练数据集对初始用药推荐模型进行模型再训练,得到目标用药推荐模型;
用药推荐单元1004,用于根据输入的待推荐的病情参数数据组合,通过目标用药推荐模型得到对应的用药推荐方案。
可选的,训练单元1003,还用于:
针对每一训练样本,按照就诊时间顺序依次通过特征提取单元对每一次就诊时的病情参数数据组合进行特征提取,得到每一次就诊对应的病情特征向量;其中,一次就诊时的病情参数数据组合对应一个特征提取单元,每一个特征提取单元的输入为上一特征单元的输出以及对应的病情参数数据组合,第一个特征提取单元的输入为第一次就诊时的病情参数数据组合;
分别根据每一次就诊对应的病情特征向量进行用药方案的预测,得到预测的用药方案;
根据预测的用药方案与训练样本包括用药方案之间的差异确定当前的用药推荐模型收敛时,结束训练;或者,
根据预测的用药方案与训练样本包括用药方案之间的差异确定当前的用药推荐模型未收敛时,更新当前的用药推荐模型,并基于更新后的用药推荐模型进入下一次训练流程。
可选的,该装置还包括:
确定单元1005,用于根据配置信息确定是否将第一训练数据集与距离当前时刻的时间间隔大于设定时间阈值的第二训练数据集进行融合;
融合单元1006,用于在确定将第一训练数据集与距离当前时刻之间的时间间隔大于设定时间阈值的第二训练数据集进行融合时,将第二训练数据集加入第二训练数据集中,以获取第三训练数据集;
训练单元1003,还用于:
根据第三训练数据集对初始用药推荐模型进行模型再训练,得到目标用药推荐模型。
可选的,确定单元1005,还用于根据历史预测时各个病情参数对于用药方案预测的预测结果的重要程度确定各个病情参数的权重;
第二获取单元1002,还用于将第一训练数据集中权重值小于预设的权重阈值的病情参数筛除,以获得第四训练数据集;
训练单元1003,还用于根据第四训练数据集对初始用药推荐模型进行模型再训练,得到目标用药推荐模型。
可选的,第一获取单元1001,还用于:
获取当前用药场景的就诊数据集;
针对就诊数据集中的每一就诊数据进行数据类型识别,并根据数据类型将就诊数据添加至对应类型的特征数据集中。
可选的,所述数据类型包括如下类型中的一种或者多种:
身份数据;
检验数据;
检查数据;
诊断病情数据;
用药方案。
该装置可以用于执行图2~图9所示的实施例中所述的方法,因此,对于该装置的各功能模块所能够实现的功能等可参考图2~图9所示的实施例的描述,不多赘述。图10中的虚线框为该装置的非主要单元。
请参见图11,基于同一技术构思,本申请实施例还提供了一种计算机设备110,可以包括存储器1101和处理器1102。
所述存储器1101,用于存储处理器1102执行的计算机程序。存储器1101可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据计算机设备的使用所创建的数据等。处理器1102,可以是一个中央处理单元(central processing unit,CPU),或者为数字处理单元等等。本申请实施例中不限定上述存储器1101和处理器1102之间的具体连接介质。本申请实施例在图11中以存储器1101和处理器1102之间通过总线1103连接,总线1103在图11中以粗线表示,其它部件之间的连接方式,仅是进行示意性说明,并不引以为限。所述总线1103可以分为地址总线、数据总线、控制总线等。为便于表示,图11中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
存储器1101可以是易失性存储器(volatile memory),例如随机存取存储器(random-access memory,RAM);存储器1101也可以是非易失性存储器(non-volatilememory),例如只读存储器,快闪存储器(flash memory),硬盘(hard disk drive,HDD)或固态硬盘(solid-state drive,SSD)、或者存储器1101是能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。存储器1101可以是上述存储器的组合。
处理器1102,用于调用所述存储器1101中存储的计算机程序时执行如图2~图9所示的实施例中设备所执行的方法。
在一些可能的实施方式中,本申请提供的方法的各个方面还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在计算机设备上运行时,所述程序代码用于使所述计算机设备执行本说明书上述描述的根据本申请各种示例性实施方式的方法中的步骤,例如,所述计算机设备可以执行如图2~图9所示的实施例中所述的方法。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。或者,本发明上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本发明各个实施例所述方法的全部或部分。而前述的存储介质包括:移动存储设备、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。
Claims (10)
1.一种用药推荐方法,其特征在于,所述方法包括:
根据为当前用药场景选定的各个特征维度包括的病情参数,获取各个特征维度对应的特征数据集;其中,一个特征维度为一类病情参数数据或者一种用药推荐方案;
根据所述各个特征维度的特征数据集与训练得到初始用药推荐模型时所用的特征数据集,获得对所述初始用药推荐模型进行模型再训练所需的第一训练数据集;其中,所述第一训练数据集包括多个训练样本,每一训练样本包括一个患者的多次就诊时的病情参数数据组合和每一次就诊时的用药方案;
根据所述第一训练数据集对所述初始用药推荐模型进行模型再训练,得到目标用药推荐模型;
根据输入的待推荐的病情参数数据组合,通过所述目标用药推荐模型得到对应的用药推荐方案。
2.如权利要求1所述的方法,其特征在于,所述初始用药推荐模型包括多个级联的特征提取单元,则每一次再训练过程包括:
针对每一训练样本,按照就诊时间顺序依次通过所述特征提取单元对每一次就诊时的病情参数数据组合进行特征提取,得到每一次就诊对应的病情特征向量;其中,一次就诊时的病情参数数据组合对应一个特征提取单元,每一个特征提取单元的输入为上一特征单元的输出以及对应的病情参数数据组合,第一个特征提取单元的输入为第一次就诊时的病情参数数据组合;
分别根据每一次就诊对应的病情特征向量进行用药方案的预测,得到预测的用药方案;
根据预测的用药方案与训练样本包括用药方案之间的差异确定当前的用药推荐模型收敛时,结束训练;或者,
根据预测的用药方案与训练样本包括用药方案之间的差异确定当前的用药推荐模型未收敛时,更新当前的用药推荐模型,并基于更新后的用药推荐模型进入下一次训练流程。
3.如权利要求1所述的方法,其特征在于,在根据所述各个特征维度的特征数据集与训练得到初始用药推荐模型时所用的特征数据集,获得对所述初始用药推荐模型进行模型再训练所需的第一训练数据集之后,所述方法还包括:
根据配置信息确定是否将所述第一训练数据集与距离当前时刻的时间间隔大于设定时间阈值的第二训练数据集进行融合;
在确定将所述第一训练数据集与距离当前时刻之间的时间间隔大于设定时间阈值的第二训练数据集进行融合时,将所述第二训练数据集加入所述第二训练数据集中,以获取第三训练数据集;
则根据所述第一训练数据集对所述初始用药推荐模型进行模型再训练,得到目标用药推荐模型,包括:
根据所述第三训练数据集对所述初始用药推荐模型进行模型再训练,得到所述目标用药推荐模型。
4.如权利要求1所述的方法,其特征在于,在根据所述第一训练数据集对所述初始用药推荐模型进行模型再训练,得到目标用药推荐模型之前,所述方法还包括:
根据历史预测时各个病情参数对于用药方案预测的预测结果的重要程度确定各个病情参数的权重;
将所述第一训练数据集中权重值小于预设的权重阈值的病情参数筛除,以获得第四训练数据集;
则根据所述第一训练数据集对所述初始用药推荐模型进行模型再训练,得到目标用药推荐模型,包括:
根据所述第四训练数据集对所述初始用药推荐模型进行模型再训练,得到所述目标用药推荐模型。
5.如权利要求1所述的方法,其特征在于,在根据为当前用药场景选定的用药方案推荐相关的特征维度,获取各个特征维度对应的特征数据集之前,所述方法还包括:
获取当前用药场景的就诊数据集;
针对所述就诊数据集中的每一就诊数据进行数据类型识别,并根据数据类型将就诊数据添加至对应类型的特征数据集中。
6.如权利要求5所述的方法,其特征在于,所述数据类型包括如下类型中的一种或者多种:
身份数据;
检验数据;
检查数据;
诊断病情数据;
用药方案。
7.一种用药推荐装置,其特征在于,所述装置包括:
第一获取单元,用于根据为当前用药场景选定的各个特征维度包括的病情参数,获取各个特征维度对应的特征数据集;其中,一个特征维度为一类病情参数数据或者一种用药推荐方案;
第二获取单元,用于根据所述各个特征维度的特征数据集与训练得到初始用药推荐模型时所用的特征数据集,获得对所述初始用药推荐模型进行模型再训练所需的第一训练数据集;其中,所述第一训练数据集包括多个训练样本,每一训练样本包括一个患者的多次就诊时的病情参数数据组合和每一次就诊时的用药方案;
训练单元,用于根据所述第一训练数据集对所述初始用药推荐模型进行模型再训练,得到目标用药推荐模型;
用药推荐单元,用于根据输入的待推荐的病情参数数据组合,通过所述目标用药推荐模型得到对应的用药推荐方案。
8.如权利要求7所述的装置,其特征在于,所述装置还包括:
确定单元,用于根据配置信息确定是否将所述第一训练数据集与距离当前时刻的时间间隔大于设定时间阈值的第二训练数据集进行融合;
融合单元,用于在确定将所述第一训练数据集与距离当前时刻之间的时间间隔大于设定时间阈值的第二训练数据集进行融合时,将所述第二训练数据集加入所述第二训练数据集中,以获取第三训练数据集;
所述训练单元,还用于根据所述第三训练数据集对所述初始用药推荐模型进行模型再训练,得到所述目标用药推荐模型。
9.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,
所述处理器执行所述计算机程序时实现权利要求1至6任一项所述方法的步骤。
10.一种计算机存储介质,其上存储有计算机程序指令,其特征在于,
该计算机程序指令被处理器执行时实现权利要求1至6任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011370981.0A CN112447270A (zh) | 2020-11-30 | 2020-11-30 | 一种用药推荐方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011370981.0A CN112447270A (zh) | 2020-11-30 | 2020-11-30 | 一种用药推荐方法、装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112447270A true CN112447270A (zh) | 2021-03-05 |
Family
ID=74738106
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011370981.0A Pending CN112447270A (zh) | 2020-11-30 | 2020-11-30 | 一种用药推荐方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112447270A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112951430A (zh) * | 2021-03-29 | 2021-06-11 | 阿斯利康投资(中国)有限公司 | 多种慢性疾病联合管理设备和计算机可读存储介质 |
CN113643784A (zh) * | 2021-08-31 | 2021-11-12 | 平安医疗健康管理股份有限公司 | 门慢的异常行为监控方法、装置、设备以及存储介质 |
CN113782146A (zh) * | 2021-09-16 | 2021-12-10 | 平安科技(深圳)有限公司 | 基于人工智能的全科用药推荐方法、装置、设备及介质 |
CN116612852A (zh) * | 2023-07-20 | 2023-08-18 | 青岛美迪康数字工程有限公司 | 一种实现药物推荐的方法、装置和计算机设备 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB201818360D0 (en) * | 2018-11-12 | 2018-12-26 | Healint Pte Ltd | Medication recommendation system and method for treating migraine |
CN110689939A (zh) * | 2019-08-27 | 2020-01-14 | 天津开心生活科技有限公司 | 一种用药序列的推荐方法、装置、可读介质及电子设备 |
CN110851725A (zh) * | 2019-11-15 | 2020-02-28 | 北京盛诺一家医院管理咨询有限公司 | 一种医疗资源推荐方法、系统、计算设备和存储介质 |
CN111863181A (zh) * | 2020-07-15 | 2020-10-30 | 至本医疗科技(上海)有限公司 | 药品推荐方法、装置、计算机设备和存储介质 |
CN111971751A (zh) * | 2018-02-08 | 2020-11-20 | 通用电气公司 | 用于评估动态数据的系统和方法 |
-
2020
- 2020-11-30 CN CN202011370981.0A patent/CN112447270A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111971751A (zh) * | 2018-02-08 | 2020-11-20 | 通用电气公司 | 用于评估动态数据的系统和方法 |
GB201818360D0 (en) * | 2018-11-12 | 2018-12-26 | Healint Pte Ltd | Medication recommendation system and method for treating migraine |
CN110689939A (zh) * | 2019-08-27 | 2020-01-14 | 天津开心生活科技有限公司 | 一种用药序列的推荐方法、装置、可读介质及电子设备 |
CN110851725A (zh) * | 2019-11-15 | 2020-02-28 | 北京盛诺一家医院管理咨询有限公司 | 一种医疗资源推荐方法、系统、计算设备和存储介质 |
CN111863181A (zh) * | 2020-07-15 | 2020-10-30 | 至本医疗科技(上海)有限公司 | 药品推荐方法、装置、计算机设备和存储介质 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112951430A (zh) * | 2021-03-29 | 2021-06-11 | 阿斯利康投资(中国)有限公司 | 多种慢性疾病联合管理设备和计算机可读存储介质 |
CN113643784A (zh) * | 2021-08-31 | 2021-11-12 | 平安医疗健康管理股份有限公司 | 门慢的异常行为监控方法、装置、设备以及存储介质 |
CN113782146A (zh) * | 2021-09-16 | 2021-12-10 | 平安科技(深圳)有限公司 | 基于人工智能的全科用药推荐方法、装置、设备及介质 |
CN113782146B (zh) * | 2021-09-16 | 2023-08-22 | 平安科技(深圳)有限公司 | 基于人工智能的全科用药推荐方法、装置、设备及介质 |
CN116612852A (zh) * | 2023-07-20 | 2023-08-18 | 青岛美迪康数字工程有限公司 | 一种实现药物推荐的方法、装置和计算机设备 |
CN116612852B (zh) * | 2023-07-20 | 2023-10-31 | 青岛美迪康数字工程有限公司 | 一种实现药物推荐的方法、装置和计算机设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111696675B (zh) | 基于物联网数据的用户数据分类方法、装置及计算机设备 | |
US20210398675A1 (en) | Method and system for medical suggestion search | |
Dey et al. | Big data analytics for intelligent healthcare management | |
US11464455B2 (en) | Method and apparatus of context-based patient similarity | |
CN112447270A (zh) | 一种用药推荐方法、装置、设备及存储介质 | |
CN112071425A (zh) | 一种数据处理方法、装置、计算机设备及存储介质 | |
EP3928322A1 (en) | Automated generation of structured patient data record | |
CN110291555B (zh) | 用于促进对健康状况的计算分析的系统和方法 | |
CN108461110B (zh) | 医疗信息处理方法、装置及设备 | |
WO2015035302A2 (en) | Electrical computing devices for recruiting a patient population for a clinical trial | |
WO2020172607A1 (en) | Systems and methods for using deep learning to generate acuity scores for critically ill or injured patients | |
CN112908452A (zh) | 事件数据建模 | |
US11710572B2 (en) | Experience engine-method and apparatus of learning from similar patients | |
CN109598302B (zh) | 就诊费用预测方法、装置、设备及计算机可读存储介质 | |
US20210319861A1 (en) | Knowledge base completion for constructing problem-oriented medical records | |
CN105701330B (zh) | 健康信息处理方法及系统 | |
CN109102845B (zh) | 医疗单据审核方法、装置、计算机设备和存储介质 | |
CN111279424A (zh) | 用于优化图像采集工作流的设备、系统和方法 | |
US20210142882A1 (en) | Techniques for image-based examination of dialysis access sites | |
CN118522396B (zh) | 一种临床诊疗数据录入方法及系统 | |
Talukder | Clinical decision support system: an explainable AI approach | |
US20240079102A1 (en) | Methods and systems for patient information summaries | |
CN112509688B (zh) | 压疮图片自动分析系统、方法、设备和介质 | |
CN111814060B (zh) | 医学知识学习推荐方法及系统 | |
WO2023178789A1 (zh) | 患病风险估计网络的优化方法、装置、介质及设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210305 |