CN112908453B - 数据处理方法、装置、设备和介质 - Google Patents
数据处理方法、装置、设备和介质 Download PDFInfo
- Publication number
- CN112908453B CN112908453B CN202110178903.9A CN202110178903A CN112908453B CN 112908453 B CN112908453 B CN 112908453B CN 202110178903 A CN202110178903 A CN 202110178903A CN 112908453 B CN112908453 B CN 112908453B
- Authority
- CN
- China
- Prior art keywords
- data
- detection data
- user identifier
- user
- detection
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003672 processing method Methods 0.000 title abstract description 16
- 238000001514 detection method Methods 0.000 claims abstract description 344
- 230000036541 health Effects 0.000 claims abstract description 126
- 238000000034 method Methods 0.000 claims abstract description 45
- 238000004458 analytical method Methods 0.000 claims description 33
- 238000012545 processing Methods 0.000 claims description 28
- 230000004927 fusion Effects 0.000 claims description 22
- 230000002159 abnormal effect Effects 0.000 claims description 20
- 238000004590 computer program Methods 0.000 claims description 11
- 238000012544 monitoring process Methods 0.000 claims description 9
- 230000005180 public health Effects 0.000 claims description 7
- 238000007781 pre-processing Methods 0.000 claims description 6
- 238000012216 screening Methods 0.000 claims description 3
- 230000036772 blood pressure Effects 0.000 description 29
- 230000008569 process Effects 0.000 description 22
- 238000010586 diagram Methods 0.000 description 16
- 238000012806 monitoring device Methods 0.000 description 15
- 239000008280 blood Substances 0.000 description 14
- 210000004369 blood Anatomy 0.000 description 14
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 12
- 239000008103 glucose Substances 0.000 description 12
- 239000003814 drug Substances 0.000 description 7
- 230000006870 function Effects 0.000 description 6
- 229940079593 drug Drugs 0.000 description 5
- 238000012549 training Methods 0.000 description 5
- 230000008859 change Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 230000002354 daily effect Effects 0.000 description 4
- 230000035622 drinking Effects 0.000 description 4
- 230000003862 health status Effects 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 230000000391 smoking effect Effects 0.000 description 4
- 238000010606 normalization Methods 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 230000005856 abnormality Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000009530 blood pressure measurement Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- YHXISWVBGDMDLQ-UHFFFAOYSA-N moclobemide Chemical compound C1=CC(Cl)=CC=C1C(=O)NCCN1CCOCC1 YHXISWVBGDMDLQ-UHFFFAOYSA-N 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H40/00—ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices
- G16H40/20—ICT specially adapted for the management or administration of healthcare resources or facilities; ICT specially adapted for the management or operation of medical equipment or devices for the management or administration of healthcare resources or facilities, e.g. managing hospital staff or surgery rooms
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H10/00—ICT specially adapted for the handling or processing of patient-related medical or healthcare data
- G16H10/60—ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Public Health (AREA)
- Epidemiology (AREA)
- Primary Health Care (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Data Mining & Analysis (AREA)
- Pathology (AREA)
- Databases & Information Systems (AREA)
- Business, Economics & Management (AREA)
- General Business, Economics & Management (AREA)
- Measuring And Recording Apparatus For Diagnosis (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本申请公开了一种数据处理方法、装置、设备和介质。该方法包括:获取第一检测数据,基于第一检测数据以及与至少一个用户标识对应的样本数据集,确定至少一个用户标识中是否存在目标用户标识,若是,建立第一检测数据与目标标识用户的对应关系;获取与目标用户标识对应的第二检测数据,以及基于对应关系获取与目标用户标识对应的第一检测数据,将第一检测数据和第二检测数据融合得到与目标用户标识对应的融合检测数据。解决了检测数据异常归档以及健康数据单一的问题。
Description
技术领域
本申请一般涉及数据处理领域,具体涉及一种数据处理方法、装置、设备和介质。
背景技术
在医疗健康领域,以互联网技术为依托的医疗信息系统已经广泛的应用于社会生活中,该医疗信息系统可以实现用户健康数据的上传、保存和分析等功能,为用户、医院和社会机构等各方提供了便利。
其中,该医疗信息系统可以是医院信息系统(Hospital Information System,HIS),可以将用户在医院治疗期间产生的各种数据进行有效的采集、处理和存储,便于掌握用户在医院治疗期间的各种健康数据;或者,该医疗信息系统可以是基本公共卫生管理系统,该系统可以将社区中心站、乡镇卫生院或者村卫生所等医疗机构采集的用户数据进行汇总和处理,形成用户健康档案;该医疗信息系统还可以是基于物联网的健康监测系统,该系统可以对用户日常生活和健康管理过程中的检测数据进行收集和存储,便于对用户的健康状况进行长期的监控。
但是,对于用户在日常生活中采集的检测数据,可能会出现归档错误以及对异常检测数据进行归档的情况,导致用户的检测数据质量差;且现有的各种医疗信息系统通常是独立运行的信息系统,基于不同系统的用户数据获得到的用户健康状况可能会存在差异,无法真实反映用户的真实健康状况,不利于用户的健康管理以及疾病诊断。
发明内容
鉴于现有技术中的上述缺陷或不足,期望提供一种提高用户检测数据质量和能真实反映用户健康状况的数据处理方法、装置、设备和介质。
第一方面,本申请提供了一种数据处理方法,包括:
获取第一检测数据,第一检测数据为与第一数据系统对应的检测数据;
基于第一检测数据以及与至少一个用户标识对应的样本数据集,确定至少一个用户标识中是否存在目标用户标识,样本数据集包括与第一数据系统和与至少一个第二数据系统分别对应的多个样本数据;
若是,建立第一检测数据与目标标识用户的对应关系;
获取与目标用户标识对应的第二检测数据,以及基于对应关系获取与目标用户标识对应的第一检测数据,第二检测数据包括与至少一个第二数据系统对应的检测数据;
将第一检测数据和第二检测数据融合得到与目标用户标识对应的融合检测数据;
第二方面,本申请提供了一种数据处理装置,包括:
获取模块,被配置为获取第一检测数据,第一检测数据为与第一数据系统对应的检测数据;
确定模块,被配置为基于第一检测数据以及与至少一个用户标识对应的样本数据集,确定至少一个用户标识中是否存在目标用户标识,样本数据集包括与第一数据系统和与至少一个第二数据系统分别对应的多个样本数据;
建立模块,被配置为若是,建立第一检测数据与目标标识用户的对应关系;
获取模块,还被配置为获取与目标用户标识对应的第二检测数据,以及基于对应关系获取与目标用户标识对应的第一检测数据,第二检测数据包括与至少一个第二数据系统对应的检测数据;
融合模块,被配置为将第一检测数据和第二检测数据融合得到与目标用户标识对应的融合检测数据;
第三方面,本申请提供了一种计算机设备,计算机设备包括存储器、处理器以及存储在存储器并可在处理器上运行的计算机程序,处理器用于执行程序时实现如第一方面的方法;
第四方面,本申请提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序用于实现如第一方面的方法。
本申请的实施例提供的技术方案可以包括以下有益效果:
本申请实施例提供的数据处理方法、装置、设备和介质,可以获取第一检测数据,基于第一检测数据以及与至少一个用户标识对应的样本数据集,确定至少一个用户标识中是否存在目标用户标识,若是,建立第一检测数据与目标标识用户的对应关系;获取与目标用户标识对应的第二检测数据,以及基于对应关系获取与目标用户标识对应的第一检测数据,将第一检测数据和第二检测数据融合得到与目标用户标识对应的融合检测数据;实现了对检测数据的高精度归档,保证了获取的用户检测数据的质量,以及将包括归档后的检测数据在内的多源检测数据进行融合,便于全面准确的掌握用户的健康状况。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1为本申请实施例提供的一种数据处理方法的实时环境架构图;
图2为本申请实施例提供的一种多源健康数据智能归档系统的结构示意图;
图3为本申请实施例提供的一种健康档案建立示意图;
图4为本申请实施例提供的一种数据处理方法的流程示意图;
图5为本申请实施例提供的另一种数据处理方法的流程示意图;
图6为本申请实施例提供的一种健康状况分析结果示意图;
图7为本申请实施例提供的另一种健康状况分析结果示意图;
图8为本申请实施例提供的另一种健康状况分析结果示意图;
图9为本申请实施例提供的另一种健康状况分析结果示意图;
图10为本申请实施例提供的一种数据处理装置的结构示意图;
图11为本申请实施例提供的另一种数据处理装置的结构示意图;
图12为本申请实施例提供的另一种数据处理装置的结构示意图;
图13为本申请实施例提供的一种计算机设备的结构示意图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
图1是本申请实施例提供的一种数据处理方法的实施环境架构图。如图1所示,该实施环境架构包括:至少一个第一终端110、第二终端120和用户终端130,该第二终端120与每个第一终端110建立网络连接,该用户终端130与该第二终端120建立网络连接,该第一终端110用于运行第一数据系统或者第二数据系统,该第二终端120用于运行多源健康数据智能归档系统。该第一终端110和第二终端120可以为具备数据处理能力的计算机、服务器或者服务器集群等,该用户终端130可以为手机、平板电脑以及计算机等电子设备。
其中,该第一数据系统可以为物联网健康监测系统,运行该第一数据系统的第一终端110可以与用户日常生活中使用的电子健康监测设备1101建立网络连接,获取并存储用户日常生活中利用该电子健康监测设备1101检测获取的第一检测数据,同时将该第一检测数据上传至第二终端120中的数据湖中进行存储,该电子健康监测设备可以是血压计、血糖仪以及可穿戴智能监测设备。
需要说明的是,在本申请实施例中,电子健康监测设备通常可以测量至少一个用户的第一检测数据,电子健康监测设备可以响应于对至少一个用户标识的绑定操作,为电子健康监测设备绑定至少一个用户标识,该电子健康监测设备可以将该电子健康设备标识和对应的至少一个用户标识发送至运行第一数据系统的第一终端,该第一数据系统可以将与每个电子健康设备标识和对应的至少一个用户标识以设备信息表的形式进行存储,并将该设备信息表发送至第二终端120中的数据湖中进行存储;在电子健康监测设备获取到第一检测数据后,可以将该第一检测数据以及与电子健康监测设备对应的电子健康设备标识发送至运行第一数据系统的第一终端,该第一数据系统可以将第一检测数据存储至与电子健康设备标识对应的检测数据表中进行存储,同时将该第一检测数据上传至第二终端120中的数据湖中与电子健康设备标识对应的检测数据表中进行存储,其中,用户标识可以是用户身份证号码或用户医保号。
同时,用户可以通过用户终端130中与多源健康数据智能归档系统对应的应用程序注册用户账号,用户终端130响应于用户的信息选择或者填写操作,获取用户基础信息、使用的电子健康监测设备的电子健康设备标识,以及绑定该电子健康监测设备的至少一个用户的用户标识,生成注册用户信息表并同步至第二终端120中进行存储。其中,该与多源健康数据智能归档系统对应的应用程序可以包括微信小程序、支付宝小程序和/或web管理端。
在本申请实施例中,用户基础信息可以是与用户标识对应用户的基本信息以及用户生活习惯等信息。该基本信息可以是身高、年龄以及性别等信息,该用户生活习惯可以是:是否抽烟、是否喝酒、居住环境、劳动强度以及运动习惯等信息。在注册用户信息表中,与用户基础信息对应的用户基础信息数据可以是:对于性别,男性可以用数字1表示,女性可以用数字0表示,对于抽烟习惯,抽烟可以用数字1表示,不抽烟可以用数字0表示;对于喝酒习惯,喝酒可以用数字1表示,不喝酒可以用数字0表示;对于居住环境,南方城市可以用数字0表示,南方农村可以用数字1表示,北方城市可以用数字2表示,北方农村可以用数字3表示;对于劳动强度,卧床休息可以用数字0表示,轻体力劳动可以用数字1表示,中体力劳动可以用数字2表示,重体力劳动可以用数字3表示;对于运动习惯,基本不运动可以用数字0表示,平均一周运动1次可以用数字1表示,平均一周运动2次可以用数字2表示,平均运动3次可以用数字3表示。
该第二数据系统可以为医院信息系统和/或基本公共卫生管理系统,运行该第二数据系统的第一终端110可以采集并存储用户在医院、社区中心站、乡镇卫生院或者村卫生所等医疗场所进行医疗检测时所产生各种第二检测数据以及药品处方数据,并将该第二检测数据以及药品处方数据发送至第二终端120中的数据湖中进行存储。
如图2所示,该多源健康数据智能归档系统包括数据采集层,后台支持层,以及数据展示层,其中,数据采集层用于接收第一数据系统发送的电子健康监测设备检测的第一检测数据、第二数据系统发送的第二检测数据,以及获取用户在用户终端的微信小程序、支付宝小程序和/或web管理端上的用户信息注册信息;后台支持层用于将数据采集层采集到的数据保存至数据湖中,并利用与该后台支持层对应的业务子系统和大数据智能分析子系统对该数据湖中的数据进行处理,以获取数据处理结果;数据展示层用于将数据处理结果发送至用户终端的微信小程序、支付宝小程序和/或web管理端上进行展示,或者,将该数据处理结果发送医院、社区中心站、乡镇卫生院或者村卫生所等医疗场所的商业智能(Business Intelligence:BI)大屏上进行展示,便于用户和医生及时获取用户的健康数据。
其中,若当前时刻为检测数据获取时刻,对于在该第二终端120运行的多源健康数据智能归档系统中注册的每个用户标识,如图3所示,该业务子系统可以在数据湖中获取第一数据系统在检测数据生成周期内发送的与该用户标识对应的第一检测数据,以及在数据湖中获取第二数据系统在检测数据生成周期内发送的与该用户标识对应的第二检测数据,将第一检测数据和第二检测数据得到融合检测数据,并将融合检测数据存储至与每个用户标识对应的健康数据表,建立用户的健康档案,其中,该第一数据系统为物联网健康监测系统,该第二数据系统可以为医院信息系统和基本公共卫生管理系统;大数据智能分析子系统可以基于健康数据表得到与每个用户标识对应的健康状况分析结果,用户可以利用用户终端130中与多源健康数据智能归档系统对应的应用程序获取到该健康状况分析结果,或者,在第二终端确定与用户标识对应的健康状况分析结果出现异常时,可以将该健康状况分析结果发送至用户终端130,以便于用户及时获取异常用户健康状况信息,且可以将该异常健康状况分析结果发送至与第二数据系统对应的第一终端110,便于医生或者健康管理师对患者及时进行回访。其中,检测数据生成周期为相邻两个检测数据获取时刻之间的时间区间。可以理解的是,为了保护用户隐私和数据安全,各系统和设备之间的数据在传输过程中均是经过加密处理的数据。
需要说明的是,在相关技术中,对于运行第一数据系统的第一终端110中存储的第一检测数据,第一数据系统可能会出现归档错误以及对异常检测数据进行归档的情况,例如,绑定同一血压计的三名用户A1、用户A2和用户A3,假设用户B1用该血压计进行了一次血压测量得到一次血压检测数据,该第一数据系统一般会将该血压检测数据归档为用户A1、用户A2或者用户A3的健康数据表中,导致该用户的健康数据出现异常。
因此,在本申请实施例中,第二终端120可以在当前时刻为检测数据获取时刻时,在数据湖中查找与每个在多源健康数据智能归档系统中已注册电子健康设备标识对应的检测数据表,确定检测数据生成周期内,数据湖中是否接收到第一终端110发送的第一检测数据,若是,获取该第一检测数据,并基于第一检测数据以及与至少一个用户标识对应的样本数据集,确定至少一个用户标识中是否存在目标用户标识,若是,确定第一检测数据与目标标识用户的对应关系,可以防止第一检测数据的错误归档;且确定该至少一个用户标识中不存在目标用户标识时,可以确定该第一检测数据为异常检测数据,并将该异常检测数据删除,无需对该异常第一检测数据进行归档。其中,该至少一个用户标识为与电子健康设备标识对应的用户标识。
本申请实施例提供一种数据处理方法,该方法可以应用于如图1所示的第二终端中,如图4所示,该方法包括:
步骤201、获取第一检测数据。
在本步骤中,获取第一检测数据的过程可以是:在当前时刻为检测数据获取时刻,查找注册用户信息表得到至少一个电子健康设备标识,在数据湖中查找与每个电子健康设备标识对应的检测数据表,确定检测数据生成周期内是否有第一检测数据生成,若是,获取该第一检测数据。其中,该检测数据获取时刻可以基于实际需要确定,本申请实施例对此不做限定。示例的,该检测数据获取时刻可以为每日23点40分。
进一步的,在本申请实施例中,在获取到第一检测数据同时,还需要确定与第一检测数据对应的至少一个用户标识,该至少一个用户标识为与用于生成该第一检测数据的电子健康监测设备绑定的用户标识。
其中,确定与第一检测数据对应的至少一个用户标识的过程可以是:确定与第一检测数据对应的电子健康设备标识为目标电子健康设备标识,查找与该目标电子健康设备标识对应的设备信息表,确定与该目标电子健康设备标识对应的至少一个用户标识,确定与该目标电子健康设备标识对应的至少一个用户标识为与第一检测数据对应的至少一个用户标识。
需要说明的是,在本申请实施例中,每个检测数据生成周期内生成的第一检测数据可能不止一个,对于每个第一检测数据,可以上述实施例中的方式,确定与每个第一检测数据对应的至少一个用户标识。
步骤202、基于第一检测数据以及与至少一个用户标识对应的样本数据集,确定至少一个用户标识中是否存在目标用户标识。
在本申请实施例中,样本数据集包括与第一数据系统和与至少一个第二数据系统分别对应的多个样本数据,可以充分利用多源数据对第一检测数据进行归档,提高对第一检测数据的归档结果的准确性。
在本步骤中,对于每个第一检测数据,基于第一检测数据以及与至少一个用户标识对应的样本数据集,确定至少一个用户标识中是否存在目标用户标识的过程可以有以下两种可选的实现方式;
在一种可选的实现方式中,样本数据集包括与第一检测数据对应的多个历史检测数据,例如,该第一检测样本数据为血压数据,该样本数据集包括可以包括与第一数据系统和与至少一个第二数据系统对应的多个历史血压数据。
其中,基于第一检测数据以及与至少一个用户标识对应的样本数据集,确定至少一个用户标识中是否存在目标用户标识之前,该方法还包括:获取与每个用户标识对应的多个样本数据的样本数据量:判断与每个用户标识对应的样本数据量是否大于样本数据量阈值;
若否,则确定该与每个用户标识对应的多个样本数据的样本数据量不符合对第一检测数据进行自动归档的条件,可以按照预设规则处理第一检测数据以及与至少一个用户标识对应的样本数据集,确定至少一个用户标识中是否存在目标用户标识。该过程可以是:由工作人员将该第一检测数据和与每个用户标识对应的样本数据集中的样本数据进行比对,确定与该第一检测数据对应的目标用户标识,或者,确定该第一检测数据为异常检测数据,将异常检测数据删除,不做归档处理。其中,样本数据量阈值可以基于实际需要确定,本申请实施例对此不做限定。
若是,执行基于第一检测数据以及与至少一个用户标识对应的样本数据集,确定至少一个用户标识中是否存在目标用户标识操作。该过程可以包括:确定第一检测数据与每个样本数据的距离值,得到多个距离值;从多个距离值中选取目标距离值集,该目标距离值集包括符合筛选条件的多个距离值;在目标距离值集中,确定与每个用户标识对应的距离值数量和目标距离值集中的距离值总数量的比值;基于与每个用户标识对应的比值确定至少一个用户标识中是否存在目标用户标识。
其中,从多个距离值中选取目标距离值集的过程可以包括:将多个距离值按照由大到小或者由小到大的顺序进行排列得到距离值序列,以最小距离值为第一个距离值,依次选取预设数量的距离值,组成目标距离值集。其中,目标距离值集中的数据量可以基于实际需要确定,本申请实施例对此不做限定。
基于与每个用户标识对应的比值确定至少一个用户标识中是否存在目标用户标识的过程可以包括:获取与每个用户标识对应的比值;判断与每个用户标识对应的比值中的最大比值是否大于比例值阈值;若是,确定与最大比值对应的用户标识为目标用户标识;若不是,确定该第一检测数据为异常检测数据。由于是在确定与每个用户标识对应的样本数据量大于样本数据量阈值后,再对第一检测数据进行自动归档,可以保证最终确定的样本数据集对异常第一检测数据有较高的敏感度,保证第一检测数据自动归档的结果准确性。
需要说明的是,在本申请实施例中,随着多源健康数据智能归档系统运行时间增长,与每个用户标识对应的样本数据集中的样本数据量会逐渐增大,在对第一检测数据进行自动归档过程中,与用户标识对应的历史检测数据越来越多,若将该全部的历史检测数据作为样本检测数据集,会增加算力资源的消耗以及时间,可以将与用户标识对应的最新获取的预设数量的历史检测数据组合为样本检测数据集,其中,预设数量可以基于实际需要确定,本申请实施例对此不做限定。
在另一种可选的实现方式中,样本数据集包括与每个用户标识对应的最新生成的历史第一检测数据、最新生成的历史第二检测数据以及基础信息数据的集合,其中,最新生成的历史第一检测数据为上一检测数据生成周期内获取的第一检测数据,最新生成的历史第二检测数据为最近一次就医和/或体检过程中生成的第二检测数据,该基于第一检测数据以及与至少一个用户标识对应的样本数据集,确定至少一个用户标识中是否存在目标用户标识的过程可以包括:
对于至少一个用户标识中的每个用户标识,将第一检测数据添加至与用户标识对应的样本数据集,得到与用户标识对应的待检测数据集;将待检测数据集输入与用户标识对应的预测模型中,得到预测结果;基于预测结果判断第一检测数据是否与用户标识对应;若是,确定用户标识为目标用户标识。
可以理解的是,在本申请实施例中,与每个用户标识对应的预测模型是预先训练,该训练与每个用户标识对应的预测模型的过程可以是:获取多个历史检测数据生成周期内,与用户标识对应的至少一个历史第一检测数据、至少一个历史第二检测数据以及基础信息数据,得到与每个历史检测数据生成周期对应的初始历史样本数据集,按照预设规则将预设时长内的初始历史样本数据集合并为历史样本数据集,得到多个历史样本数据集,将每个历史样本数据集中的数据进行归一化处理,得到多个待训练样本数据集,利用多个待训练样本数据集训练初始预测模型,直至模型收敛,确定该收敛模型为与用户标识对应的预测模型。其中,每个历史样本数据集中的多个历史第一检测数据、多个历史第二检测数据时按照时间先后顺序进行排列的。该预设时长可以基于实际需要确定,本申请实施例对此不做限定。其中,通过将初始历史样本数据集按照预设规则处理得到历史样本数据集,利用该历史样本数据集训练初始预测模型,可以提高最终获取的预测模型对第一检测数据的敏感性,以便于利用预测模型更精准的挑选出与预测模型关联用户标识对应的第一检测数据。
示例的,假设本申请实施例中,第一终端包括运行物联网健康监测系统的第一终端,运行医院信息系统的第一终端以及运行基本公共卫生管理系统的第一终端,且规定第二终端每日23时40分进行数据处理,血压计N1为在多源健康数据智能归档系统中注册过的电子健康监测设备。
例如,在2021年1月10日23时40分,第二终端在数据湖中查找与血压计N1对应的检测数据表,获取到在2021年1月9日23时40分至2021年1月10日23时40分之间存储的与血压计N1对应的一个血压数据Xi,可以查找与血压计N1对应的设备信息表,确定与血压计N1对应的用户标识为用户A1、用户A2和用户A3。其中,与用户A1对应的样本数据集J1包括:2021年1月9日23时40分,从数据湖中获取的与用户A1对应的2021年1月9日8时23分的血压数据X11、2021年1月9日12时的血压数据X12、以及2021年1月9日18时30分的血压数据X13;从运行医院信息系统的第一终端中获取的与用户A1对应的上一次就医日期2019年12月5日10时30分的血压数据X21,2019年12月5日11时30分的心电图数据T21;从运行基本公共卫生管理系统的第一终端中获取的与用户A1对应的上一次体检日期2019年12月20日10时30分的血压数据X31,2019年12月20日11时30分的血糖数据M21等。
进一步的,将该血压数据Xi添加至样本数据集J1,得到与用户A1对应的待检测数据集J1’,将该待检测数据集J1’输入与用户A1对应的预测模型中,得到预测结果,若该预测结果显示待检测数据集J1’是与用户A1对应的实际数据集,则确定用户A1为目标用户标识;若该预测结果显示待检测数据集J1’不是与用户A1对应的实际数据集,则基于类似的方式判断与用户A2和用户A3是否为目标用户标识,若不是,确定该血压数据Xi为与血压计N1对应的异常数据,并删除该异常血压数据。
其中,训练与用户A1对用的预测模型的过程可以是:可以获取2019年1-6月份之内,每日获取的至少一个历史第一检测数据、至少一个历史第二检测数据以及基础信息数据,得到初始历史样本数据集,将1-2月份的初始历史样本数据集合并为历史样本数据集Y11,将2-3月份的初始历史样本数据集合并为历史样本数据集Y12,将3-4月份的初始历史样本数据集合并为历史样本数据集Y13,将3-4月份的初始历史样本数据集合并为历史样本数据集Y14,将4-5月份的初始历史样本数据集合并为历史样本数据集Y15,将5-6月份的初始历史样本数据集合并为历史样本数据集Y16,将历史样本数据集Y11、历史样本数据集Y12、历史样本数据集Y13、历史样本数据集Y14、历史样本数据集Y15和历史样本数据集Y16行归一化处理,得到6个待训练样本数据集,利用6个待训练样本数据集,训练初始预测模型,直至模型收敛,得到与用户A1对用的预测模型。其中,每个样本数据集中的中的检测数据是按照时间先后顺序排列的。
需要说明的是,在本步骤中,可能会出现将确定出与同一第一检测数据对应的至少两个备选目标用户标识的情况,此时,可以将该第一检测数据发送至与每个备选目标用户标识对应的用户终端,让用户判断该第一检测数据是否属于该备选目标用户标识,响应于用户的判断结果确定备选目标用户标识是否为与该第一检测数据对应的目标用户标识。
步骤203、若是,建立第一检测数据与目标标识用户的对应关系。
在本步骤中,对于第一检测数据,若确定第一检测数据为与目标标识用户对应的第一检测数据,则可以建立第一检测数据与目标用户标识的对应关系。
步骤204、获取与目标用户标识对应的第二检测数据,以及基于对应关系获取与目标用户标识对应的第一检测数据。
在本步骤中,可以获取与目标用户标识对应的第二检测数据,以及基于对应关系获取与目标用户标识对应的第一检测数据。可以理解的是,与目标用户标识对应的第一检测数据可以不止一个,例如,第一数据系统为物联网健康监测系统,第二终端每日23时40分进行数据处理,在2021年1月10日23时40分,第二终端确定用户A1为目标标识用户,基于对应关系获取到与用户A1对应的第一检测数据可以包括:2021年1月9日8时23分的血压数据X11、2021年1月9日12时的血压数据X12以及2021年1月9日9时00分的血糖数据M21。
其中,获取与目标用户标识对应的第二检测数据的过程可以是:利用目标用户标识在数据湖中,查找与当前时刻对应的检测数据生成周期内存储的与目标用户标识对应的第二检测数据,将该第二检测数据确定为与目标用户标识对应的第二检测数据。
步骤205、将第一检测数据和第二检测数据融合得到与目标用户标识对应的融合检测数据。
在本步骤中,对于目标用户标识,将第一检测数据和第二检测数据融合得到与目标用户标识对应的融合检测数据的过程可以包括:确定与第一检测数据对应的采集时间,以及与第二检测数据对应的采集时间;按照时间顺序排列第一检测数据和第二检测数据,得到检测数据序列;确定检测数据序列为与目标用户标识对应的融合检测数据。
综上所述,本申请实施例提供的数据处理方法,可以获取第一检测数据,基于第一检测数据以及与至少一个用户标识对应的样本数据集,确定至少一个用户标识中是否存在目标用户标识,若是,建立第一检测数据与目标标识用户的对应关系;获取与目标用户标识对应的第二检测数据,以及基于对应关系获取与目标用户标识对应的第一检测数据,将第一检测数据和第二检测数据融合得到与目标用户标识对应的融合检测数据;实现了对检测数据的高精度归档,保证了获取的用户检测数据的质量,以及将包括归档后的检测数据在内的多源检测数据进行融合,便于全面准确的掌握用户的健康状况。
本申请实施例提供一种数据处理方法,该方法可以应用于如图1所示的第二终端中,如图5所示,该方法包括:
步骤301、获取第一检测数据。
步骤302、基于第一检测数据以及与至少一个用户标识对应的样本数据集,确定至少一个用户标识中是否存在目标用户标识。
步骤303、若是,建立第一检测数据与目标标识用户的对应关系。
步骤304、获取与目标用户标识对应的第二检测数据,以及基于对应关系获取与目标用户标识对应的第一检测数据。
步骤305、将第一检测数据和第二检测数据融合得到与目标用户标识对应的融合检测数据。
在本申请实施例中,步骤301至305的具体实现过程可以分别参考上述实施例中的步骤201至205,本申请实施例对此不做赘述。
步骤306、存储融合检测数据至与目标用户标识对应的健康数据表。
步骤307、基于健康数据表得到与目标用户标识对应的健康状况分析结果。
在本申请实施例中,健康数据表包括用户基础信息数据和融合检测数据,该融合检测数据为检测数据序列,基于健康数据表得到与每个用户标识对应的健康状况分析结果,包括:获取健康数据表中的检测数据序列和与用户基础信息数据对应的用户特征序列;组合检测数据序列和用户特征序列得到待分析数据序列;对待分析数据序列进行预处理得到预处理数据序列;将预处理数据序列输入时间序列预估模型中,得到与目标用户标识对应的健康状况分析结果。并在结果异常时进行提醒。其中,用户特征序列是将用户基础信息数据进行排列组合得到的,该对待分析数据序列进行预处理的过程可以包括:对待分析数据序列中的数据进行缺失值识别、缺失值处理、标准化和归一化等操作;该时间序列预估模型可以是ARIMA模型、Prophet模型或神经网络网络模型。
可以理解的是,在本申请实施例中,健康数据表中包括第二终端在每次数据处理过程中获取的融合检测数据,则在该健康数据表中有新的融合检测数据被存储后,可以获取与目标用户标识对应的所有检测数据序列,将该所有检测数据序列和用户特征序列组合得到待分析数据序列,基于该待分析数据序列得到用户的健康状况分析结果;或者,可以获取与目标用户标识对应的预设时段内的检测数据序列,将该预设时段内的检测数据序列和用户特征序列组合得到待分析数据序列,基于该待分析数据序列得到用户的健康状况分析结果。其中,该预设时段可以基于实际需要或者用户的设置信息确定,本申请实施例对此不做限定,例如,该预设时段可以是最近一个季度或者最近半年等。
示例的,第二终端确定与用户A1对应的健康数据表中有新的融合检测数据被存储后,可以获取该健康数据表中与用户A1对应的最近三个月的血压数据序列XtA,血糖数据序列MtA,以及用户A1的用户特征序列FA,将该血压数据序列XtA,血糖数据序列MtA,以及用户A1的用户特征序列FA,组合得到待分析数据序列O;对待分析数据序列进行预处理得到预处理数据序列O’;将预处理数据序列O’输入时间序列预估模型中,得到与用户A1对应的健康状况分析结果,供用户A1、医生或者健康管理师查看该用户A1的健康状况分析结果,优选的,若该监控状况分析结果为出现异常,将该健康状况分析结果以及数据湖中存储的用户A1的药品处方数据发送至用户A1的用户终端,并将该健康状况分析结果以及用户A1的药品处方数据发送至与第二数据系统对应的第一终端,便于医生或者健康管理师对用户A1及时进行回访。
需要说明的是,在本申请实施例中,在用户健康状况分析结果显示过程中,用户终端或者第一终端中显示的内容包括:用户基础信息、检测项,检测数据来源以及次数;检测数据曲线图、测量记录以及用药记录。
如图6所示,图6为用户张麒麟的用户终端显示的健康状况分析结果,包括用户终端显示界面第一显示区域T1中显示的用户基础信息,第二显示区域T2中显示的用户脉率数据、该脉率数据包括2020年8月6日至2020年8月12日居家检测的121次脉率数据、诊间监测的101次脉率数据、诊区监测的188次脉率数据以及手工检测的20次脉率数据,第三显示区域T3中显示的脉率变化曲线图,以及第四显示区域T4显示的用药记录。
如图7所示,图7为用户张麒麟的用户终端显示的健康状况分析结果,包括用户终端显示界面第一显示区域T1中显示的用户基础信息,第二显示区域T2中显示的用户血压数据、该血压数据包括2020年8月6日至2020年8月12日居家检测的121次血压数据、诊间监测的101次血压数据、诊区监测的188次血压数据以及手工检测的20次血压数据,第三显示区域T3中显示的血压变化曲线图,以及第四显示区域T4显示的监测记录。
如图8所示,图8为用户张麒麟的用户终端显示的健康状况分析结果,包括用户终端显示界面第一显示区域T1中显示的用户基础信息,第二显示区域T2中显示的用户血糖数据、该血糖数据包括2020年8月6日至2020年8月12日居家检测的197次血糖数据以及院内检测的56次血糖数据,第三显示区域T3中显示的血糖变化曲线图,以及第四显示区域T4显示的测量记录。
如图9所示,图9为用户张麒麟的用户终端显示的健康状况分析结果,包括用户终端显示界面第一显示区域T1中显示的用户基础信息,第二显示区域T2中显示的用户血糖数据、该血糖数据包括2020年8月6日至2020年8月12日居家检测的197次血糖数据以及院内检测的56次血糖数据,第三显示区域T3中显示的血糖变化曲线图,以及第四显示区域T4显示的用药记录。
综上所述,本申请实施例提供的数据处理方法,可以获取第一检测数据,基于第一检测数据以及与至少一个用户标识对应的样本数据集,确定至少一个用户标识中是否存在目标用户标识,若是,建立第一检测数据与目标标识用户的对应关系;获取与目标用户标识对应的第二检测数据,以及基于对应关系获取与目标用户标识对应的第一检测数据,将第一检测数据和第二检测数据融合得到与目标用户标识对应的融合检测数据;存储融合检测数据至与目标用户标识对应的健康数据表;基于健康数据表得到与目标用户标识对应的健康状况分析结果;实现了对检测数据的高精度归档,保证了获取的用户检测数据的质量,以及将包括归档后的检测数据在内的多源检测数据进行融合,并基于融合数据对用户健康状况进行分析,便于用户及时全面的掌握自身健康状况。
本申请实施例提供一种数据处理装置,如图10所示,该装置40包括:
获取模块401,被配置为获取第一检测数据,第一检测数据为与第一数据系统对应的检测数据;
确定模块402,被配置为基于第一检测数据以及与至少一个用户标识对应的样本数据集,确定至少一个用户标识中是否存在目标用户标识,样本数据集包括与第一数据系统和与至少一个第二数据系统分别对应的多个样本数据;
建立模块403,被配置为若是,建立第一检测数据与目标标识用户的对应关系;
获取模块401,还被配置为获取与目标用户标识对应的第二检测数据,以及基于对应关系获取与目标用户标识对应的第一检测数据,第二检测数据包括与至少一个第二数据系统对应的检测数据;
融合模块404,被配置为将第一检测数据和第二检测数据融合得到与目标用户标识对应的融合检测数据。
可选的,如图11所示,该装置40还包括处理模块405,被配置为:
获取与每个用户标识对应的多个样本数据的样本数据量;
判断与每个用户标识对应的样本数据量是否大于样本数据量阈值;
若是,执行基于第一检测数据以及与至少一个用户标识对应的样本数据集,确定至少一个用户标识中是否存在目标用户标识操作;
若否,按照预设规则处理第一检测数据以及与至少一个用户标识对应的样本数据集,确定至少一个用户标识中是否存在目标用户标识。
可选的,确定模块402,被配置为:
确定第一检测数据与每个样本数据的距离值,得到多个距离值;
从多个距离值中选取目标距离值集,目标距离值集包括符合筛选条件的多个距离值;
在目标距离值集中,确定与每个用户标识对应的距离值数量和目标距离值集中的距离值总数量的比值;
基于与每个用户标识对应的比值确定至少一个用户标识中是否存在目标用户标识。
可选的,确定模块402,被配置为:
获取与每个用户标识对应的比值;
判断与每个用户标识对应的比值中的最大比值是否大于比例值阈值;
若是,确定与最大比值对应的用户标识为目标用户标识。
可选的,确定模块402,被配置为:
对于至少一个用户标识中的每个用户标识,将第一检测数据添加至与用户标识对应的样本数据集,得到与用户标识对应的待检测数据集;
将待检测数据集输入与用户标识对应的预测模型中,得到预测结果;
基于预测结果判断第一检测数据是否与用户标识对应;
若是,确定用户标识为目标用户标识。
可选的,融合模块404,被配置为:
确定与第一检测数据对应的采集时间,以及与第二检测数据对应的采集时间;
按照时间顺序排列第一检测数据和第二检测数据,得到检测数据序列;
确定检测数据序列为与目标用户标识对应的融合检测数据。
可选的,如图12所示,该装置40还包括:
存储模块406,被配置为存储融合检测数据至与目标用户标识对应的健康数据表;
分析模块407,被配置为基于健康数据表得到与目标用户标识对应的健康状况分析结果。
可选的,分析模块406,被配置为:
获取健康数据表中的检测数据序列和与用户基础信息数据对应的用户特征序列;
组合检测数据序列和用户特征序列得到待分析数据序列;
对待分析数据序列进行预处理得到预处理数据序列;
将预处理数据序列输入时间序列预估模型中,得到与目标用户标识对应的健康状况分析结果。
综上所述,本申请实施例提供的数据处理装置,可以获取第一检测数据,基于第一检测数据以及与至少一个用户标识对应的样本数据集,确定至少一个用户标识中是否存在目标用户标识,若是,建立第一检测数据与目标标识用户的对应关系;获取与目标用户标识对应的第二检测数据,以及基于对应关系获取与目标用户标识对应的第一检测数据,将第一检测数据和第二检测数据融合得到与目标用户标识对应的融合检测数据;存储融合检测数据至与目标用户标识对应的健康数据表;基于健康数据表得到与目标用户标识对应的健康状况分析结果;实现了对检测数据的高精度归档,保证了获取的用户检测数据的质量,以及将包括归档后的检测数据在内的多源检测数据进行融合,并基于融合数据对用户健康状况进行分析,便于用户及时全面的掌握自身健康状况。
图13是根据一示例性实施例示出的一种计算机设备,该计算机设备包括中央处理单元(CPU)501,其可以根据存储在只读存储器(ROM)502中的程序或者从存储部分加载到随机访问存储器(RAM)503中的程序而执行各种适当的动作和处理。在RAM503中,还存储有系统操作所需的各种程序和数据。CPU501、ROM502以及RAM503通过总线504彼此相连。输入/输出(I/O)接口505也连接至总线504。
以下部件连接至I/O接口505:包括键盘、鼠标等的输入部分506;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分;包括硬盘等的存储部分508;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分509。通信部分509经由诸如因特网的网络执行通信处理。驱动器也根据需要连接至I/O接口505。可拆卸介质511,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器510上,以便于从其上读出的计算机程序根据需要被安装入存储部分508。
特别地,根据本申请的实施例,上文图2至图3描述的过程可以被实现为计算机软件程序。例如,本申请的各个实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分从网络上被下载和安装,和/或从可拆卸介质被安装。在该计算机程序被中央处理单元(CPU)501执行时,执行本申请的系统中限定的上述功能。
需要说明的是,本申请所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本申请各种实施例的方法、装置和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现,所描述的单元也可以设置在处理器中。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定。所描述的单元或模块也可以设置在处理器中,例如,可以描述为:一种处理器包括获取模块、确定模块、建立模块和融合模块。其中,这些单元或模块的名称在某种情况下并不构成对该单元或模块本身的限定,例如,获取模块还可以被描述为“用于获取第一检测数据的获取模块”。
作为另一方面,本申请还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该电子设备执行时,使得该电子设备实现如上述实施例中描述的数据处理方法。
以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离所述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
Claims (10)
1.一种数据处理方法,其特征在于,包括:
获取第一检测数据,所述第一检测数据为与第一数据系统对应的检测数据;第一数据系统为物联网健康监测系统;
获取与每个用户标识对应的多个样本数据的样本数据量;
判断与每个所述用户标识对应的所述样本数据量是否大于样本数据量阈值;
若是,执行基于所述第一检测数据以及与至少一个用户标识对应的样本数据集,确定所述至少一个用户标识中是否存在目标用户标识操作;
若否,按照预设规则处理所述第一检测数据以及与至少一个用户标识对应的样本数据集,确定所述至少一个用户标识中是否存在目标用户标识;其中,所述预设规则为确定所述第一检测数据中的异常检测数据并将异常检测数据删除;
基于所述第一检测数据以及与至少一个用户标识对应的样本数据集,确定所述至少一个用户标识中是否存在目标用户标识,所述样本数据集包括与第一数据系统和与至少一个第二数据系统分别对应的多个样本数据;第二数据系统为医院信息系统和/或基本公共卫生管理系统;
若是,建立所述第一检测数据与所述目标标识用户的对应关系;
获取与所述目标用户标识对应的第二检测数据,以及基于所述对应关系获取与所述目标用户标识对应的所述第一检测数据,所述第二检测数据包括与至少一个所述第二数据系统对应的检测数据;
将所述第一检测数据和所述第二检测数据融合得到与所述目标用户标识对应的融合检测数据。
2.根据权利要求1所述的方法,其特征在于,所述基于所述第一检测数据以及与至少一个用户标识对应的样本数据集,确定所述至少一个用户标识中是否存在目标用户标识,包括:
确定所述第一检测数据与每个所述样本数据的距离值,得到多个距离值;
从多个所述距离值中选取目标距离值集,所述目标距离值集包括符合筛选条件的多个距离值;
在所述目标距离值集中,确定与每个所述用户标识对应的距离值数量和所述目标距离值集中的距离值总数量的比值;
基于与每个所述用户标识对应的比值确定所述至少一个用户标识中是否存在目标用户标识。
3.根据权利要求2所述的方法,其特征在于,所述基于与每个所述用户标识对应的比值确定所述至少一个用户标识中是否存在目标用户标识,包括:
获取与每个所述用户标识对应的比值;
判断与每个所述用户标识对应的比值中的最大比值是否大于比例值阈值;
若是,确定与所述最大比值对应的所述用户标识为目标用户标识。
4.根据权利要求1所述的方法,其特征在于,所述基于所述第一检测数据以及与至少一个用户标识对应的样本数据集,确定所述至少一个用户标识中是否存在目标用户标识,包括:
对于所述至少一个用户标识中的每个用户标识,将所述第一检测数据添加至与所述用户标识对应的所述样本数据集,得到与所述用户标识对应的待检测数据集;
将所述待检测数据集输入与所述用户标识对应的预测模型中,得到预测结果;
基于所述预测结果判断所述第一检测数据是否与所述用户标识对应;
若是,确定所述用户标识为目标用户标识。
5.根据权利要求1所述的方法,其特征在于,所述将所述第一检测数据和所述第二检测数据融合得到与所述目标用户标识对应的融合检测数据,包括:
确定与所述第一检测数据对应的采集时间,以及与所述第二检测数据对应的采集时间;
按照时间顺序排列所述第一检测数据和所述第二检测数据,得到检测数据序列;
确定所述检测数据序列为与所述目标用户标识对应的融合检测数据。
6.根据权利要求1至5任一所述的方法,其特征在于,在将所述第一检测数据和所述第二检测数据融合得到与所述目标用户标识对应的融合检测数据之后,所述方法还包括:
存储所述融合检测数据至与所述目标用户标识对应的健康数据表;
基于所述健康数据表得到与所述目标用户标识对应的健康状况分析结果。
7.根据权利要求6所述的方法,其特征在于,所述健康数据表包括用户基础信息数据和融合检测数据,所述融合检测数据为检测数据序列,所述基于所述健康数据表得到与所述目标用户标识对应的健康状况分析结果,包括:
获取所述健康数据表中的所述检测数据序列和与所述用户基础信息数据对应的用户特征序列;
组合所述检测数据序列和所述用户特征序列得到待分析数据序列;
对所述待分析数据序列进行预处理得到预处理数据序列;
将所述预处理数据序列输入时间序列预估模型中,得到与所述目标用户标识对应的健康状况分析结果。
8.一种数据处理装置,其特征在于,包括:
获取模块,被配置为获取第一检测数据,所述第一检测数据为与第一数据系统对应的检测数据;第一数据系统为物联网健康监测系统;
获取与每个用户标识对应的多个样本数据的样本数据量;
判断与每个所述用户标识对应的所述样本数据量是否大于样本数据量阈值;
若是,执行基于所述第一检测数据以及与至少一个用户标识对应的样本数据集,确定所述至少一个用户标识中是否存在目标用户标识操作;
若否,按照预设规则处理所述第一检测数据以及与至少一个用户标识对应的样本数据集,确定所述至少一个用户标识中是否存在目标用户标识;其中,所述预设规则为确定所述第一检测数据中的异常检测数据并将异常检测数据删除;
确定模块,被配置为基于所述第一检测数据以及与至少一个用户标识对应的样本数据集,确定所述至少一个用户标识中是否存在目标用户标识,所述样本数据集包括与第一数据系统和与至少一个第二数据系统分别对应的多个样本数据;第二数据系统为医院信息系统和/或基本公共卫生管理系统;
建立模块,被配置为若是,建立所述第一检测数据与所述目标标识用户的对应关系;
获取模块,还被配置为获取与所述目标用户标识对应的第二检测数据,以及基于所述对应关系获取与所述目标用户标识对应的所述第一检测数据,所述第二检测数据包括与至少一个所述第二数据系统对应的检测数据;
融合模块,被配置为将所述第一检测数据和所述第二检测数据融合得到与所述目标用户标识对应的融合检测数据。
9.一种计算机设备,其特征在于,所述计算机设备包括存储器、处理器以及存储在存储器并可在处理器上运行的计算机程序,所述处理器用于执行所述程序时实现如权利要求1-7任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,其上存储有计算机程序,所述计算机程序用于实现如权利要求1-7中任一项所述的方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110178903.9A CN112908453B (zh) | 2021-02-09 | 2021-02-09 | 数据处理方法、装置、设备和介质 |
US17/513,396 US20220254459A1 (en) | 2021-02-09 | 2021-10-28 | Data processing method, data processing device, computing device and computer readable storage medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110178903.9A CN112908453B (zh) | 2021-02-09 | 2021-02-09 | 数据处理方法、装置、设备和介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112908453A CN112908453A (zh) | 2021-06-04 |
CN112908453B true CN112908453B (zh) | 2024-08-30 |
Family
ID=76123193
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110178903.9A Active CN112908453B (zh) | 2021-02-09 | 2021-02-09 | 数据处理方法、装置、设备和介质 |
Country Status (2)
Country | Link |
---|---|
US (1) | US20220254459A1 (zh) |
CN (1) | CN112908453B (zh) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101404050A (zh) * | 2008-11-25 | 2009-04-08 | 中国网络通信集团公司 | 协同医疗业务关联方法和协同医疗业务关联系统 |
Family Cites Families (31)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003157331A (ja) * | 2001-11-21 | 2003-05-30 | Konica Corp | Idカード発行システム |
US7406453B2 (en) * | 2005-11-04 | 2008-07-29 | Microsoft Corporation | Large-scale information collection and mining |
EP1788503A3 (de) * | 2005-11-16 | 2010-03-10 | Arcomed Ag | Vorrichtung und Verfahren zur Übermittlung von Daten von mobilen medizinischen Geräten |
US9107565B2 (en) * | 2010-08-16 | 2015-08-18 | Fujitsu Limited | Identifying an event occurrence from sensor data streams |
DK177299B1 (en) * | 2011-05-31 | 2012-10-22 | Radiometer Medical Aps | Method and system for acquiring patient-related data |
US9202066B2 (en) * | 2012-12-07 | 2015-12-01 | Betterpath, Inc. | Integrated health care systems and methods |
CN105163684B (zh) * | 2013-03-15 | 2018-02-02 | 圣纳普医疗(巴巴多斯)公司 | 手术数据的联运同步 |
EP2851820B1 (en) * | 2013-09-20 | 2020-09-02 | Fujitsu Limited | Measurement data processing method and apparatus |
CN106021915B (zh) * | 2016-05-17 | 2021-04-13 | 华南师范大学 | 基于大数据面向自动诊疗的医疗数据分析系统和装置 |
CN106126597A (zh) * | 2016-06-20 | 2016-11-16 | 乐视控股(北京)有限公司 | 用户属性预测方法及装置 |
CN106295182B (zh) * | 2016-08-10 | 2019-03-08 | 依据数据(湖南)科技有限公司 | 一种基于患者生物信息的身份识别方法 |
US20180150609A1 (en) * | 2016-11-29 | 2018-05-31 | Electronics And Telecommunications Research Institute | Server and method for predicting future health trends through similar case cluster based prediction models |
US20180225705A1 (en) * | 2017-02-07 | 2018-08-09 | Videology, Inc. | Method and system for optimized content item allocation |
CN107133479B (zh) * | 2017-05-18 | 2021-06-15 | 深圳小辣椒科技有限责任公司 | 一种信息处理方法及电子设备 |
EP3410386A1 (de) * | 2017-05-31 | 2018-12-05 | Greiner Bio-One GmbH | Verfahren zum verwalten von daten im gesundheitsbereich |
CN108010573A (zh) * | 2017-11-24 | 2018-05-08 | 苏州市环亚数据技术有限公司 | 一种医院数据融合系统、方法、电子设备及存储介质 |
CN108416064A (zh) * | 2018-03-28 | 2018-08-17 | 南方电网科学研究院有限责任公司 | 一种实验项目检索方法及管理系统 |
CN111902880B (zh) * | 2018-04-06 | 2024-09-10 | 德尔格制造股份两合公司 | 用于使用自描述模块来更新医学监视设备中的数据的方法和计算机可读记录介质 |
EP3579240B1 (en) * | 2018-06-07 | 2024-07-24 | Siemens Healthineers AG | Method and system for providing second medical data record |
CN110851506B (zh) * | 2018-07-25 | 2021-12-03 | 上海柯林布瑞信息技术有限公司 | 临床大数据的搜索方法及装置、存储介质、服务器 |
CN111125503B (zh) * | 2018-10-31 | 2023-04-07 | 北京字节跳动网络技术有限公司 | 用于生成信息的方法和装置 |
CN109559808B (zh) * | 2018-11-07 | 2024-06-25 | 深圳平安医疗健康科技服务有限公司 | 一种数据处理方法、装置、设备及存储介质 |
CN109597801A (zh) * | 2018-11-14 | 2019-04-09 | 金色熊猫有限公司 | 医疗数据标准化管理方法及系统、电子设备、存储介质 |
CN109800673A (zh) * | 2018-12-28 | 2019-05-24 | 上海依图网络科技有限公司 | 一种归档方法及装置 |
CN110060747A (zh) * | 2019-01-31 | 2019-07-26 | 北京汉博信息技术有限公司 | 一种智能健康终端 |
CN110245112A (zh) * | 2019-06-21 | 2019-09-17 | 同略科技有限公司 | 基于ai的智能化档案管理方法、系统、终端及存储介质 |
CN110798440B (zh) * | 2019-08-13 | 2021-10-15 | 腾讯科技(深圳)有限公司 | 异常用户检测方法、装置、系统及计算机存储介质 |
CN111427864A (zh) * | 2020-03-16 | 2020-07-17 | 深圳壹账通智能科技有限公司 | 数据的分批归档方法、装置、设备及存储介质 |
CN111444290A (zh) * | 2020-03-27 | 2020-07-24 | 腾讯云计算(北京)有限责任公司 | 数据处理方法、数据显示方法、装置、设备及存储介质 |
CN111694993B (zh) * | 2020-06-11 | 2023-05-02 | 北京金山云网络技术有限公司 | 一种创建数据索引的方法、装置、电子设备及介质 |
CN112199434B (zh) * | 2020-11-17 | 2023-09-19 | 深圳平安智汇企业信息管理有限公司 | 数据处理方法、装置、电子设备及存储介质 |
-
2021
- 2021-02-09 CN CN202110178903.9A patent/CN112908453B/zh active Active
- 2021-10-28 US US17/513,396 patent/US20220254459A1/en active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101404050A (zh) * | 2008-11-25 | 2009-04-08 | 中国网络通信集团公司 | 协同医疗业务关联方法和协同医疗业务关联系统 |
Also Published As
Publication number | Publication date |
---|---|
CN112908453A (zh) | 2021-06-04 |
US20220254459A1 (en) | 2022-08-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107085817B (zh) | 医疗系统 | |
Silverio et al. | Big health data and cardiovascular diseases: a challenge for research, an opportunity for clinical care | |
US9955869B2 (en) | System and method for supporting health management services | |
WO2019070200A1 (en) | HEALTH CARE INFORMATION MANAGEMENT SYSTEM | |
CA2784078C (en) | System and methods for management of disease over time | |
US20240233889A9 (en) | Health information exchange system | |
KR20190117829A (ko) | 의료 데이터 모니터링 시스템 | |
CN111276230A (zh) | 一种心脑血管疾病一体化分层管理系统及方法 | |
CN112447270A (zh) | 一种用药推荐方法、装置、设备及存储介质 | |
CN111161820B (zh) | 一种口腔健康管理系统 | |
CN104915576A (zh) | 数字化心血管风险评估系统 | |
US20220181005A1 (en) | Utilizing multi-layer caching systems for storing and delivering images | |
CN112992350A (zh) | 一种体征数据的监测方法、装置、电子终端及存储介质 | |
CN112233816B (zh) | 健康监测方法、装置及计算机可读介质 | |
CN112908453B (zh) | 数据处理方法、装置、设备和介质 | |
CN113223734A (zh) | 基于算法、医学影像和大数据的疾病诊断和大健康管理平台 | |
CN111128330A (zh) | 电子病例报告表自动录入方法、装置以及相关设备 | |
CN116504401A (zh) | 一种智能体检项目推荐方法和装置 | |
CN204856498U (zh) | 数字化心血管风险评估系统 | |
CN115359863A (zh) | 智能管理互联网平台、控制方法、构建方法、设备及终端 | |
US20200210400A1 (en) | Methods and Apparatus for Event Management | |
Sudhakara et al. | A technology framework for remote patient care in dermatology for early diagnosis | |
Hood et al. | Reconciling the evaluation of co-morbidities among HIV care patients in two large data systems: the Medical Monitoring Project and CFAR Network of Integrated Clinical Systems | |
Taloyan et al. | Remote digital monitoring for selected chronic diseases in primary health care | |
CN114334043B (zh) | 基于医保的对诊疗关键路径监测方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |