CN117743876A - 基于云计算的智慧仓储数据优化管理方法 - Google Patents
基于云计算的智慧仓储数据优化管理方法 Download PDFInfo
- Publication number
- CN117743876A CN117743876A CN202311789890.4A CN202311789890A CN117743876A CN 117743876 A CN117743876 A CN 117743876A CN 202311789890 A CN202311789890 A CN 202311789890A CN 117743876 A CN117743876 A CN 117743876A
- Authority
- CN
- China
- Prior art keywords
- data
- temperature
- humidity
- neighborhood
- discrete
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000007726 management method Methods 0.000 title claims abstract description 29
- 238000005457 optimization Methods 0.000 title claims abstract description 22
- 238000011156 evaluation Methods 0.000 claims abstract description 64
- 230000002159 abnormal effect Effects 0.000 claims abstract description 12
- 238000013507 mapping Methods 0.000 claims abstract description 6
- 238000002955 isolation Methods 0.000 claims description 43
- 238000000034 method Methods 0.000 claims description 31
- 230000005856 abnormality Effects 0.000 claims description 23
- 238000010606 normalization Methods 0.000 claims description 11
- 230000008569 process Effects 0.000 claims description 11
- 230000006835 compression Effects 0.000 abstract description 4
- 238000007906 compression Methods 0.000 abstract description 4
- 238000012545 processing Methods 0.000 abstract description 4
- 238000013523 data management Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000013210 evaluation model Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Landscapes
- Testing And Monitoring For Control Systems (AREA)
Abstract
本发明涉及云计算数据处理技术领域,具体涉及基于云计算的智慧仓储数据优化管理方法,包括:将每个温湿度数据映射到聚类空间中;获取DBSCAN聚类算法的最小邻域数以及邻域半径;获取聚类空间中每个温湿度数据的异常程度,得到每个温湿度数据的更新邻域半径;获取聚类空间中每个温湿度数据的离散评价值,得到离散数据;获取聚类空间中每个离散数据的第一维度孤立评价标准以及第二维度孤立评价标准,得到每个离散数据的孤立评价值,进而得到非孤立离散数据;自适应非孤立离散数据的更新最小邻域数结合温湿度数据的更新邻域半径对温湿度数据进行聚类后压缩存储。本发明旨在降低温湿度数据中的冗余数据,提高压缩效率。
Description
技术领域
本发明涉及云计算数据处理技术领域,具体涉及基于云计算的智慧仓储数据优化管理方法。
背景技术
智慧仓储数据指的是仓储管理中应用智能技术和数据科学方法,从仓库操作中产生、收集、分析和应用的数据,包括货物库存数据、温湿度数据、环境检测数据、运输数据等等,其具有大量和实时性特征,因此为了实现智慧仓储数据的优化管理,需要对智慧仓储数据进行压缩后存储,从而实现云计算的智慧仓储数据库下数据的快速分配及管理。
已知采集的温湿度数据中存在着较多的冗余数据,为了实现智慧仓储数据的优化管理,需要对采集的温湿度数据进行去冗余操作,进而提高压缩效率,因此使用BDSCAN算法对温湿度数据进行聚类,将温湿度数据减少为若干个聚类中心后,对其进行压缩后存储,但是BDSCAN聚类算法的最小邻域数以及邻域半径的不准确会影响聚类结果。
发明内容
为了解决上述问题,本发明提供基于云计算的智慧仓储数据优化管理方法。
本发明的基于云计算的智慧仓储数据优化管理方法采用如下技术方案:
本发明一个实施例提供了基于云计算的智慧仓储数据优化管理方法,该方法包括以下步骤:
采集温湿度数据及最佳温湿度数据,所述温湿度数据包含温度项以及湿度项;
将每个温湿度数据映射到聚类空间;根据聚类空间中的温湿度数据,获取DBSCAN聚类算法的最小邻域数以及邻域半径;根据聚类空间中温湿度数据相较于最佳温湿度数据的位置偏移,获取聚类空间中每个温湿度数据的异常程度;根据聚类空间中每个温湿度数据的异常程度对邻域半径进行调整,获取聚类空间中每个温湿度数据的更新邻域半径;
根据聚类空间中温湿度数据之间的距离,获取聚类空间中的离散数据;根据聚类空间中的离散数据与离散数据的邻域数据之间的距离,获取聚类空间中每个离散数据的第一维度孤立评价标准以及每个离散数据的靠近邻域数据的个数;根据每个离散数据的靠近邻域数据的个数以及最小邻域数,获取聚类空间中每个离散数据的第二维度孤立评价标准;根据聚类空间中每个离散数据的第一维度孤立评价标准以及第二维度孤立评价标准,获取聚类空间中的非孤立离散数据;将聚类空间中每个非孤立离散数据在邻域半径内的温湿度数据的个数作为每个非孤立离散数据的更新最小邻域数;
根据聚类空间中每个温湿度数据的更新邻域半径以及每个非孤立离散数据的更新最小邻域数,对聚类空间中的温湿度进行聚类后压缩存储。
优选的,所述将每个温湿度数据映射到聚类空间;根据聚类空间中的温湿度数据,获取DBSCAN聚类算法的最小邻域数以及邻域半径,包括的具体步骤如下:
式中,Ti代表第i个温湿度数据的温度项的值;Tmin代表所有温湿度数据的温度项中的最小值;Tmax代表所有温度数据的温度项中的最大值;T′i代表第i个温湿度数据归一化后的温度项的值;RHi代表第i个温湿度数据的湿度项的值;RHmin代表所有温湿度数据的湿度项中的最小值;RHmax代表所有温湿度数据的湿度项中的最大值;RH′i代表第i个温湿度数据归一化后的湿度项的值;
以温度项为横坐标、湿度项为纵坐标构建二维的聚类空间,根据每个温湿度数据归一化后的温度项的值以及湿度项的值,将每个温湿度数据映射到聚类空间中;
根据聚类空间中的温湿度数据,使用K-距离图获取DBSCAN聚类算法的最小邻域数以及邻域半径。
优选的,所述根据聚类空间中温湿度数据相较于最佳温湿度数据的位置偏移,获取聚类空间中每个温湿度数据的异常程度,包括的具体步骤如下:
式中,Fi代表聚类空间中第i个温湿度数据的异常程度,T′i代表第i个温湿度数据归一化后的温度项的值;RH′i代表第i个温湿度数据归一化后的湿度项的值;T′o代表最佳温湿度数据归一化后的温度项的值;RH′o代表最佳温湿度数据归一化后的湿度项的值;μ1代表预设第一权重;μ2代表预设第二权重。
优选的,所述根据聚类空间中每个温湿度数据的异常程度对邻域半径进行调整,获取聚类空间中每个温湿度数据的更新邻域半径,包括的具体步骤如下:
式中,Ri ′代表聚类空间中第i个温湿度数据的更新邻域半径;R代表邻域半径;Fi代表聚类空间中第i个温湿度数据的异常程度;T1代表预设异常程度阈值。
优选的,所述根据聚类空间中温湿度数据之间的距离,获取聚类空间中的离散数据,包括的具体步骤如下:
式中,Li代表聚类空间中第i个温湿度数据的离散评价值;N代表最小邻域数;di,p代表聚类空间中与第i个温湿度数据距离最近第p个温湿度数据与第i个温湿度数据之间的距离值;
若聚类空间中第i个温湿度数据的离散评价值大于邻域半径,将聚类空间中第i个温湿度数据作为离散数据,得到聚类空间中的若干离散数据。
优选的,所述根据聚类空间中的离散数据与离散数据的邻域数据之间的距离,获取聚类空间中每个离散数据的第一维度孤立评价标准以及每个离散数据的靠近邻域数据的个数,包括的具体步骤如下:
获取聚类空间中与第j个离散数据距离最近的N个温湿度数据,记为第j个离散数据的邻域数据;
式中,代表聚类空间中第j个离散数据的第一维度孤立评价标准;/>代表聚类空间中第j个离散数据与第j个离散数据的每个邻域数据之间的距离的最大值;/>代表聚类空间中第j个离散数据与第j个离散数据的每个邻域数据之间的距离的最小值;exp()代表以自然常数为底数的指数函数,||表示求绝对值;
将聚类空间中第j个离散数据与第j个离散数据的每个邻域数据之间的距离的最小值所对应的邻域数据记为第j个离散数据的最小邻域数据,将聚类空间中第j个离散数据与第j个离散数据的每个邻域数据之间的距离的最大值所对应的邻域数据记为第j个离散数据的最大邻域数据;
根据聚类空间中离散数据的邻域数据与离散数据的最小邻域数据以及最大邻域数据之间的距离,获取每个离散数据的靠近邻域数据的个数。
优选的,所述根据聚类空间中离散数据的邻域数据与离散数据的最小邻域数据以及最大邻域数据之间的距离,获取每个离散数据的靠近邻域数据的个数,包括的具体步骤如下:
若第j个离散数据的第b个邻域数据与第j个离散数据的最小邻域数据之间的距离小于第j个离散数据的第b个邻域数据与第j个离散数据的最大邻域数据之间的距离,将第j个离散数据的第b个邻域数据记为第j个离散数据的靠近邻域数据,统计第j个离散数据的靠近邻域数据的个数。
优选的,所述根据每个离散数据的靠近邻域数据的个数以及最小邻域数,获取聚类空间中每个离散数据的第二维度孤立评价标准,包括的具体步骤如下:
式中,代表聚类空间中第j个离散数据的第二维度孤立评价标准;N代表最小邻域数;M代表获取聚类空间中第j个离散数据的靠近邻域数据的个数。
优选的,所述根据聚类空间中每个离散数据的第一维度孤立评价标准以及第二维度孤立评价标准,获取聚类空间中的非孤立离散数据,包括的具体步骤如下:
式中,代表聚类空间中第j个离散数据的第一维度孤立评价标准;/>代表聚类空间中第j个离散数据的第二维度孤立评价标准;G′代表聚类空间中第j个离散数据的孤立评价值;w1代表预设的第一维度权重;w2代表预设的第二维度权重;
预设孤立阈值T,若聚类空间中第j个离散数据的孤立评价值小于孤立阈值T,将聚类空间中第j个离散数据记为非孤立离散数据。
优选的,所述根据聚类空间中每个温湿度数据的更新邻域半径以及每个非孤立离散数据的更新最小邻域数,对聚类空间中的温湿度进行聚类后压缩存储,包括的具体步骤如下:
根据聚类空间每个温湿度数据的更新邻域半径以及每个非孤立离散数据的更新最小邻域数,使用DBSCAN聚类算法对聚类空间中的温湿度数据进行聚类,得到若干聚类簇,对每个聚类簇的聚类中心数据进行压缩,得到压缩数据,将压缩数据存储。
本发明的技术方案的有益效果是:本发明首先对每个温湿度数据的温度项的值以及湿度项的值进行归一化处理后将每个温湿度数据映射到聚类空间,便于后续对聚类空间中的温湿度数据进行聚类;使用k-距离图获取DBSCAN聚类算法的最小邻域数以及邻域半径;根据聚类空间中温湿度数据相较于最佳温湿度数据的位置偏移,获取聚类空间中每个温湿度数据的异常程度对邻域半径进行调整,自适应每个温湿度数据的更新邻域半径,提高了聚类结果的准确性,接着根据温湿度数据之间的距离量化聚类空间中每个温湿度数据的离散评价值,得到聚类空间中的离散数据,接着获取聚类空间中每个离散数据的第一维度孤立评价标准以及第二维度孤立评价标准,得到聚类空间中每个离散数据的孤立评价值,对聚类空间中的离散数据进行筛选,得到聚类空间中的非孤立离散数据,即得到聚类空间中离散但是不孤立的数据,最后自适应非孤立离散数据的最小邻域数量,得到非孤立离散数据的更新最小邻域数量,使得聚类时将离散但不孤立的温湿度数据聚为一起,使得聚类结果更加准确,最后根据聚类结果对温湿度数据进行压缩存储,完成了对温湿度数据的降冗余操作,提高了压缩效率并且减少了存储空间,进而实现云计算的智慧仓储数据库下数据的快速分配及管理。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明的基于云计算的智慧仓储数据优化管理方法的步骤流程图。
具体实施方式
为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的基于云计算的智慧仓储数据优化管理方法,其具体实施方式、结构、特征及其功效,详细说明如下。在下述说明中,不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外,一或多个实施例中的特定特征、结构或特点可由任何合适形式组合。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。
下面结合附图具体的说明本发明所提供的基于云计算的智慧仓储数据优化管理方法的具体方案。
请参阅图1,其示出了本发明一个实施例提供的基于云计算的智慧仓储数据优化管理方法的步骤流程图,该方法包括以下步骤:
S001.采集温湿度数据。
需要说明的是,由于在仓储环境中的温湿度数据对仓储中储存的产品产生直接影响,通过分析仓库内的温湿度数据,可以帮助预防货物受损、变质或者过期,因此需要采集仓库中的温湿度数据,接着对采集的温湿度数据进行压缩后存储,来减少温湿度数据的存储空间,实现智慧仓储数据的优化管理。
在本发明实施例中,在仓库中安装传感器,采集仓库中的温度以及湿度构成温湿度数据,采集频率为1S/次,即每个温湿度数据中包含温度项以及湿度项。
至此,获得温湿度数据。
S002.对每个温湿度数据的温度项以及湿度项的值进行归一化处理;根据每个温湿度数据归一化后的温度项的值以及湿度项的值,构建聚类空间;根据聚类空间中的温湿度数据,获取DBESCA聚类算法的最小邻域数以及邻域半径;获取聚类空间中每个温湿度数据的异常程度,根据聚类空间中每个温湿度数据的异常程度对邻域半径进行调整获取聚类空间中每个温湿度数据的更新邻域半径。
需要说明的是,采集的温湿度数据中存在着较多的冗余数据,因此首先需要对采集的温湿度数据进行降冗余操作,进而提高压缩效率,因此本发明通过对采集的温湿度数据进行聚类,得到若干聚类簇,将若干聚类簇的中心数据点进行压缩存储,即可实现对温湿度数据的降冗余操作,因此本发明首先需要将每个温湿度的温度项以及湿度项归一化到相同的尺度范围内,并将每个温湿度数据映射到一个聚类空间中,便于后续对聚类空间中的温湿度数据进行聚类分析。
在本发明实施例中,获取每个温湿度数据归一化后的温度项的值以及湿度项的值:
式中,Ti代表第i个温湿度数据的温度项的值;Tmin代表所有温湿度数据的温度项中的最小值;Tmax代表所有温度数据的温度项中的最大值;T′i代表第i个温湿度数据归一化后的温度项的值;RHi代表第i个温湿度数据的湿度项的值;RHmin代表所有温湿度数据的湿度项中的最小值;RHmax代表所有温湿度数据的湿度项中的最大值;RH′i代表第i个温湿度数据归一化后的湿度项的值。
以温度项为横坐标、湿度项为纵坐标构建二维的聚类空间,并根据每个温湿度数据归一化后的温度项的值以及湿度项的值,将每个温湿度数据映射到聚类空间中。
需要说明的是,本发明使用DBSCAN聚类算法对聚类空间中的温湿度数据进行聚类,因此需要获取DBSCAN聚类算法的两个参数,分别是最小邻域数以及邻域半径。
在本发明实施例中,根据聚类空间中的温湿度数据,使用K-距离图获取DBSCAN聚类算法的两个参数,分别是最小邻域数以及邻域半径,需要说明的是,K-距离图算法为公知技术,在本发明实施例中,不再对其进行过多赘述。
需要说明的是,已知邻域半径是针对聚类空间每个温湿度数据创建的用于检查密度的邻域半径,因此聚类空间中的每个温湿度数据的邻域半径一致,为了使得聚类结果更加准确,需要根据聚类空间中每个温湿度数据的偏离程度,来对邻域半径进行修正,自适应获取每个温湿度数据的更新邻域半径,当聚类空间中任一温湿度数据与最佳温度数据的温度项的值的差异以及湿度项的值差异越大时,说明该温湿度数据相较于最佳温度数据的偏移程度较大,则该温湿度数据的异常程度越大,需要将邻域半径调小来获取该温湿度数据的更新邻域半径,当该温湿度数据与最佳温度数据的温度项的值的差异以及湿度项的值的差异越小时,说明该温湿度数据相较于最佳温度数据不存在偏移,则该温湿度数据的异常程度越小,需要将邻域半径调大来获取该温湿度数据的更新邻域半径,(最佳温湿度数据为仓库中存储产品最佳的温度以及湿度,是现有数据)因此本发明首先根据任一温湿度数据与最佳温湿度数据的温度项的值之间的差异以及湿度项的值之间的差异,获取每个温湿度数据的异常程度,便于后续根据每个温湿度数据的异常程度调整邻域半径获取每个温湿度数据的更新邻域半径。
需要进一步说明的是,若仓库中存储的为特定类产品,如食物药物等,温度的变化对产品的质量和安全性产生直接的影响,此时温度项的异常相对于湿度项的异常更为重要,因此在获取任一温湿度数据的异常程度时,需要关注该温湿度数据与最佳温湿度数据的温度项的值的差异;若仓库中存储的为易受潮产品,在这种情况下,湿度项的异常相对与温度项的异常更加严重,因此在获取任一温湿度数据的异常程度时,需要关注该温湿度数据与最佳温湿度数据的湿度项的值的差异。
在本发明实施例中,获取聚类空间中每个温湿度数据的异常程度:
式中,Fi代表聚类空间中第i个温湿度数据的异常程度,T′i代表第i个温湿度数据归一化后的温度项的值;RH′i代表第i个温湿度数据归一化后的湿度项的值;T′o代表最佳温湿度数据归一化后的温度项的值;RH′o代表最佳温湿度数据归一化后的湿度项的值;μ1代表预设第一权重;μ2代表预设第二权重,在本发明实施例中,预设仓库中存储的产品为易受潮产品,因此预设第一权重μ1=0.3.预设第二权重μ2=0.7,在其他实施例中,实施人员可根据具体实施情况设置μ1、μ2的值;Fi的值越大时,说明聚类空间中第i个温湿度数据的异常程度越大,在聚类过程中作为离散点的可能性。
在本发明实施例中,获取聚类空间中每个温湿度数据的更新邻域半径:
式中,R′i代表聚类空间中第i个温湿度数据的更新邻域半径;R代表邻域半径;Fi代表聚类空间中第i个温湿度数据的异常程度;当Fi大于异常程度阈值T1,认为聚类空间中第i个温湿度数据相对于最佳温度数据比较偏离,说明聚类空间中第i个温湿度数据的异常程度较大,此时需要将邻域半径调小获取第i个温湿度数据的更新邻域半径;当Fi小于或等于异常程度阈值T1,认为聚类空间中第i个温湿度数据相对于最佳温度数据不存在偏离,说明聚类空间中第i个温湿度数据的异常程度较小,此时需要将邻域半径调大获取第i个温湿度数据的更新邻域半径;在本发明实施例中,预设异常程度阈值T1=0.5,在其他实施例中,实施人员可根据具体实施情况设置T1的值。
至此,对每个温湿度数据的温度项以及湿度项的值进行归一化处理;根据每个温湿度数据归一化后的温度项的值以及湿度项的值,构建聚类空间;根据聚类空间中的温湿度数据,获取DBESCA聚类算法的最小邻域数以及邻域半径;获取聚类空间中每个温湿度数据的异常程度,根据聚类空间中每个温湿度数据的异常程度对邻域半径进行调整获取聚类空间中每个温湿度数据的更新邻域半径。
S003.获取聚类空间中每个温湿度数据的离散评价值,进而得到聚类空间中的离散数据;获取聚类空间中每个离散数据的第一维度孤立评价标准以及第二维度孤立评价标准,进而得到聚类空间中每个离散数据的孤立评价值,得到聚类空间中的非孤立离散数据,自适应获取聚类空间中每个非孤立离散数据的更新最小邻域数。
需要说明的是,使用固定的最小邻域数进行聚类时无法将聚类空间中多个相似位置的离散的温湿度数据聚为一个簇类(即多个相似位置的离散的温湿度数据的个数未达到固定的最小邻域数),因此本发明首先获取聚类空间中每个温湿度数据的离散评价值,进而得到聚类空间中的离散数据,在对聚类空间中离散数据的建立孤立评价模型,获取聚类空间中的非孤立离散数据,进而合理的动态调整非孤立离散数据的最小邻域数,使得聚类过程中能够将离散但非孤立的温湿度数据聚为一个簇,将离散且孤立的温湿度数据区分开,最终实现更优的聚类结果。
获取聚类空间中每个温湿度数据的离散评价值:
式中,Li代表聚类空间中第i个温湿度数据的离散评价值;N代表最小邻域数;di,p代表聚类空间中与第i个温湿度数据距离最近第p个温湿度数据与第i个温湿度数据之间的距离值;当聚类空间中与第i个温湿度数据距离最近的N个温湿度数据与第i个温湿度数据之间的距离值的均值越大时,说明聚类空间中第i个温湿度数据越离散。需要说明说明的是,聚类空间中两个温湿度数据之间的距离为两个温湿度数据之间的欧几里得距离。
获取聚类空间中的离散数据:若聚类空间中第i个温湿度数据的离散评价值大于邻域半径,则聚类空间中第i个温湿度数据为离散数据,获取聚类空间中的若干离散数据。
需要说明的是,当聚类空间中的离散数据与其邻域数据之间的距离的最大值与距离的最小值之间的差异越大时,说明离散数据越孤立,根据该特征获取聚类空间中离散数据的第一维度孤立评价标准,并且当聚类空间中的离散数据的邻域数据距离离散数据越远时,说明离散数据越孤立,根据该特征获取聚类空间中离散数据的第二维度孤立评价标准。
获取聚类空间中第j个离散数据的第一维度孤立评价标准:
式中,代表聚类空间中第j个离散数据的第一维度孤立评价标准;获取聚类空间中与第j个离散数据距离最近的N个温湿度数据,记为第j个离散数据的邻域数据,/>代表聚类空间中第j个离散数据与第j个离散数据的每个邻域数据之间的距离的最大值;/>代表聚类空间中第j个离散数据与第j个离散数据的每个邻域数据之间的距离的最小值;的值越大,说明聚类空间中第j个离散数据的孤立性较大,||表示求绝对值;exp()代表以自然常数为底数的指数函数,本实施例采用exp(-x)模型来呈现反比例关系,x为模型的输入,实施者可根据实际情况设置反比例函数。
获取聚类空间中第j个离散数据的靠近邻域数据的个数:将聚类空间中第j个离散数据与第j个离散数据的每个邻域数据之间的距离的最小值所对应的邻域数据记为第j个离散数据的最小邻域数据,将聚类空间中第j个离散数据与第j个离散数据的每个邻域数据之间的距离的最大值所对应的邻域数据记为第j个离散数据的最大邻域数据,若第j个离散数据的第b个邻域数据与第j个离散数据的最小邻域数据之间的距离小于第j个离散数据的第b个邻域数据与第j个离散数据的最大邻域数据之间的距离,则将第j个离散数据的第b个邻域数据记为第j个离散数据的靠近邻域数据,统计出第j个离散数据的靠近邻域数据的个数。
获取聚类空间中第j个离散数据的第二维度孤立评价标准:
式中,代表聚类空间中第j个离散数据的第二维度孤立评价标准;N代表最小邻域数;M代表获取聚类空间中第j个离散数据的靠近邻域数据的个数,当M的值越大时,说明聚类空间中第j个离散数据的的邻域数据更加靠近第j个离散数据,此时/>的值越小,表示第j个离散数据的孤立性较低,当M的值越小时,说明聚类空间中第j个离散数据的的邻域数据距离第j个离散数据更远,此时/>的值越大,表示第j个离散数据的孤立性较高。
获取聚类空间中第j个离散数据的孤立评价值:
式中,代表聚类空间中第j个离散数据的第一维度孤立评价标准;/>代表聚类空间中第j个离散数据的第二维度孤立评价标准;G′代表聚类空间中第j个离散数据的孤立评价值;w1代表预设的第一维度权重;w2代表预设的第二维度权重;在本发明实施例中,预设第一维度权重w1=0.4,预设第二维度权重w2=0.6,在其他实施例中,实施人员可根据具体实施情况设置w1以及w2的值。
同理,获取聚类空间中每个离散数据的孤立评价值,预设孤立阈值T,若聚类空间中第j个离散数据的孤立评价值小于孤立阈值T,认为聚类空间中第j个离散数据的孤立性比较低,将聚类空间中第j个离散数据记为非孤立离散数据,获取聚类空间中的非孤立离散数据。
在本发明实施例中,将聚类空间中第v个非孤立离散数据在邻域半径内的数据个数,作为第v个非孤立离散数据的更新最小邻域数,需要说明的是,对于聚类空间中除过非孤立离散数据之外的温湿度数据不改变最小邻域数。
至此,获取聚类空间中每个温湿度数据的离散评价值,进而得到聚类空间中的离散数据;获取聚类空间中每个离散数据的第一维度孤立评价标准以及第二维度孤立评价标准,进而得到聚类空间中每个离散数据的孤立评价值,得到聚类空间中的非孤立离散数据,自适应获取聚类空间中每个非孤立离散数据的更新最小邻域数。
S004.根据聚类空间中每个温湿度数据的更新邻域半径以及每个非孤立离散数据的更新最小邻域数,对聚类空间中的温湿度数据进行聚类后压缩存储。
在本发明实施例中,根据聚类空间每个温湿度数据的更新邻域半径以及每个非孤立离散数据的更新最小邻域数,使用DBSCAN聚类算法对聚类空间中的温湿度数据进行聚类,得到若干聚类簇,对每个聚类簇的聚类中心数据进行压缩并存储至智慧仓储数据管理平台,实现温湿度数据的优化管理,从而完成云计算的智慧仓储数据库下数据的快速分配及管理。
至此,根据聚类空间中每个温湿度数据的更新邻域半径以及每个非孤立离散数据的更新最小邻域数,对聚类空间中的温湿度数据进行聚类,将每个聚类簇的聚类中心数据进行压缩,得到压缩数据,将压缩数据存储至智慧仓储数据管理平台的数据库中。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.基于云计算的智慧仓储数据优化管理方法,其特征在于,该方法包括以下步骤:
采集温湿度数据及最佳温湿度数据,所述温湿度数据包含温度项以及湿度项;
将每个温湿度数据映射到聚类空间;根据聚类空间中的温湿度数据,获取DBSCAN聚类算法的最小邻域数以及邻域半径;根据聚类空间中温湿度数据相较于最佳温湿度数据的位置偏移,获取聚类空间中每个温湿度数据的异常程度;根据聚类空间中每个温湿度数据的异常程度对邻域半径进行调整,获取聚类空间中每个温湿度数据的更新邻域半径;
根据聚类空间中温湿度数据之间的距离,获取聚类空间中的离散数据;根据聚类空间中的离散数据与离散数据的邻域数据之间的距离,获取聚类空间中每个离散数据的第一维度孤立评价标准以及每个离散数据的靠近邻域数据的个数;根据每个离散数据的靠近邻域数据的个数以及最小邻域数,获取聚类空间中每个离散数据的第二维度孤立评价标准;根据聚类空间中每个离散数据的第一维度孤立评价标准以及第二维度孤立评价标准,获取聚类空间中的非孤立离散数据;将聚类空间中每个非孤立离散数据在邻域半径内的温湿度数据的个数作为每个非孤立离散数据的更新最小邻域数;
根据聚类空间中每个温湿度数据的更新邻域半径以及每个非孤立离散数据的更新最小邻域数,对聚类空间中的温湿度进行聚类后压缩存储。
2.根据权利要求1所述的基于云计算的智慧仓储数据优化管理方法,其特征在于,所述将每个温湿度数据映射到聚类空间;根据聚类空间中的温湿度数据,获取DBSCAN聚类算法的最小邻域数以及邻域半径,包括的具体步骤如下:
式中,Ti代表第i个温湿度数据的温度项的值;Tmin代表所有温湿度数据的温度项中的最小值;Tmax代表所有温度数据的温度项中的最大值;T′i代表第i个温湿度数据归一化后的温度项的值;RGi代表第i个温湿度数据的湿度项的值;RGmin代表所有温湿度数据的湿度项中的最小值;RGmax代表所有温湿度数据的湿度项中的最大值;RH′i代表第i个温湿度数据归一化后的湿度项的值;
以温度项为横坐标、湿度项为纵坐标构建二维的聚类空间,根据每个温湿度数据归一化后的温度项的值以及湿度项的值,将每个温湿度数据映射到聚类空间中;
根据聚类空间中的温湿度数据,使用K-距离图获取DBSCAN聚类算法的最小邻域数以及邻域半径。
3.根据权利要求1所述的基于云计算的智慧仓储数据优化管理方法,其特征在于,所述根据聚类空间中温湿度数据相较于最佳温湿度数据的位置偏移,获取聚类空间中每个温湿度数据的异常程度,包括的具体步骤如下:
式中,Fi代表聚类空间中第i个温湿度数据的异常程度,Ti′代表第i个温湿度数据归一化后的温度项的值;RH′i代表第i个温湿度数据归一化后的湿度项的值;T′o代表最佳温湿度数据归一化后的温度项的值;RH′o代表最佳温湿度数据归一化后的湿度项的值;μ1代表预设第一权重;μ2代表预设第二权重。
4.根据权利要求1所述的基于云计算的智慧仓储数据优化管理方法,其特征在于,所述根据聚类空间中每个温湿度数据的异常程度对邻域半径进行调整,获取聚类空间中每个温湿度数据的更新邻域半径,包括的具体步骤如下:
式中,R′j代表聚类空间中第i个温湿度数据的更新邻域半径;R代表邻域半径;Fi代表聚类空间中第i个温湿度数据的异常程度;T1代表预设异常程度阈值。
5.根据权利要求1所述的基于云计算的智慧仓储数据优化管理方法,其特征在于,所述根据聚类空间中温湿度数据之间的距离,获取聚类空间中的离散数据,包括的具体步骤如下:
式中,Li代表聚类空间中第i个温湿度数据的离散评价值;N代表最小邻域数;di,p代表聚类空间中与第i个温湿度数据距离最近第p个温湿度数据与第i个温湿度数据之间的距离值;
若聚类空间中第i个温湿度数据的离散评价值大于邻域半径,将聚类空间中第i个温湿度数据作为离散数据,得到聚类空间中的若干离散数据。
6.根据权利要求1所述的基于云计算的智慧仓储数据优化管理方法,其特征在于,所述根据聚类空间中的离散数据与离散数据的邻域数据之间的距离,获取聚类空间中每个离散数据的第一维度孤立评价标准以及每个离散数据的靠近邻域数据的个数,包括的具体步骤如下:
获取聚类空间中与第j个离散数据距离最近的N个温湿度数据,记为第j个离散数据的邻域数据;
式中,代表聚类空间中第j个离散数据的第一维度孤立评价标准;/>代表聚类空间中第j个离散数据与第j个离散数据的每个邻域数据之间的距离的最大值;/>代表聚类空间中第j个离散数据与第j个离散数据的每个邻域数据之间的距离的最小值;exp()代表以自然常数为底数的指数函数,||表示求绝对值;
将聚类空间中第j个离散数据与第j个离散数据的每个邻域数据之间的距离的最小值所对应的邻域数据记为第j个离散数据的最小邻域数据,将聚类空间中第j个离散数据与第j个离散数据的每个邻域数据之间的距离的最大值所对应的邻域数据记为第j个离散数据的最大邻域数据;
根据聚类空间中离散数据的邻域数据与离散数据的最小邻域数据以及最大邻域数据之间的距离,获取每个离散数据的靠近邻域数据的个数。
7.根据权利要求6所述的基于云计算的智慧仓储数据优化管理方法,其特征在于,所述根据聚类空间中离散数据的邻域数据与离散数据的最小邻域数据以及最大邻域数据之间的距离,获取每个离散数据的靠近邻域数据的个数,包括的具体步骤如下:
若第j个离散数据的第b个邻域数据与第j个离散数据的最小邻域数据之间的距离小于第j个离散数据的第b个邻域数据与第j个离散数据的最大邻域数据之间的距离,将第j个离散数据的第b个邻域数据记为第j个离散数据的靠近邻域数据,统计第j个离散数据的靠近邻域数据的个数。
8.根据权利要求1所述的基于云计算的智慧仓储数据优化管理方法,其特征在于,所述根据每个离散数据的靠近邻域数据的个数以及最小邻域数,获取聚类空间中每个离散数据的第二维度孤立评价标准,包括的具体步骤如下:
式中,代表聚类空间中第j个离散数据的第二维度孤立评价标准;N代表最小邻域数;M代表获取聚类空间中第j个离散数据的靠近邻域数据的个数。
9.根据权利要求1所述的基于云计算的智慧仓储数据优化管理方法,其特征在于,所述根据聚类空间中每个离散数据的第一维度孤立评价标准以及第二维度孤立评价标准,获取聚类空间中的非孤立离散数据,包括的具体步骤如下:
式中,代表聚类空间中第j个离散数据的第一维度孤立评价标准;/>代表聚类空间中第j个离散数据的第二维度孤立评价标准;G′代表聚类空间中第j个离散数据的孤立评价值;w1代表预设的第一维度权重;w2代表预设的第二维度权重;
预设孤立阈值T,若聚类空间中第j个离散数据的孤立评价值小于孤立阈值Q,将聚类空间中第j个离散数据记为非孤立离散数据。
10.根据权利要求1所述的基于云计算的智慧仓储数据优化管理方法,其特征在于,所述根据聚类空间中每个温湿度数据的更新邻域半径以及每个非孤立离散数据的更新最小邻域数,对聚类空间中的温湿度进行聚类后压缩存储,包括的具体步骤如下:
根据聚类空间每个温湿度数据的更新邻域半径以及每个非孤立离散数据的更新最小邻域数,使用DBSCAN聚类算法对聚类空间中的温湿度数据进行聚类,得到若干聚类簇,对每个聚类簇的聚类中心数据进行压缩,得到压缩数据,将压缩数据存储。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311789890.4A CN117743876B (zh) | 2023-12-22 | 2023-12-22 | 基于云计算的智慧仓储数据优化管理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311789890.4A CN117743876B (zh) | 2023-12-22 | 2023-12-22 | 基于云计算的智慧仓储数据优化管理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117743876A true CN117743876A (zh) | 2024-03-22 |
CN117743876B CN117743876B (zh) | 2024-07-16 |
Family
ID=90277619
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311789890.4A Active CN117743876B (zh) | 2023-12-22 | 2023-12-22 | 基于云计算的智慧仓储数据优化管理方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117743876B (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020155755A1 (zh) * | 2019-01-28 | 2020-08-06 | 平安科技(深圳)有限公司 | 基于谱聚类的异常点比例优化方法、装置及计算机设备 |
CN111507415A (zh) * | 2020-04-21 | 2020-08-07 | 南京信息工程大学 | 一种基于分布密度的多源大气数据聚类方法 |
DE102021100351A1 (de) * | 2020-01-15 | 2021-07-15 | Aptiv Technologies Limited | Adaptive untersuchung für lidar-basiertes gruppieren |
CN113673549A (zh) * | 2021-06-25 | 2021-11-19 | 王春晓 | 一种基于k邻域最大距离平均值的dbscan聚类半径估计方法 |
US20220197868A1 (en) * | 2020-12-17 | 2022-06-23 | EMC IP Holding Company LLC | Data compression using dictionaries |
CN115314714A (zh) * | 2022-10-12 | 2022-11-08 | 南通虎神金属制品有限公司 | 一种用于焊缝图像存储的数据压缩方法 |
CN116975539A (zh) * | 2023-08-16 | 2023-10-31 | 杭州火奴数据科技有限公司 | 基于聚类算法的营销数据存储管理系统 |
-
2023
- 2023-12-22 CN CN202311789890.4A patent/CN117743876B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020155755A1 (zh) * | 2019-01-28 | 2020-08-06 | 平安科技(深圳)有限公司 | 基于谱聚类的异常点比例优化方法、装置及计算机设备 |
DE102021100351A1 (de) * | 2020-01-15 | 2021-07-15 | Aptiv Technologies Limited | Adaptive untersuchung für lidar-basiertes gruppieren |
CN111507415A (zh) * | 2020-04-21 | 2020-08-07 | 南京信息工程大学 | 一种基于分布密度的多源大气数据聚类方法 |
US20220197868A1 (en) * | 2020-12-17 | 2022-06-23 | EMC IP Holding Company LLC | Data compression using dictionaries |
CN113673549A (zh) * | 2021-06-25 | 2021-11-19 | 王春晓 | 一种基于k邻域最大距离平均值的dbscan聚类半径估计方法 |
CN115314714A (zh) * | 2022-10-12 | 2022-11-08 | 南通虎神金属制品有限公司 | 一种用于焊缝图像存储的数据压缩方法 |
CN116975539A (zh) * | 2023-08-16 | 2023-10-31 | 杭州火奴数据科技有限公司 | 基于聚类算法的营销数据存储管理系统 |
Non-Patent Citations (4)
Title |
---|
WHELAN, MICHAEL: "Application of Clustering Techniquesfor Pre-Processing Spatio-Temporal Data", UNIVERSITY COLLEGE DUBLIN. SCHOOL OF COMPUTER SCIENCE, 5 May 2022 (2022-05-05) * |
吴运宏;舒昕;王戒躁;闫光辉;: "基于微簇的桥梁监测数据流异常识别研究", 计算机应用与软件, no. 09, 15 September 2016 (2016-09-15) * |
宁子俊等: "复杂工况下综合传动装置状态监测数据异常检测方法", 机电工程, vol. 40, no. 9, 20 September 2023 (2023-09-20), pages 1387 - 1394 * |
梁俊杰;冯玉才: "LBD:基于局部位码比较的高维空间KNN搜索算法", 计算机科学, no. 006, 31 December 2007 (2007-12-31) * |
Also Published As
Publication number | Publication date |
---|---|
CN117743876B (zh) | 2024-07-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Benoudjit et al. | On the kernel widths in radial-basis function networks | |
Cateni et al. | A hybrid feature selection method for classification purposes | |
CN117454255B (zh) | 一种智慧建筑能耗数据优化存储方法 | |
US20190286980A1 (en) | Cluster compression for compressing weights in neural networks | |
CN110427991A (zh) | 一种字符串匹配方法及装置 | |
US11809475B2 (en) | Representation and visualization of multivariate sensory time series data | |
CN117892095B (zh) | 一种储能系统用的散热系统故障智能检测方法 | |
CN117764290B (zh) | 一种水利工程施工用bim模型数据管理方法 | |
CN112905583A (zh) | 一种高维大数据离群点检测方法 | |
CN114566277B (zh) | 一种基于联邦元学习的罕见疾病分类方法 | |
CN114332500B (zh) | 图像处理模型训练方法、装置、计算机设备和存储介质 | |
Emmanuel et al. | Fuzzy clustering and Whale-based neural network to food recognition and calorie estimation for daily dietary assessment | |
CN117743876B (zh) | 基于云计算的智慧仓储数据优化管理方法 | |
CN109716660A (zh) | 数据压缩装置和方法 | |
US7343362B1 (en) | Low complexity classification from a single unattended ground sensor node | |
CN117453664A (zh) | 溯源数据异常检测方法及区块链溯源数据存储方法 | |
Glava et al. | Searching similar entities in models of various subject domains based on the analysis of their tuples | |
TWI710960B (zh) | 影像分類系統與方法 | |
CN113392086B (zh) | 基于物联网的医疗数据库构建方法、装置及设备 | |
CN111275371A (zh) | 数据处理方法、数据处理设备和计算机可读存储介质 | |
Sookpong et al. | A unhealthy plant identification system using a generative adversarial network | |
CN110175645B (zh) | 一种确定保护装置型号的方法及计算装置 | |
CN117151229B (zh) | 一种基于云边端架构的云端推理方法及系统 | |
Enríquez et al. | Artificial intelligence-based banana ripeness detection | |
CN118535943B (zh) | 一种基于云计算的金融数据分布式存储方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |