Skip to content

简单的机器学习工具 | Easy Machine Learning Tools

Notifications You must be signed in to change notification settings

tcbbcc/EasyMachineLearning

 
 

Repository files navigation

机器学习工具使用介绍

[TOC]

1. 数据的获取和检查

1.1 参数解释

在这里插入图片描述

  1. 数据路径:点击选择数据路径,尽量选择excel文件,其他文件的需求我自己有,但不会在这里做出来。会以一种隐性的方式方便我自己使用,有需求的小伙伴可以提出来,我看看有时间就加上。在选择路径后会自动识别该路径为默认保存路径!
  2. 保存路径:如果不满意默认的保存路径,可以自己点击选择设置,覆盖默认保存路径。
  3. 数据列名:自动识别数据的列名(如果你的excel数据中只有数据没有列名,那么很可能会出错,得不到你想要的结果)

1.2 使用效果

  1. 选择数据效果

    在这里插入图片描述

  2. 点击查看后输出数据的要求。

    在这里插入图片描述

2. 数据分析和预处理

左侧数据分析、数据清洗等点击后会实现右侧所有的功能。例如点击数据分析时,右侧特征矩阵图-异常值分析都会进行,单独点击右测的某一个按钮,只进行对应的操作。同时对于数据标准化这种的,由于右侧是单选,而在点击数据清洗之后,右侧所有的方法都会执行一遍,生成不同的文件。该想法会在下面的聚类和分类中实现)

  1. 特征矩阵图:每个特征之间的scatter点图,可以绘制分类的情况,也可以绘制分类并回归的情况。
  2. 相关性分析:求两两特征之间的皮尔逊相关系数,并绘图
  3. 数据标准化:
    1. 离差标准化:即最大最小值标准化
  4. 主成分分析:
    1. PCA:就是正常的PCA

About

简单的机器学习工具 | Easy Machine Learning Tools

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Jupyter Notebook 86.2%
  • Python 13.8%