Skip to content

xiaorancs/chicken-sales-forecast

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

2 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

肉鸡销售预测

目标

  1. 以2014年到2016年的肉鸡销售价格数据为训练数据,建立肉鸡销售价格预测模型;
  2. 基于你的模型,预测2017年1月到3月每一天每个地区的肉鸡销售价格;
  3. 根据你的模型和分析结果提出相应的决策建议。

特征思路

  1. 首先明确这是一个回归问题,两个解决思路,
    • 使用自回归模型,根据前面的数据得到数据趋势模式
    • 提取特征得到回归模型
  2. 特征提取思路
    • 对于第i个月第j天的特征,我们提取两个思路特征;
    • 对应当天的前一年和两年的时间点提取的特征,我们以16年的数据中提取训练数据
    • 当天的前k天的值对应的特征
  3. 选择时间区间
    • k in [0,1,2,3,5,7,10,15]
    • 提取预测当天前k天的值,以及对应的统计值[min,max,avg,skew,kurt,var,std],以及前后的差值
    • 这里需要在线特征的提取,需要将预测的值进行一个特征的提取的基础
    • k in [-7,-5,-3,-2,-1,0,1,2,3,5,7],-5代表后五天
    • 提取对应天前一年和两年的对应k天的值,已经统计值和差值
  4. 缺失值处理
    • 对于回归题目缺失值处理很重要
    • 这里选择的以前一年对应月份的均值进行填充
  5. 选择模型
    • line regerssion
    • xgb 的线性模型
  6. 模型训练
    • 将省份作为特征,整体训练
    • 对不同的省份进行单独的训练和预测
    • 比较两种模型,进行模型的平均
  7. 重新修改k的取值区间,继续重复前面的步骤。

代码版本介绍

  1. code.py 是测试代码,主要目的是简单实现模型代码正确性,包括自回归和基于特征的预测
  2. mycode_k.py 基于数字进行增加提取特征,比如说先选择前两年的特征,扩展到前k天,以及修改k值等不同操作,以此递增

最后排名

37 / 245(508人)