持续更新中...
7th/Top1%,提供答疑
也能做到前5,但是没必要
- 由于滴滴数据保密协议,博主也无法找到可开放数据及数据地址,故无法提供。
- 数据来自滴滴出行,英文(Data source: Didi Chuxing),数据出处:https://gaia.didichuxing.com
- max_order_xt:head级别的特征,如同一sample_eta、distinct等
- max_170_link_sqe_for_order:link序列特征,如右格式:[link_id_1, link_id_3, link_id_20...]
- cross_data_dir:cross序列特征
- link_data_other_dir:link统计特征,如某link_id前6小时的均值、求和等
- head_data_dir:历史同星期的全天的统计特征
- win_order_data_dir:订单的滑窗特征,如当前订单时间点的前段时间的统计特征
- arrival_data_dir:历史到达路况状态的统计特征
- zsl_arrival_data_dir:同上,不同人进行构建
- arrival_sqe_data_dir:到达时刻的序列特征,提供给DCN的T模型进行蒸馏给S模型
- pre_arrival_sqe_dir:利用树模型预测的到达时刻特征
- zsl_link_data_dir:link统计特征,不同人构建
- scikit-learn
- tqdm
- pandarallel
- joblib
- lightgbm
- pandas
- numpy
- keras_radam
- tensorFlow-gpu=2.4.0
- DCN蒸馏_12953
- DCN蒸馏模型(利用“未来”数据),线上分数0.12953
- dcn_model/dcn_model.py:模型代码
- dcn_model/main.py:主函数,训练和预测
- dcn_model/process.py:特征预处理
- dcn_model/model_h5:存放处理信息,不影响模型结果
- WD_128544
- WD模型,线上分数0.128544
- 其他同上
- 代码属于公司所有,不能提供最优代码
- 感谢@xbder、@AiIsBetter