- Nix 1994의 MVE(Mean and Variance Estimation) 방법을 미세먼지 자료에 적용
- 다양한 통계적 모형을 자동적으로 찾는 모형 (degree of freedom 등)
- 소스코드 정리
- confidence interval이 실제로 맞나 확인하기 위해 이론적 모형
$$y = f(\mathbf{x}) + \epsilon, \quad \epsilon \sim D(0, \sigma(\mathbf{x}))$$ 에서 데이터를 생성하고, 여러 번의 신뢰구간 추정을 통해 실제로 추정이 가능한 지, 아닌 지를 확인 - 자유도, moment matching등을 통해 임의의 모형을 적합할 수 있는 방법에 대해 고민
- 베이즈 딥러닝을 도입해 다양한 종류의 uncertainty를 계산
- 이론적 성질 규명 (Gaussian Process와의 연관성)
2015-2016 데이터 사용 (PM, BPM)
Data | Description | Source |
---|---|---|
PM25 | 일 평균 초미세먼지 농도 | 한국환경공단(www.airkorea.or.kr) |
BPM25 | 전일 베이징 초미세먼지 농도 | 미국 국무부 대기 질 모니터링 프로그램 (www.stateair.net) |
meanTemp | 전일 평균기온 | 기상자료개방포털(data.kma.go.kr) |
minTemp | 전일 최저기온 | 기상자료개방포털(data.kma.go.kr) |
maxTemp | 전일 최고기온 | 기상자료개방포털(data.kma.go.kr) |
meanWind | 전일 평균풍속 | 기상자료개방포털(data.kma.go.kr) |
maxWind | 전일 최대풍속 | 기상자료개방포털(data.kma.go.kr) |
Rain | 강우 여부 | 기상자료개방포털(data.kma.go.kr) |
lat | 위도 | TBA |
long | 경도 | TBA |
- 서울 전체 평균:
PM25 ~ .-lat-long
- 관측소별 예측으로,
PM25 ~ .
Base model- RNN model
- LSTM
- Classical models:
- Linear model
- SVM
- random forests
todo: Bayesian deep learning?
정규분포코시 분포 (t분포,df=1
라플라스 분포- t 분포 (자유도를 조율하는 형태로)
- log-normal 분포
- measure: MSE
- confidence interval: proportion (ratio)
- 기울임체로 작성한 부분들 구현
- 최근 자료 사용 (2019년 관련 자료 이용)
- Nix, D.A., and A.S. Weigend. “Estimating the Mean and Variance of the Target Probability Distribution.
- Damianou, Andreas C., and Neil D. Lawrence. “Deep Gaussian Processes.” In Artificial Intelligence and Statistics, 207–15, 2013. https://arxiv.org/abs/1211.0358.” In Proceedings of 1994 IEEE International Conference on Neural Networks (ICNN’94), 55–60 vol.1. Orlando, FL, USA: IEEE, 1994. https://doi.org/10.1109/ICNN.1994.374138.
- Gal, Yarin, and Zoubin Ghahramani. “Dropout as a Bayesian Approximation: Representing Model Uncertainty in Deep Learning” 48 (2015). https://doi.org/10.1109/TKDE.2015.2507132.
- Gal, Yarin. “Uncertainty in Deep Learning.” PhD Thesis, University of Cambridge, no. September (2016). https://doi.org/10.1371/journal.pcbi.1005062.