초록

본 연구는 산불 발생 예측 모형의 정확도를 높이기 위해 머신러닝 기법을 적용한 연구이다. 산불 피해 면적이 가장 큰 강원도를 중심으로 2003년부터 2016년까지 총 14년의 산불 자료를 이용하였다. 기상자료의 오차를 줄이기 위해 강원도를 9개의 구역으로 나누어 각 구역 관측소의 기상자료를 이용하였다. 9개의 구역으로 나누어 각 구역의 산불 예측 모형을 만들게 되면 산불이 발생한 날(majority)과 산불이 발생하지 않은 날(minority)의 비율 차이가 큰 불균형 문제가 발생한다. 불균형 문제에서는 모델의 성능이 떨어지는 현상이 발생할 수 있다. 이를 해결하기 위해 여러 샘플링 방법을 적용하였다. 또한 모델의 정확도를 높이기 위해 캐나다 산불 기상 지수(FWI)의 5가지 지수를 파생변수로 사용하였다. 모델링 방법은 통계적 방법인 로지스틱 회귀분석 방법과 머신러닝 방법인 random forest와 xgboost 방법을 사용하였다. 각 구역의 최종모델의 선택기준을 정확도, 민감도, 특이도를 고려하여 정했으며, 9개 구역의 예측 결과는 산불이 발생한 104건 중 80건의 발생 예측에 성공하였으며 산불이 발생하지 않은 9758건 중 7426건의 발생하지 않음을 예측했다. 전체의 정확도는 76.1%였다.

키워드

캐나다 산불 기상 지수(FWI), 머신러닝 모델, 샘플링, 불균형 데이터

참고문헌(8)open

  1. [학술지] 박흥석 / 2009 / 캐나다 산불 기상지수를 이용한 산불발생확률모형 개발 -강원도 지역 산불발생을 중심으로- / 한국방재학회논문집 9 (3) : 95 ~ 100

  2. [학술지] 이병두 / 2012 / 로지스틱 회귀모형을 이용한 산불발생확률모형 개발 / 한국산림과학회지 101 (1) : 1 ~ 6

  3. [학술지] Amiro, B. D. / 2004 / Fire Weather index system components for large fires in the Canadian boreal forest / Intern ational Journal of Wildland Fire 13 : 391 ~ 400

  4. [학술지] Breiman, L. / 2001 / Random Forests / Machine Learning 45 (1) : 5 ~ 32

  5. [단행본] Chawla, N. V / 2002 / SMOTE: synth-etic minority over-sampling technique

  6. [학술대회] Freund, Y. / 1996 / Experim-ents with a new boosting algorithm, Machine Learning / Proceedings of the Thirteenth International Conference : 148 ~ 156

  7. [단행본] Gareth J / 2015 / An Introduction to Statistical Learning withAppli cations in R / Springer

  8. [인터넷자료] / XGBoost