메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터

주제분류

정기구독(개인)

소속 기관이 없으신 경우, 개인 정기구독을 하시면 저렴하게
논문을 무제한 열람 이용할 수 있어요.

회원혜택

로그인 회원이 가져갈 수 있는 혜택들을 확인하고 이용하세요.

아카루트

학술연구/단체지원/교육 등 연구자 활동을 지속하도록 DBpia가 지원하고 있어요.

영문교정

영문 논문 작성에 도움을 드리기 위해, 영문 교정 서비스를
지원하고 있어요.

고객센터 제휴문의

...

저널정보

저자정보

표지
이용수
내서재
1
내서재에 추가
되었습니다.
내서재에서
삭제되었습니다.

내서재에 추가
되었습니다.
내서재에서
삭제되었습니다.

초록·키워드

오류제보하기
본 논문에서는 침입탐지 데이터셋을 사용하여 이상 행위를 탐지하고 데이터 전처리 과정의 효율성을 높이기 위해 훈련 데이터의 클래스 비율을 조절한다. 제안 방법의 성능을 입증하기 위해 머신러닝 알고리즘들을 사용하여 비교 실험을 한다. 일반적으로 머신러닝을 기반으로 한 분류 알고리즘을 적용할 때 클래스의 크기는 분류에 많은 영향을 끼친다. 주요 클래스 크기가 희소 클래스에 비해 많이 큰 경우에는 주요 클래스로만 분류되는 경향이 있다. 희소 클래스의 비율이 최소 0.5% 이상 되도록 유지하고, 희소 클래스의 분류 효율을 높일 수 있는 적절한 비율을 찾고자 한다. 기존 데이터에 랜덤성을 부여하여 희소 클래스들의 수를 증가시키는 SMOTE (Synthetic Miniority Over-sampling TEchnique) 기법을 사용한다. 실험에 사용한 KDD CUP 1999 데이터셋은 R2L과 U2R 공격 유형에 해당하는 클래스의 수가 매우 적어서 높은 분류 효율을 내기 어려운 점이 있다. 본 연구에서는 여러 클래스들 간의 관계 및 분포를 분석한 후, 주요 클래스와 희소 클래스의 비중을 조절하는 방법을 사용하여 분류 효율을 개선하였다. 특히, 희소 클래스의 탐지 여부에 높은 비중을 두면서 전체적인 분류 성능을 개선하고자 하였다. 훈련 데이터셋의 희소 클래스인 U2R, R2L 및 Probe를 각각 120배, 9배, 1.5배 증가시킨 recall 실험 결과에서, k-NN 실험에 대해 U2R 클래스의 경우 0.11, R2L 클래스의 경우 0.02의 성능 향상을 보였다. SVM 실험에서 U2R 클래스의 경우 0.02, R2L 클래스의 경우 0.08의 성능 향상을 보였으며, 의사결정트리 실험에서는 U2R 클래스의 경우에 0.25의성 능 향상을 보였다.

In this paper, we adjusted the class distribution of train data to increase efficiency in data pre-processing and detect anomalies in an intrusion detection dataset. We conduct an experiment with machine learning algorithms to prove the efficiency of our proposed methods. In general, when using machine learning algorithms, volume of class influences on the results of classification. When the volume of majority classes is larger than that of minority classes, most of samples tend to vote the majority class. We hold the proportion of each rare class to be 0.5% at least, and try to find the proper proportion of rare classes. SMOTE (Synthetic Minority Over-sampling TEchnique) was used to increase the number of instances of rare class. It is difficult to improve the efficiency of classification because KDD CUP 1999 dataset, which are used to our tests, have rare classes such as R2L and U2R. In our research, we analyze various classes and enhance the efficiency of clasfsiciation by adjusting the volume of rare classes. We attempt tiomprove the performance of classification focusing on the rare classes such as U2R, R2L and Probe. The number of instances of U2R, R2L and Probe class in the train data was increased by 12-fold, 9-fol da,nd 1.5 fold, respectively. Recall metrics okf -NN tests went up to 0.11 in U2R class and 0.02 in R2L class. Recall metrics of SVM tests went up to 0.02 in U2R class and 0.08 in R2L class, and those of decision tree tests went up to 0.25.

목차

Abstract
요약
1. 서론
2. 관련연구
3. 데이터셋
4. 데이터 전처리 및 제안방법
5. 실험
6. 결론 및 향후 연구
References

참고문헌 (17)

참고문헌 신청

함께 읽어보면 좋을 논문

논문 유사도에 따라 DBpia 가 추천하는 논문입니다. 함께 보면 좋을 연관 논문을 확인해보세요!

이 논문의 저자 정보

이 논문과 함께 이용한 논문

최근 본 자료

전체보기

댓글(0)

0