

소셜미디어 감성분석을 위한 베이지안 속성 선택과 분류에 대한 연구
Investigating the Performance of Bayesian-based Feature Selection and Classification Approach to Social Media Sentiment Analysis

첫 페이지 보기

※ 기관로그인 시 무료 이용이 가능합니다.




Social media-based communication has become crucial part of our personal and official lives. Therefore, it is no surprise that social media sentiment analysis has emerged an important way of detecting potential customers’ sentiment trends for all kinds of companies. However, social media sentiment analysis suffers from huge number of sentiment features obtained in the process of conducting the sentiment analysis. In this sense, this study proposes a novel method by using Bayesian Network. In this model MBFS (Markov Blanket-based Feature Selection) is used to reduce the number of sentiment features. To show the validity of our proposed model, we utilized online review data from Yelp, a famous social media about restaurant, bars, beauty salons evaluation and recommendation. We used a number of benchmarking feature selection methods like correlation-based feature selection, information gain, and gain ratio. A number of machine learning classifiers were also used for our validation tasks, like TAN, NBN, Sons & Spouses BN (Bayesian Network), Augmented Markov Blanket. Furthermore, we conducted Bayesian Network-based what-if analysis to see how the knowledge map between target node and related explanatory nodes could yield meaningful glimpse into what is going on in sentiments underlying the target dataset.
온라인 사용자들이 소셜 미디어상에 올린 온라인 리뷰 속 숨겨진 감정을 분석하는 감성분석은 소셜미디어의 확산에 힘입어 많은 관심을 받고 있다. 본 연구는 기존 연구들과 차별화된 방법으로 감성분석을 시도하기 위하여 베이지안 네트워크에 기반한 감성 분석 모델을 제안한다. 모델에는 MBFS (Markov Blanket-based Feature Selection)가 속성 선택 기법으로 사용된다. MBFS의 성과를 실증적으로 증명하기 위하여 소셜미디어인 Yelp의 리뷰 데이터를 활용하였다. 벤치마킹 속성 선택 기법으로는 상관관계기반 속성 선택, 정보획득 속성 선택, 획득비율 속성 선택을 사용하였다. 한편, 해당 속성선택 방법을 토대로 4개의 머신러닝 알고리즘을 이용하여 분류성과를 비교하였다. 나아가 MBFS로 선택된 속성들 간 인과관계를 확인하고자 베이지안 네트워크를 통해 What-if 분석을 실시하였다. 본 연구에서 택한 머신러닝 분류기는 베이지안 네트워크 기반의 TAN (Tree Augmented Naïve Bayes), NB (Naïve Bayes), S-Spouses(Sons & Spouses), A-markov (Augmented Markov Blanket)이다. 성과분석 결과 본 연구에서 제안한 MBFS 방법이 정확도, 정밀도, F1점수 측면에서 벤치마킹 방법보다 더 우수한 성과를 나타내었다.


Ⅰ. 서론
Ⅱ. 관련연구
2.1 감성분석
2.2 속성 선택
Ⅲ. 연구방법
3.1 종속변수 정의
3.2 텍스트 전처리
3.3 속성 선택 적용
3.4 분류기 평가
Ⅳ. 연구결과
4.1 분류 결과
4.2 What-if 분석 결과
Ⅴ. 토의 및 결론


  • 강창민 [ Chang Min Kang | 성균관대학교 경영대학 석사과정 ]
  • 어균선 [ Kyun Sun Eo | 성균관대학교 경영대학 박사과정 ]
  • 이건창 [ Kun Chang Lee | 성균관대학교 글로벌 경영학과/삼성융합의과학원(SAIHST) 융합의과학과 교수 ] 교신저자


자료제공 : 네이버학술정보

간행물 정보


  • 발행기관명
    한국경영정보학회 [The Korea Society of Management information Systems]
  • 설립연도
  • 분야
  • 소개
    이 학회는 경영정보학의 연구 및 교류를 촉진하고 학문의 발전과 응용에 공헌함을 목적으로 합니다.


  • 간행물명
    경영정보학연구 [Information Systems Review]
  • 간기
  • pISSN
  • eISSN
  • 수록기간
  • 등재여부
    KCI 등재
  • 십진분류
    KDC 325 DDC 658

이 권호 내 다른 논문 / 경영정보학연구 제24권 제1호

    피인용수 : 0(자료제공 : 네이버학술정보)

    함께 이용한 논문 이 논문을 다운로드한 분들이 이용한 다른 논문입니다.

      페이지 저장