본문 바로가기
교육이론

감성분석이란?(개념 및 분석)

by 신박에듀 2022. 4. 27.
반응형

안녕하세요 에듀몬입니다. IT 기술이 고도화됨에 따라 온라인 상에서 사람들의 자취는 곧 데이터로 누적되고, 이는 분석의 대상이 됩니다. 텍스트 형태로 누적되는 이러한 사람들의 자취는 오늘날 '감성분석'이라는 형태로 공유되고 있는데요. 이번 시간에는 감성분석에 대해 알아보도록 하겠습니다.

 

 

1. 감성분석의 개념

 

  감성분석은 '텍스트 문서에서 감성이 어떻게 표현되고 있는지, 특정한 주제에 대해 긍정 혹은 부정적 표현들이 포함되어 있는지를 확인하는 방법론' 입니다. 즉 자연어 처리와 텍스트 분석, 전산언어학 등을 이용해 텍스트 내에서 주관적인 정보를 확인하고 추출하는 기법으로 ‘오피니언 마이닝’이라고도 합니다. 감성분석의 기본 작업은 텍스트의 극성을 긍정, 부정, 중립 등으로 분류하는 것입니다.

  SNS가 사람들의 감성과 의견을 표현하는 도구가 되어가면서 그들이 남긴 텍스트들은 특정 대상에 대한 감성을 추출하여 마케팅 또는 정치적 캠페인에 많이 이용되고 있습니다.

 

 

2. 감성분석의 분석수준

 

  감성분석은 크게 두 가지 수준에서 분석이 이루어집니다. 첫째로 문서 수준의 감성분석을 통해 문서의 긍정 또는 부정적 성향을 판단합니다. 분석은 문서 내에 있는 특정 키워드에 대한 긍정 또는 부정을 분석하는 것이 아닌 감성표현의 단어, 어휘들의 출현 빈도를 통해 그 문서의 긍정/부정의 정도를 판별해냅니다. 둘째, 구나 문장 수준의 분석방법으로 감성분석을 이용해 리뷰에서 감성을 포함한 문장을 추출하고 그 문장을 대상으로 키워드 측면에서 키워드들에 대한 감성을 분석하는 방법입니다.

 

 

 

 

3. 감성분석을 활용한 연구

 

  한국어의 경우 감성사전에 대한 구축이 되어있지 않은 상태이기 때문에 감성사전부터 작성하는 연구들이 많습니다. 이러한 연구들은 감성사전을 작성하기 위해 회귀분석과 같은 기계적 학습 기반 예측기반을 이용하며 사람들의 평가를 통해 부여받은 문장들로 구성된 트레이닝 데이터를 생성하여 이 문장을 구성하는 단어들과 감성의 적재 값으로 구성된 감성사전을 작성합니다. 이러한 회귀식은 독립변수가 수 만개의 단어로 구성되기 때문에 차원축소를 위해 라쏘(lasso), 릿지(ridge), 엘라스틱(elastic) 등의 축소기법을 적용하기도 합니다. 영어권의 경우 공인된 감성사전인 WordNet을 이용하여 어휘의 의미 극성을 판단하여 이를 바탕으로 긍정 또는 부정의 단순 구분이 아닌 감성의 정도 값을 정의한 SentiWordNet 관련 연구가 있습니다.

 

 

※ 참고문헌: 빅데이터 마이닝에 의한 환경민원의 감성분석 및 공간패턴분석(홍석은, 2018)

 

  

반응형