이전 포스팅에서 만들어 둔 swn_polarity() 함수를 pos_tagged_df에 적용해 데이터 프레임의 각 로우에 저장되어 있는 코퍼스들의 감성 지수를 확인해 보겠습니다.
from preprocess import swn_polarity
# dataframe에 swn_polarity() 함수 적용
df['swn_sentiment'] = df['pos_tagged_tokens'].apply(swn_polarity)
df[['review', 'swn_sentiment']]
각 문장의 감성 분석 결과를 구해 봤습니다. 결과로 나온 Dataframe에서 몇 개의 원문 데이터를 보며 결과가 잘 나왔는지 확인해 볼게요.
먼저 첫 번째 리뷰입니다. 해당 리뷰는 감성 지수가 -0.25로, 부정적인 리뷰라고 확인됐는데요.
df['review'][0]
내용을 살펴보면 지루한 이야기, 형편없는 대본에 대한 불만이 나오네요. 부정적인 리뷰가 맞는 것 같습니다.
두 번째 리뷰는 감성 지수가 -1.5로 나왔습니다. 리뷰 원문 내용은 어떤지 한번 살펴볼까요?
swn_polarity_df['review'][1]
nasty, obscene 등의 표현이 사용되었네요. 부정적인 리뷰가 맞는 것 같습니다.
9번째 리뷰는 감성 지수가 4.5로, 긍정적인 리뷰인 걸로 확인됐는데요. 마찬가지로 원문의 내용을 살펴보겠습니다.
swn_polarity_df['review'][8]
well made, enjoyable 같은 긍정적인 표현이 담겨있네요. 감성 분석의 결과가 리뷰들의 긍정, 부정 정도를 잘 파악한 것으로 확인됩니다.
'Data Analysis > Natural Language Processing(NLP)' 카테고리의 다른 글
VADER (0) | 2023.07.05 |
---|---|
SentiWordnet 감성 분석 실습 (0) | 2023.07.05 |
감성 분석 적용 (0) | 2023.07.05 |
감성 지수 구하기 실습 (0) | 2023.07.05 |
SentiWordNet (0) | 2023.07.04 |