
[자연어처리] 댓글 데이터 전처리 (1)
·
캡스톤/자연어처리
참고로 여기서 사용되는 댓글 데이터 엑셀 파일은 '[자연어처리] 댓글 데이터 엑셀에 저장하기' 에서 가져온 파일인데, 여기다가 직접 라벨링을 한 것입니다.(label = 0 (부정), label = 1 (긍정)) 1. 데이터 추출 import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport refrom tqdm import tqdmfrom tensorflow.keras.preprocessing.text import Tokenizerfrom tensorflow.keras.preprocessing.sequence import pad_sequences 일단 필요한 라이브러리 임포트 합시다. 그리고 댓글이 담긴 엑셀 파일을 업로드 한다...