[자연어처리] 댓글 데이터 전처리 (1)
·
캡스톤/자연어처리
참고로 여기서 사용되는 댓글 데이터 엑셀 파일은 '[자연어처리] 댓글 데이터 엑셀에 저장하기' 에서 가져온 파일인데, 여기다가 직접 라벨링을 한 것입니다.(label = 0 (부정), label = 1 (긍정)) 1.  데이터 추출 import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport refrom tqdm import tqdmfrom tensorflow.keras.preprocessing.text import Tokenizerfrom tensorflow.keras.preprocessing.sequence import pad_sequences 일단 필요한 라이브러리 임포트 합시다. 그리고 댓글이 담긴 엑셀 파일을 업로드 한다...
[자연어처리] 댓글 데이터 엑셀에 저장하기
·
캡스톤/자연어처리
앞의 [자연어처리] 유튜브 API 를 사용해 영상 댓글 데이터 가져오기 를 이어서 하면 됩니다. 1. 엑셀 저장 라이브러리 Import from openpyxl import Workbook  2. 엑셀 테이블 생성 # 엑셀에 테이블 시트 생성wb = Workbook(write_only=True)ws = wb.create_sheet()  3. 데이터프레임에서 댓글 데이터 가져오기 pd_data = {"댓글 내용" : adf['Comments']}  4. 엑셀에 저장할 데이터프레임 생성 youtube_pd = pd.DataFrame(pd_data)  5. 엑셀 파일 저장 # 엑셀 파일 바탕화면에 저장youtube_pd.to_excel('/Users/leehyungseok/Desktop/%s.xlsx'%(Id..
[자연어처리] 유튜브 API 를 사용해 영상 댓글 데이터 가져오기
·
캡스톤/자연어처리
1. 유튜브 API를 사용하기 위한 라이브러리 Import from googleapiclient.discovery import buildfrom googleapiclient.errors import HttpErrorfrom oauth2client.tools import argparserimport pandas as pd  2. 개인 API 정보 입력 DEVELOPER_KEY = "유튜브 API 키 값"YOUTUBE_API_SERVICE_NAME = "youtube"YOUTUBE_API_VERSION = "v3"  3. Build 객체 생성 youtube = build(YOUTUBE_API_SERVICE_NAME, YOUTUBE_API_VERSION,developerKey=DEVELOPER_KEY) # B..
[캡스톤] 백엔드 구조
·
캡스톤
Docker에 우리가 만든 Django 컨테이너 올리고, DB 컨테이너 올리고, 우리가 만든 자연어 처리(크롤링, 감성분석, 토픽모델링 등) 컨테이너 올리고.. 가능했으면 좋겠다..
[Django] 미리보기 기능 구현
·
캡스톤/Django
1. 포스트 출력 글자 수 제한하기  우리가 포스트 목록 페이지에서 포스트를 보면 포스트 내용이 길 경우 저렇게 모든 텍스트가 나온다. 장고에서는 이런 점을 해결하기 위해 truncatewords 나 truncatechars 를 사용한다. 포스트 목록 페이지의 포스트 내용 글자 수를 제한해주는 거니까 당연히 blog/templates/blog/post_list.html 을 수정해한다. (...생략){% endif %} {{ p.title }} {{ p.content | truncatewords:45 }} Read More →(...생략)    음 45글자 출력되고 남은 포스트 내용은 ...으로 잘 출력된다.  2. 요약문 필드 다음은 포스트의 요약문을 보여주는 hook_text..
[Django] 템플릿에서 if 문 적용하기
·
캡스톤/Django
1. HTML 에서 if 문 으로 헤드 이미지 적용하기 일단 헤드 이미지가 없을 때에도 정상적으로 포스트 목록 페이지가 나오게하기 위해서 blog/templates/blog/post_list.html 을 수정하자. (...생략)Blog{% for p in post_list %} {% if p.head_image %} 태그에서 alt 는 이미지를 보여줄 수 없을 때 이미지 대신 나타나는 텍스트를 의미 --> {% endif %} (...생략)   정상적으로 포스트 목록 페이지가 출력된다. 다음은 만약 헤드 이미지가 없으면 허전하니까 임의의 이미지를 보여주도록 lorem picsum 을 써보자. blog/templates/blog/post_list.html 수정합시다. (...생략)..