Skip to content

snghyun331/project-ReviewAnalysis

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

5 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

네이버 댓글 분석 대시보드 서비스 개발

작품소개

  • 네이버 뉴스, 네이버 스마트 스토어, 네이버 영화의 URL을 받아 해당 기사의 댓글, 쇼핑몰 후기, 영화 리뷰 정보를 분석하고 결과를 시각화하여 새로운 정보를 출력해 보여주는 웹 서비스
  • 뉴스, 영화, 쇼핑몰 분석 결과는 사용자의 니즈를 고려하여 각 성향에 맞도록 분석을 진행하여 결과를 보여줌
  • 실시간으로 댓글이 많은 기사 상위 5개를 출력하여 보여줌

작품 개발배경 및 필요성

  • 정보의 신뢰성 문제: 악의적 댓글 혹은 여론 조작 등 거짓 정보를 제공하는 댓글이 늘어남에 따라, 악의적 사용자의 댓글을 사전에 예방하여 올바른 정보를 취할 필요가 있음
  • 필요 정보 찾기의 어려움: 많은 양의 댓글 중 사용자가 자체적으로 선별하여 필요한 정보를 가진 갯글을 찾기가 쉽지 않음, 정보과다 사회에 있어 필요한 정보만을 추출하여 선별적으로 정보에 접근할 수 있음
  • 기존 분석 시스템의 한계: 평점을 중심으로 분석하는 기존의 분석 시스템으로 평점 자체의 신뢰성 문제가 생길 수 있음

작품 구성도(아키텍처)

그림7

작품 주요 기능

  • 유효 URL 확인 기능
  • 주요 뉴스 랭킹 기능
  • 크롤링을 통한 데이터 추출
    • 뉴스: 댓글 작성자의 성별, 나이별 분포, 작성된 댓글 내용, 작성 시간, 공감 수, 비공감 수, 대댓글 수를 가져옴
    • 쇼핑몰: 사용자 총 평점, 전체 리뷰 개수, 작성된 댓글 내용, 작성 시간, 토픽(주제), 토픽(주제)에 해당하는 댓글을 가져옴
    • 영화: 네티즌 평점, 성별/나이별 관람 추이와 만족도, 한줄 평, 감상 포인트, 작성된 댓글 내용, 작성 시간, 토픽(주제), 토픽(주제)에 해당하는 댓글을 가져옴
  • 다양한 EDA 분석
    • 크롤링한 댓글을 분석하여 논란 댓글 목록 생성, 재구매율(횟수), 각 토픽별 평점, 각 제품/옵션별 평점, 각 제품/옵션별 구매순위, 댓글 작성 시간 분포 그래프, 워드 클라우드 등의 Insight롤 얻음
  • LDA 모델을 통한 토픽 모델링
  • 딥러닝을 통한 감성분석
    • 총 300,000개의 텍스트 데이터셋을 이용하여 긍부정 분석 진행
    • 모델의 정확도는 약 0.827
  • 악성 댓글 필터링 기능
  • 데이터 시각화
    • 댓글의 주요 토픽을 분석하여 워드 클라우드 생성
    • 그래프 형태로 댓글 작성 시간 분포 보여줌

작품 결과

그림4 그림5 그림6

About

네이버 댓글분석 대시보드 개발 (은상)

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published