06 | Natural Language Processing

강의 소개

자연어처리는 컴퓨터를 위한 언어가 아닌 인간의 언어를 컴퓨터를 통해 이해하고 처리하고자 하는 인공지능의 주요 분야 중 하나입니다. 최근 딥러닝 기술의 발전과 더불어 자연어 처리 또한 기존의 단순한 단어 검출 수준을 뛰어넘어 문맥을 이해하고 사람과 간단한 대화를 주고받을 수 있는 수준으로 발전하였습니다. 본 과정에서는 Python을 활용하여 기계학습 기반의 자연어처리 분석 방법과 이미 학습된 딥러닝 모델을 활용한 고급 분석 방법을 학습 및 실습하고자 합니다.

강의 시간 및 장소

11월 13일 (오후 3:00 ~ 6:00)
온라인 강의: 줌링크는 수강신청한 이메일로 발송 예정

강의 내용 및 자료

Session Description Time
Session 1 NLP 기초: 형태소 분석기를 활용하여 wordcloud 만들기
  • 기초 자연어처리 방법론 학습
  • 형태소분석기 설치 및 활용
  • 데이터를 형태소분석기를 통해 처리
  • Wordcloud tool을 활용하여 결과 시각화
오후 3:00 ~ 4:00
Session 2 NLP 심화: TF-IDF를 활용한 문서 검색, Word2Vec을 활용한 유사 단어 검색
  • 기계학습 기반 자연어처리 방법론 학습
  • TF-IDF의 개념 및 동작 원리 학습
  • 형태소분석 + TF-IDF 를 활용하여 문서 검색
  • Word2Vec 의 개념 및 동작 원리 학습
  • 형태소분석 + Word2Vec을 활용하여 단어 유사성 학습
오후 4:00 ~ 5:00
Session 2 NLP 딥러닝: BERT를 활용한 감정 분석
  • 딥러닝 기반 자연어처리 방법론 학습
  • 네이버 영화 리뷰 감성 데이터셋(NSMC) 탐색
  • BERT 모델 설치 및 감정 분석 실습
오후 5:00 ~ 6:00

강의자료: 강의 슬라이드

사전 준비물

  • 본 강의는 Google Colab을 이용하여 진행됩니다. 본인의 컴퓨터에 파이썬을 설치할 필요는 없습니다. 기본적인 Google Colab에 대해 학습하고 싶다면 다음의 주소를 방문해 주세요. https://colab.research.google.com/
  • Google Colab의 기본 설정은 다음의 링크를 참고하세요. "환경 세팅" 부분만 따라서 기본적인 세팅을 마치면 바로 파이썬을 쓸수 있습니다. https://theorydb.github.io/dev/2019/08/23/dev-ml-colab/

강의 등록

본 강의를 수강하기 위해서는 수강신청을 해야 합니다. 아래의 주소를 방문하여 수강신청 양식을 작성해주세요.
>   수강신청 링크




강사 소개

박기범
서울대학교 융합과학기술대학교의 HCC Lab에서 박사과정중에 있습니다. 주로 전산화된 데이터를 분석하거나 수집하는 시스템에 대한 연구를 수행하고 있습니다.




질문 및 토론