본문 바로가기

임베딩2

[E-7] 나랑 닮은 연예인은 누구? Opening 이번 시간에 임베딩에 대한 기본 개념을 제대로 익혀봅시다. [답변 예시] 임베딩이란: 자연어 처리(Natural Language Processing) 분야에서 임베딩(Embedding)은 사람이 쓰는 자연어를 기계가 이해할 수 있는 숫자 형태인 vector로 바꾼 결과 혹은 그 일련의 과정 전체를 의미합니다. 임베딩의 역할? 단어/문장 간 관련도 계산 : 단어-문서 행렬은 가장 단순한 형태의 임베딩입니다. 현업에서는 이보다 복잡한 형태의 임베딩을 사용합니다. 대표적인 임베딩 기법은 Word2Vec을 뽑을 수 있습니다. 이렇듯 컴퓨터가 계산하기 쉽도록 단어를 전체 단어들 간의 관계에 맞춰 해당 단어의 특성을 갖는 벡터로 바꾸면 단어들 사이의 유사도를 계산하는 일이 가능해집니다. 자연어 상태 .. 2021. 1. 25.
[E-4] 영화 리뷰 텍스트 감성 분석하기 Opening 지난 시간에는 이미지 데이터를 다루어 보았는데요. 오늘은 텍스트 데이터를 다루어 볼 것입니다. 다른 데이터도 마찬가지이겠지만 텍스트 데이터는 전처리 과정이 조금은 복잡하고 여러울 수 있습니다. 모델이 학습할 수 있는 형태로 바꾸어 주는 전처리 과정을 이번 노드를 통해서 익숙해지셨으면 좋겠습니다. Encoder 와 Decoder란 무엇일까요? 텍스트 데이터에서는 어떻게 이 용어가 사용될까요?? 텍스트 데이터를 처리할 때 패딩이 무엇일까요? 왜 필요할까요? 소비자의 감성 분석을 응용할 수 있는 분야에는 어떤 것이 있을까요? 상품 후기 분석을 통한 상품 개선 신규 상품 기획을 위한 상품 카테고리별 고객 정서 파악 경쟁사 대비 브랜드 정성 지수 모니터링 등 Check-up 항목 학습 노드에 Con.. 2021. 1. 13.