| LOVIT x DATA SCIENCE

주제별로 모은 포스트들입니다. 한 포스트가 여러 주제에 속하기도 합니다.

Machine learning algorithm

Classification

Sequential labeling

Clustering

Nearest neighbor search

Graph ranking, similarity, distance

Embedding for visualization

Attention mechanism

Attention mechanism in NLP. From seq2seq + attention to BERT

Natural Language Processing

Text data preprocessing

Word extraction, Tokenization, Part of speech tagging

Named Entity Recognition

Word Representation

Topic modeling

String distance

Data visualization

PyTorch

PyTorch 에서 L1 regularity 부여하기

Application: 띄어쓰기 오류 교정

Applications: Carblog

Carblog. Problem description

and more

Spark

0. Ubuntu 에 Spark 설치, IPython Notebook 의 외부접속 설정, PySpark 와 Notebook 연동