나만의 BERT Wordpiece Vocab 만들기
2020-04-27
BERT와 ELECTRA에 사용되는 Wordpiece 방식의 한국어 Vocab을 직접 만드는 방법. Sentencepiece, Mecab과의 차이점과 Huggingface Tokenizers 라이브러리 활용법을 설명합니다.
572 words
|
3 minutes
TPU를 이용하여 Electra Pretraining하기
2020-04-20
GCP에서 TPU를 이용하여 ELECTRA 모델을 Pretraining하는 방법. TFRC 신청부터 VM 세팅, TPU 연결, Pretraining 실행까지의 전체 과정을 다룹니다.
425 words
|
2 minutes