pytorch

[colab] konlpy mecab 설치 및 사용하기 on macOSX

알로호모라 2022. 9. 30. 11:50
반응형

 

한국어 자연어처리 모델을 찾다가 여러가지가 많이 있는 대표적인 konlpy를 발견 ! 

사용해보려고 했지만 설치하는 과정에서 에러가 많이 났다. 정확히는 설치는 잘 되는데 import에서 에러가 남ㅋ

처음에는 터미널에서 해야하나 터미널로 설치하고 했다가 그건 아닌 것 같고 colab에서 모두 설치하고 사용할 수 있었다. 

 

 

1. bash 셸로 필요한 라이브러리들 설치 

- colab에 아래 복사 붙여넣기 및 실행 

%%bash
apt-get update
apt-get install g++ openjdk-8-jdk python-dev python3-dev
pip3 install JPype1
pip3 install konlpy

 

 

2. JAVA_HOME 환경변수 설정

https://blckchainetc.tistory.com/entry/JAVAHOME-%ED%99%98%EA%B2%BD%EB%B3%80%EC%88%98-%EC%84%A4%EC%A0%95-on-%EB%A7%A5%EB%B6%81-Mac-Os-X

 

JAVA_HOME 환경변수 설정 on 맥북 Mac Os X

JDK 설치 후 JAVA HOME 환경변수 설정 방법 1. 내가 쓰고 있는 shell이 무엇인지 알기 ( bash / zsh ) echo $SHELL 2. JAVA_HOME 변수에 값 넣어 해당 파일로 넣기 bash 의 경우 echo export "JAVA_HOME=\$(/usr/..

blckchainetc.tistory.com

 

 

 

3. mecab 설치 (소요 시간 : 약 5분 이내)

%%bash
bash <(curl -s https://raw.githubusercontent.com/konlpy/konlpy/master/scripts/mecab.sh)
pip3 install /tmp/mecab-python-0.996

 

 

4. konlpy 가져와서 사용해보기 

import konlpy
from konlpy.tag import Mecab
mecab = Mecab()
sentence = "드디어 oknlpy가 다운되었다.!!!!"
temp = mecab.morphs(sentence)
temp
['드디어', 'oknlpy', '가', '다운', '되', '었', '다', '.', '!!!!']

이렇게 형태소 분석이 되었다 ! 

 

반응형