HAYOUNG'S MEMO
파이썬 KoNLPy 패키지 사용 방법 본문
파이썬 KoNLPy 패키지 사용 방법
KoNLPy는 형태소 분석기를 하나로 모은 패키지입니다.
패키지 안에는 Kkma, Twitter, Mecab 등과 같은 클래스가 들어가 있습니다.
이 게시글에서 클래스 간의 성능 비교 결과치 및 사용 방법에 대해서 설명드리겠습니다.
Konlpy 패키지 설치 : 파이썬 형태소 분석 KoNLPy 및 Word2Vec Gensim 설치
konlpy 문서에 따르면 클래스 간의 성능은 아래와 같습니다.
출처 : http://konlpy.org/ko/v0.4.3/morph/
사전 로딩시간
클래스 pos 메소드 실행 시간
성능을 보시자면 Mecab이 우수하고 그 다음은 Twitter가 괜찮다는는 것을 아실 수 있습니다.
시간적인 성능면 뿐만 아니라 각 문장을 어떻게 태그 하는지도 아래 예제에서 살펴보실 수 있습니다.
아버지가방에들어가신다
형태소 분석기 중에서 제일 효율이 괜찮은 것은 Mecab 입니다. 하지만 Mecab 같은 경우 윈도우 7을 지원하지 않을 뿐만 아니라 윈도우 10에서는 빌드 등의 과정을 거쳐야만 사용할 수 있습니다. 이런 과정들이 귀찮으신 분들은 Twitter를 쓰시기 바라며, 우분투나 MacOS를 쓰시는 분들은 Mecab을 쓰시면 됩니다. 참고로 우분투나 MacOS에서도 Mecab을 쓰려면 Mecab-python 등의 설치 등이 필요로 합니다 …
– 필자는 이런 과정들이 번거러워 Twitter 클래스를 이용했습니다.
“히라마블로그에온걸환영해!”를 태깅할 경우
위와 같은 결과물이 나오게 됩니다.
더 자세한 사용법은 http://konlpy.org/en/latest/ 를 참고하시기 바랍니다.
'자연어처리' 카테고리의 다른 글
scikit-learn 패키지 (0) | 2019.01.29 |
---|---|
pandas 패키지의 dataframe 인덱싱(열/행/boolean 인덱싱), .iloc, .loc (0) | 2019.01.29 |
Label Encoding and One Hot Encoding (0) | 2019.01.29 |
형태소 분석기 성능 비고 (0) | 2019.01.23 |
파이썬의 문자열 인코딩 (0) | 2019.01.22 |