py-hanspell은 파이썬으로 한국어 자연어 처리를 할 때 사용하는 라이브러리입니다. 네이버 맞춤법 검사기를 이용해 주어진 한글 데이터의 맞춤법과 띄어쓰기를 교정하는 기능을 제공해 주는데요.
주피터 노트북에서 작업을 하고 있다면 아래 코드를 써서 바로 py-hanspell을 설치할 수 있습니다.
!pip install py-hanspell
하지만, 경우에 따라 위의 명령어로 설치가 안되는 경우도 있습니다. 그럴 경우에는 아래 방법을 따라해 주세요.
py-hanspell 수동 설치하기
먼저, py-hanspell의 코드가 있는 GitHub으로 이동하겠습니다.
- py-hanspell Github 바로가기
접속하면 이런 화면이 나오는데요.
우측 상단에 있는 'Code' 버튼을 클릭하면 나오는 드롭다운 메뉴에서 Download Zip을 통해 파일을 수동으로 다운로드합니다.
수동 다운로드를 하면 py-hanspell-master.zip이라는 파일이 저장되는데요. 해당 파일을 원하는 작업 디렉토리로 옮긴 다음에 압축을 풀어 줄게요.
이제, py-hanspell-master 폴더가 위치한 example 폴더에 주피터 노트북 파일을 생성하고, 해당 프로젝트에서 py-hanspell을 직접 사용해 보겠습니다.
주피터 노트북에서 py-hanspell을 설치하고 실행하기 위해선 아래 명령을 실행해야 합니다.
cd py-hanspell-master
!python setup.py install
설치하면 긴 Warning 메시지가 나오는데요. 괜찮습니다. 일단 여기까지 했으면 py-hanspell을 사용할 준비가 다 됐습니다.
py-hanspell 사용해보기
한번 라이브러리가 잘 불러와지는지 확인해 보겠습니다. hanspell에 있는 spell_checker를 불러와서 띄어쓰기가 틀린 한국어 문장을 교정해 볼게요.
from hanspell import spell_checker
text = "아버지가방에들어가신다나는오늘코딩을했다"
hanspell_sent = spell_checker.check(text)
print(hanspell_sent.checked)
띄어쓰기가 잘 교정됐네요. 이제 py-hanspell을 이용해 원하는 텍스트 데이터의 맞춤법과 띄어쓰기를 쉽게 교정할 수 있게 됐습니다.
'Data Analysis > Natural Language Processing(NLP)' 카테고리의 다른 글
KoNLPy 설치하기(M1) (0) | 2023.07.05 |
---|---|
형태소 분석 (0) | 2023.07.05 |
띄어쓰기 교정 (0) | 2023.07.05 |
VADER 감성 분석 실습 (0) | 2023.07.05 |
VADER (0) | 2023.07.05 |