AI Platform notebookにmecab-ipadic-NEologdを入れた話
mecab-ipadic-NEologdの公式githubのUbuntuの場合を参考に、必要ツールを入手。
python上で使いたかったので、mecab-python(MeCabモジュール)をpipで入れようとしたら、以下のエラーが。。。
$ pip install mecab-python Collecting mecab-python Using cached mecab-python-0.996.tar.gz (40 kB) ERROR: Command errored out with exit status 1: command: /opt/conda/bin/python3.7 -c 'import sys, setuptools, tokenize; sys.argv[0] = '"'"'/tmp/pip-install-izvssij1/mecab-python/setup.py'"'"'; … ・ ・ Traceback (most recent call last): File "<string>", line 1, in <module> File "/tmp/pip-install-izvssij1/mecab-python/setup.py", line 18, in <module> include_dirs=cmd2("mecab-config --inc-dir"), File "/tmp/pip-install-izvssij1/mecab-python/setup.py", line 10, in cmd2 return string.split (cmd1(str)) AttributeError: module 'string' has no attribute 'split'
調べると、mecab-pythonのsetupツールがpython3に対応してないらしく、リンク先のページ通りにmecab-pythonのビルドツールをダウンロードし、setup.pyを書き換え、ビルドしたら通った。
また、MeCabモジュール上で、NEologd辞書を指定するために、
$ echo `mecab-config --dicdir`"/mecab-ipadic-neologd"
で辞書のパスを調べ、pythonコードで、
import Mecab mecab = MeCab.Tagger('-d NEologd辞書へのパス’) res = mecab.parse(‘解析したい文章’)
とするらしい。