記事一覧表示

AI Platform notebookにmecab-ipadic-NEologdを入れた話

mecab-ipadic-NEologdの公式githubUbuntuの場合を参考に、必要ツールを入手。
 
python上で使いたかったので、mecab-pythonMeCabモジュール)をpipで入れようとしたら、以下のエラーが。。。

$ pip install mecab-python
Collecting mecab-python
  Using cached mecab-python-0.996.tar.gz (40 kB)
    ERROR: Command errored out with exit status 1:
     command: /opt/conda/bin/python3.7 -c 'import sys, setuptools, tokenize; sys.argv[0] = '"'"'/tmp/pip-install-izvssij1/mecab-python/setup.py'"'"'; …
         ・
         ・
    Traceback (most recent call last):
      File "<string>", line 1, in <module>
      File "/tmp/pip-install-izvssij1/mecab-python/setup.py", line 18, in <module>
        include_dirs=cmd2("mecab-config --inc-dir"),
      File "/tmp/pip-install-izvssij1/mecab-python/setup.py", line 10, in cmd2
        return string.split (cmd1(str))
    AttributeError: module 'string' has no attribute 'split'

調べると、mecab-pythonのsetupツールがpython3に対応してないらしく、リンク先のページ通りにmecab-pythonのビルドツールをダウンロードし、setup.pyを書き換え、ビルドしたら通った。
また、MeCabモジュール上で、NEologd辞書を指定するために、

$ echo `mecab-config --dicdir`"/mecab-ipadic-neologd"

で辞書のパスを調べ、pythonコードで、

import Mecab

mecab = MeCab.Tagger('-d NEologd辞書へのパス’)
res = mecab.parse(‘解析したい文章’)

とするらしい。