Research

Macに形態素解析ツールMeCabのインストール

Mac(10.4 Tiger)に形態素解析ツールMeCabをインストールする

mevab1.png

最新バージョン0.97だとエラー吐くようなので0.96でインストール

mecab0.png

すんなり入る

$ cd mecab-0.96
$ ./configure
$ make
$ make check
$ sudo make install

続いてMeCab 用の辞書(IPA辞書)のインストール

mecab4.png

文字コードをUTF8に指定

$ cd mecab-ipadic-2.7.0-20070801
$ ./configure --with-charset=utf8
$ make
$ sudo make install

ここまでで形態素解析ができる
仮名とカタカナと英語が混じった文章を形態素解析してみる

$ mecab
私はNewYorkに住む青山テルマです。
私 名詞,代名詞,一般,*,*,*,私,ワタシ,ワタシ
は 助詞,係助詞,*,*,*,*,は,ハ,ワ
NewYork 名詞,一般,*,*,*,*,*
に 助詞,格助詞,一般,*,*,*,に,ニ,ニ
住む 動詞,自立,*,*,五段・マ行,基本形,住む,スム,スム
青山 名詞,固有名詞,地域,一般,*,*,青山,アオヤマ,アオヤマ
テルマ 名詞,一般,*,*,*,*,*
です 助動詞,*,*,*,特殊・デス,基本形,です,デス,デス
。 記号,句点,*,*,*,*,。,。,。
EOS

オモロいw
続いてPythonでMeCabが使えるようにmecab-pythonをインストール

mecab5.png

ビルドしてインストール

$ cd mecab-python-0.97
$ python setup.py build
$ sudo python setup.py install

※ここでコケた…
~/.pydistutils.cfgにpythonのsite-packagesのパスが書いてあり、その先には
インストールするためのヘッダーファイルがあるのだが存在せずエラーを吐いてた
消してやったらうまくインストールできた

$ rm ~/.pydistutils.cfg

最後にPythonでMeCabを動かせるか確認

$ python
>>> import sys
>>> import MeCab
>>> m = MeCab.Tagger ("-Ochasen")
>>> print m.parse ("すもももももももものうち")
すもも スモモ すもも 名詞-一般
も モ も 助詞-係助詞
もも モモ もも 名詞-一般
も モ も 助詞-係助詞
もも モモ もも 名詞-一般
の ノ の 助詞-連体化
うち ウチ うち 名詞-非自立-副詞可能
EOS

できたw

関連記事

  1. タホ湖とギャラ
  2. Flashストリーミングサーバ
  3. Renoを去る
  4. 研究ポスタ−完成
  5. 広告会社のプランナーに必須の5つのインプット方法
  6. mixiページ ランキング&トレンド
  7. ソーシャルウェアのMTG面白い
  8. 日本機械学会 第20回計算力学講演会

Profile

 

千田 智治
Tomoharu Senda

 

広告会社 勤務
ストプラ・デジタル

 

三児のパパ

My Social Media Account

  1. Facebook
  2. Instagram
  3. Twitter
  4. Booklog
  5. RSS

最新記事

PAGE TOP