Symfoware

Symfowareについての考察blog

係り受け解析機「CaboCha」をFreeBSD 10.1にインストールする

係り受け解析機「CaboCha」

CaboCha/南瓜: Yet Another Japanese Dependency Structure Analyzer

この記事で知りました。
せっかくだから俺は衆院選挙のツイートを調べるぜ
CaboChaで始める係り受け解析

面白そうなので、FreeBSD 10.1にインストールしてみます。


portsを最新化



必要なミドルウエアはportsからインストールします。
まずはportsを最新化。


# portsnap fetch
# portsnap extract






Mecab、ipdicのインストール



Mecab、ipdicをportsからインストールします。


まずMecab。


# cd /usr/ports/japanese/mecab
# make



途中の選択肢は全てデフォルトのまま進みました。

619_01.png

619_02.png

619_03.png

619_04.png

makeが終わったらinstall。


# make install





続いてipdic。


# cd /usr/ports/japanese/mecab-ipadic
# make



辞書はUTF-8を選択を選択します。

619_05.png

makeが終わったらinstall。


# make install




一応、mecabの動作を確認しておきます。

619_06.png

良いようです。





CRF++のインストール



CRF++ (0.55以降)が必要とこのと。
pkg searchしてみると、どうも0.54までしか準備されていないようです。
portsも同様でした。


# pkg search crf
crf++-0.54_1
ocrfeeder-0.8.1




ソースからインストールすることにします。
CRF++: Yet Another CRF toolkit

DownloadのSourceにあるHTTPのリンクをクリック。

619_07.png


CRF++-0.58.tar.gzを選択。

619_08.png


上のDownloadをクリックして、CRF++-0.58.tar.gzを取得します。

619_09.png


CRF++-0.58.tar.gzを/usr/srcにコピー。
以降、作業は/usr/srcで行いました。

ファイルを解凍して移動。


# tar zxf CRF++-0.58.tar.gz
# cd CRF++-0.58




configure、make、make installの順に実行。


# ./configure
# make
# make install




これでCRF++のインストールは完了です。




CaboChaのインストール



いよいよCaboCha本体のインストールです。

http://taku910.github.io/cabocha/
こちらからダウンロードします。

619_10.png

619_11.png

619_12.png

「Download anyway」をクリック。

619_13.png


cabocha-0.69.tar.bz2をダウンロードしたら、/usr/srcにコピーします。
解凍してフォルダに移動。


# tar zxf cabocha-0.69.tar.bz2
# cd cabocha-0.69




configure、makeと進めるとここでエラーになりました。


# ./configure
# make
make all-recursive
Making all in src
/bin/sh ../libtool --tag=CXX --mode=compile c++ -DHAVE_CONFIG_H -I. -I.. -DCABOCHA_DEFAULT_POSSET="\"IPA"\" -DCABOCHA_DEFAULT_CHARSET="\"EUC-JP"\" -DMODEL_VERSION=102 -DCABOCHA_DEFAULT_RC="\"/usr/local/etc/cabocharc\"" -O3 -Wno-deprecated -Wall -c -o chunk_learner.lo chunk_learner.cpp
libtool: compile: c++ -DHAVE_CONFIG_H -I. -I.. -DCABOCHA_DEFAULT_POSSET=\"IPA\" -DCABOCHA_DEFAULT_CHARSET=\"EUC-JP\" -DMODEL_VERSION=102 -DCABOCHA_DEFAULT_RC=\"/usr/local/etc/cabocharc\" -O3 -Wno-deprecated -Wall -c chunk_learner.cpp -fPIC -DPIC -o .libs/chunk_learner.o
chunk_learner.cpp:6:10: fatal error: 'crfpp.h' file not found
#include <crfpp.h>



619_14.png


crfpp.hが見つからないエラー
なんでだ。

How do I specify LDFLAGS and CPPFLAGS for ./configure?

こちらを参考に、環境変数にヘッダーファイルのパスを仕込めとのこと。

mecabやcrfppのヘッダファイルは/usr/local/includeに存在するので
このパスを指定すればOKです。

Linux系だと

export CPPFLAGS=-I/usr/local/include



freebsdだと

setenv CPPFLAGS -I/usr/local/include



を実行してmakeします。

一旦cleanして、Makefileを再作成。
おまけで、utf-8オプションを付けておきます。


# setenv CPPFLAGS -I/usr/local/include
# make clean
# ./configure --with-charset=utf8 --enable-utf8-only
# make
# make install



これでインストール完了です。



使ってみる



動作確認です。


# cabocha
iconv_open is not supported
太郎は花子が読んでいる本を次郎に渡した
    太郎は---------D
     花子が-D     |
    読んでいる-D |
            本を---D
            次郎に-D
             渡した
EOS



619_15.png

動いてくれました。




関連記事

テーマ:プログラミング - ジャンル:コンピュータ

  1. 2015/06/18(木) 23:13:08|
  2. 備忘録
  3. | トラックバック:0
  4. | コメント:0
  5. | 編集
<<Pythonから係り受け解析機「CaboCha」を使用する | ホーム | Visual Studio regionで閉じられたコードをデフォルトで展開状態にする>>

コメント

コメントの投稿


管理者にだけ表示を許可する

トラックバック

トラックバック URL
http://symfoware.blog68.fc2.com/tb.php/1729-d29b4cc0
この記事にトラックバックする(FC2ブログユーザー)