Symfoware

Symfowareについての考察blog

日本語形態素解析システム JUMANをDebian 8にapt-getでインストールする

日本語形態素解析システム JUMAN
http://nlp.ist.i.kyoto-u.ac.jp/?JUMAN

調べてみると、Debianのパッケージが用意されていました。
パッケージ: juman

インストールして動かしてみます。

※jumanの後継juman++
http://nlp.ist.i.kyoto-u.ac.jp/index.php?JUMAN++
はパッケージが用意されていないようでした。
こちらのインストールは、後日試してみようと思います。



jumanのインストール



Debian 8.8でインストールを試してみます。
apt-cache searchしてみると、こんな候補が表示されました。


# apt-cache search juman
libjuman-dev - Header files of JUMAN
libjuman-perl - Perl binding of JUMAN
libjuman4 - Library of JUMAN
mecab-jumandic - Juman dictionary compiled for Mecab
mecab-jumandic-utf8 - Juman dictionary encoded in UTF-8 compiled for Mecab
juman - 日本語形態素解析システム
juman-dic - テキストフォーマットによる JUMAN 辞書
mecab-utils - Mecab のサポートプログラム




jumanをインストール


# apt-get install juman




あっさりインストール完了です。
バージョン7.0がインストールできました。


# juman -v
juman 7.0








形態素解析



jumanコマンドを実行すると、入力の待受状態になります。


# juman
(入力まち)




解析したい日本語を入力してエンターキーを押下。
おきまりの「すももも」をやってみます。


# juman
すもももももももものうち(enter)




解析結果が表示されました。


# juman
すもももももももものうち
すもも すもも すもも 名詞 6 普通名詞 1 * 0 * 0 "自動獲得:テキスト"
も も も 助詞 9 副助詞 2 * 0 * 0 NIL
@ も も も 助詞 9 接続助詞 3 * 0 * 0 NIL
もも もも もも 名詞 6 普通名詞 1 * 0 * 0 "代表表記:桃/もも 漢字読み:訓 カテゴリ:植物;人工物-食べ物 ドメイン:料理・食事"
@ もも もも もも 名詞 6 普通名詞 1 * 0 * 0 "代表表記:股/もも カテゴリ:動物-部位"
も も も 助詞 9 副助詞 2 * 0 * 0 NIL
@ も も も 助詞 9 接続助詞 3 * 0 * 0 NIL
もも もも もも 名詞 6 普通名詞 1 * 0 * 0 "代表表記:桃/もも 漢字読み:訓 カテゴリ:植物;人工物-食べ物 ドメイン:料理・食事"
@ もも もも もも 名詞 6 普通名詞 1 * 0 * 0 "代表表記:股/もも カテゴリ:動物-部位"
の の の 助詞 9 接続助詞 3 * 0 * 0 NIL
うち うち うち 名詞 6 副詞的名詞 9 * 0 * 0 "代表表記:うち/うち"
EOS



次はプログラムから解析の実行と結果の取得を試してみます。



関連記事

テーマ:サーバ - ジャンル:コンピュータ

  1. 2017/06/13(火) 22:20:29|
  2. 備忘録
  3. | トラックバック:0
  4. | コメント:0
  5. | 編集
<<jumanをサーバーモードで起動し、Pythonから接続する | ホーム | Falcon 「Access-Control-Allow-Origin」の回避方法>>

コメント

コメントの投稿


管理者にだけ表示を許可する

トラックバック

トラックバック URL
http://symfoware.blog68.fc2.com/tb.php/1992-7480684a
この記事にトラックバックする(FC2ブログユーザー)