Skip to content

bearity/cmecab-java

 
 

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

cmecab-java

1. これは何?

日本語形態素解析エンジンMeCab (https://mecab.sourceforge.net/) の
Javaバインディングです。SWIGを用いず、直接MeCabのライブラリを
呼び出しています。

おまけとして、以下のものを含んでいます。
 * TinySegmenter (https://chasen.org/~taku/software/TinySegmenter/) の
   Java移植版、及びそのTokenizer、TokenizerFactory


2. パッケージ構成

配布パッケージは、以下のディレクトリ構造を持ちます。

bin  - ビルドされたJavaライブラリが書き出されるディレクトリ
lib  - ビルドおよびテストに必要なサードパーティライブラリが
      格納されたディレクトリ
src  - Pure Javaライブラリのソースコードが格納されたディレクトリ
test - テスト用データが格納されたディレクトリ
etc  - その他もろもろ(TinySegmenterのオリジナルソース等)


3. インストール方法

配布パッケージのルートディレクトリで、gradle buildを実行してください。

% gradle build

ビルドが終了すると、build/libsディレクトリに、cmecab-java-(バージョン番号).jar
という名前のJARファイルが作成されます。これをお好きな場所にコピーして、
Javaのクラスパスを通してください。

実行には、別途BridJ (https://github.com/nativelibs4java/BridJ) のjarを
入手し、クラスパスを通す必要があります。
また、事前に、MeCabのライブラリ(libmecab.dll, libmecab.soなど)に、
OSのパスを通しておく必要があります。


4. 利用方法
https://code.google.com/p/cmecab-java/wiki/HowToUse
をご覧ください。


5. ライセンス

cmecab-java本体はパブリックドメインとします。

ただし、TinySegmenter.java、TinySegmenterConstants.javaについては、
TinySegmenter (https://chasen.org/~taku/software/TinySegmenter/)の
二次的著作物であるため、オリジナルと同じく修正BSDライセンスに
従います。

なお、ビルドおよびテストのため、lib, etcディレクトリに以下のソフトウェアを
同梱しています。これらのソフトウェアは、それぞれのライセンスに従います。

* TinySegmenter
   * 修正BSDライセンス
   * lib/license/LICENSE-TinySegmenter.txtをご覧ください

6. 連絡先

MeCab、TinySegmenterに関するご質問は、それぞれのソフトウェアの
メーリングリスト等へどうぞ。

cmecab-java自体に関するご質問等は、武田光平 [email protected] までどうぞ。

About

A Java binding for MeCab

Resources

Stars

Watchers

Forks

Packages

No packages published

Languages

  • Java 99.3%
  • JavaScript 0.7%