forked from takscape/cmecab-java
-
Notifications
You must be signed in to change notification settings - Fork 0
bearity/cmecab-java
Folders and files
Name | Name | Last commit message | Last commit date | |
---|---|---|---|---|
Repository files navigation
cmecab-java 1. これは何? 日本語形態素解析エンジンMeCab (https://mecab.sourceforge.net/) の Javaバインディングです。SWIGを用いず、直接MeCabのライブラリを 呼び出しています。 おまけとして、以下のものを含んでいます。 * TinySegmenter (https://chasen.org/~taku/software/TinySegmenter/) の Java移植版、及びそのTokenizer、TokenizerFactory 2. パッケージ構成 配布パッケージは、以下のディレクトリ構造を持ちます。 bin - ビルドされたJavaライブラリが書き出されるディレクトリ lib - ビルドおよびテストに必要なサードパーティライブラリが 格納されたディレクトリ src - Pure Javaライブラリのソースコードが格納されたディレクトリ test - テスト用データが格納されたディレクトリ etc - その他もろもろ(TinySegmenterのオリジナルソース等) 3. インストール方法 配布パッケージのルートディレクトリで、gradle buildを実行してください。 % gradle build ビルドが終了すると、build/libsディレクトリに、cmecab-java-(バージョン番号).jar という名前のJARファイルが作成されます。これをお好きな場所にコピーして、 Javaのクラスパスを通してください。 実行には、別途BridJ (https://github.com/nativelibs4java/BridJ) のjarを 入手し、クラスパスを通す必要があります。 また、事前に、MeCabのライブラリ(libmecab.dll, libmecab.soなど)に、 OSのパスを通しておく必要があります。 4. 利用方法 https://code.google.com/p/cmecab-java/wiki/HowToUse をご覧ください。 5. ライセンス cmecab-java本体はパブリックドメインとします。 ただし、TinySegmenter.java、TinySegmenterConstants.javaについては、 TinySegmenter (https://chasen.org/~taku/software/TinySegmenter/)の 二次的著作物であるため、オリジナルと同じく修正BSDライセンスに 従います。 なお、ビルドおよびテストのため、lib, etcディレクトリに以下のソフトウェアを 同梱しています。これらのソフトウェアは、それぞれのライセンスに従います。 * TinySegmenter * 修正BSDライセンス * lib/license/LICENSE-TinySegmenter.txtをご覧ください 6. 連絡先 MeCab、TinySegmenterに関するご質問は、それぞれのソフトウェアの メーリングリスト等へどうぞ。 cmecab-java自体に関するご質問等は、武田光平 [email protected] までどうぞ。
About
A Java binding for MeCab
Resources
Stars
Watchers
Forks
Packages 0
No packages published
Languages
- Java 99.3%
- JavaScript 0.7%