Skip to content

nisin/termextract-java

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

15 Commits
 
 
 
 
 
 
 
 

Repository files navigation

termextract-java

TermExtract はテキストデータから、専門用語を取り出すためのjavaモジュ ールである。

Perl であったもとのモジュールのアイディアを俺俺でjavaで実現したもの。

文章中から重要と思われる複合語含む単語を自動抽出します。 詳しい仕組みや理論は以下の元ネタ「言選Web」を参照してください。

私もコードポーティング中に何をやってるのかずいぶんと理解が進みましたが、 非常に愉しい時間でありました。

あくまで俺俺ポートですので、こちらのモジュールに対するお問い合わせは 元ネタサイトへはお控えくださいね。

使用方法も https://gensen.dl.itc.u-tokyo.ac.jp/termextract.html に準拠しているはず、、、 時間が作れたら、こちらに記述できるかも知れません。

SPECIAL THANKS

「言選Web」 https://gensen.dl.itc.u-tokyo.ac.jp/ https://gensen.dl.itc.u-tokyo.ac.jp/termextract.html

COPYRIGHT

このプログラムは、東京大学・中川裕志教授、横浜国立大学・森辰則助教授が 作成した「専門用語自動抽出システム」のExtract.pm を参考に、中川教授の 教示を受け、東京大学・前田朗([email protected])がコーディングし直した 東京大学情報基盤センターの「言選Web」上で公開されているTermExtract.pmを リスペクトした、nisin.lib <[email protected]> がjavaで開発したものである。

このモジュールは全く私[nisin.lib]の一存で公開するし、精度品質その他いっさいは あるがままの提供とし、本プログラムの使用において生じたいかなる結果 に関しても当方では一切責任を負わない。

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published