Skip to content

Latest commit

 

History

History

korean-analyzer-3.x

Folders and files

NameName
Last commit message
Last commit date

parent directory

..
 
 
 
 
 
 
 
 
 
 
 
 
Lucene Korean Analyzer

1. 루씬의 Analyzer를 활용한 한글 명사 추출 모듈입니다. 3.6.1 버전을 기반으로 개발 되어있습니다.

2. 키워드를 추출하는 방법은 크게 형태소분석과 사전기반의 키워드탐색으로 나누어집니다.

3. 형태소분석은 이수명님께서 개발하신 한글형태소분석 Analyzer를 3.6.1버전으로 변환하여 사용하고 있습니다.
(https://cafe.naver.com/korlucene)

4. 사전기반의 키워드탐색은 명사사전 (기본사전, 사용자정의 사전)을 사용하여, 들어온 문장을 탐색하여 명사를 찾아냅니다.

5. 그외 동의어필터, 스테머필터, 불용어필터등이 사전기반으로 작동하도록 되어있습니다.

6. 형태소 분석 테스트는 아래의 페이지에서 해보실 수 있습니다.

https://ec2-54-248-115-161.ap-northeast-1.compute.amazonaws.com:8080/crescent/morphMain.devys

더 자세한 사항은 Wiki페이지를 참고하여 주세요.