GitHub

Lucene学习

lucene 索引创建及检索部分

一、创建索引

1、存储数字

doc.add(new NumericField("attach",Field.Store.YES,true).setIntValue(attachs[i]));

2、存储日期

doc.add(new NumericField("date",Field.Store.YES,true).setLongValue(dates[i].getTime()));

3、普通类型

doc.add(new Field("id",ids[i],Field.Store.YES,Field.Index.NOT_ANALYZED_NO_NORMS));
doc.add(new Field("email",emails[i],Field.Store.YES,Field.Index.NOT_ANALYZED));
doc.add(new Field("email","test"+i+"@test.com",Field.Store.YES,Field.Index.NOT_ANALYZED));
doc.add(new Field("content",contents[i],Field.Store.NO,Field.Index.ANALYZED));

4、设置评分标准

private Map<String,Float> scores = new HashMap<String,Float>();
scores.put("itat.org",2.0f);
scores.put("zttc.edu", 1.5f);

doc = new Document();
for(int i=0;i<ids.length;i++) {
	doc = new Document();
	doc.add(new Field("id",ids[i],Field.Store.YES,Field.Index.NOT_ANALYZED_NO_NORMS));
	doc.add(new Field("email",emails[i],Field.Store.YES,Field.Index.NOT_ANALYZED));
	doc.add(new Field("email","test"+i+"@test.com",Field.Store.YES,Field.Index.NOT_ANALYZED));
	doc.add(new Field("content",contents[i],Field.Store.NO,Field.Index.ANALYZED));
	doc.add(new Field("name",names[i],Field.Store.YES,Field.Index.NOT_ANALYZED_NO_NORMS));
	//存储数字
	doc.add(new NumericField("attach",Field.Store.YES,true).setIntValue(attachs[i]));
	//存储日期
	doc.add(new NumericField("date",Field.Store.YES,true).setLongValue(dates[i].getTime()));
	String et = emails[i].substring(emails[i].lastIndexOf("@")+1);
	System.out.println(et);
	if(scores.containsKey(et)) {
		doc.setBoost(scores.get(et));
	} else {
		doc.setBoost(0.5f);
	}
	writer.addDocument(doc);
}

二、删除索引

1、通过writer来删除

writer.deleteDocuments(new Term("id","1"));
writer.commit();

2、通过reader来删除

reader.deleteDocuments(new Term("id","1"));
reader.close();//用Reader来删除的话，当前reader对象可识别出已删除的索引，但如果希望其他reader也能识别出来，就需要commit

三、恢复删除的索引

通过reader来进行恢复

IndexReader reader = IndexReader.open(directory,false);
//恢复时，必须把IndexReader的只读(readOnly)设置为false
reader.undeleteAll();
reader.close();

四、更新索引

更新索引的本质是：删除索引再创建索引

Document doc = new Document();
doc.add(new Field("id","11",Field.Store.YES,Field.Index.NOT_ANALYZED_NO_NORMS));
doc.add(new Field("email",emails[0],Field.Store.YES,Field.Index.NOT_ANALYZED));
doc.add(new Field("content",contents[0],Field.Store.NO,Field.Index.ANALYZED));
doc.add(new Field("name",names[0],Field.Store.YES,Field.Index.NOT_ANALYZED_NO_NORMS));
writer.updateDocument(new Term("id","1"), doc);

五、索引合并

通常情况下索引多次删除造成索引文件变大，需要进行合并优化

/**
 * 合并索引会消耗很大的开销，不建议使用forceMerge
 * 而推荐使用forceMergeDeletes()
 **/
writer = new IndexWriter(directory,indexWriterConfig,standardAnalyzer);
writer.forceMergeDeletes();

六、检索部分

1、TermQuery

IndexReader reader = IndexReader.open(directory);
IndexSearcher searcher = new IndexSearcher(reader);
TermQuery query = new TermQuery(new Term("email","[email protected]"));
TopDocs tds = searcher.search(query, 10);

Name		Name	Last commit message	Last commit date
Latest commit History 9 Commits
src/org/itat		src/org/itat
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Lucene学习

lucene 索引创建及检索部分

一、创建索引

1、存储数字

2、存储日期

3、普通类型

4、设置评分标准

二、删除索引

1、通过writer来删除

2、通过reader来删除

三、恢复删除的索引

通过reader来进行恢复

四、更新索引

更新索引的本质是：删除索引再创建索引

五、索引合并

通常情况下索引多次删除造成索引文件变大，需要进行合并优化

六、检索部分

1、TermQuery

About

Releases

Packages

Languages

botaohuang/lucene

Folders and files

Latest commit

History

Repository files navigation

Lucene学习

lucene 索引创建及检索部分

一、 创建索引

1、存储数字

2、存储日期

3、普通类型

4、设置评分标准

二、 删除索引

1、通过writer来删除

2、通过reader来删除

三、 恢复删除的索引

通过reader来进行恢复

四、 更新索引

更新索引的本质是：删除索引再创建索引

五、 索引合并

通常情况下索引多次删除造成索引文件变大，需要进行合并优化

六、 检索部分

1、TermQuery

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

一、创建索引

二、删除索引

三、恢复删除的索引

四、更新索引

五、索引合并

六、检索部分

Packages