原文链接:
http://java.dzone.com/news/merge-policy-internals-solr?mz=33057-solr_lucene
今天我们关注一个solr的cache类型:filter cache。接下来,我会解释它是什么、怎么配置它以及如何更好的使用它。
What it is used for?
先从内部机制开始。FilterCache存储了一些无序的文档标识号(ID)。这些ID并不是我们在schema.xml里配置的unique key,而是solr内部的一个文档标识。请记住这个。
FilterCache的任务是保持与用户过滤的结果关联。另外,cache可以辅助facet机制(在使用
TermEnum时),在solrconfig.xml中的
<useFilterForSortedQuery/>参数设为true时,还可以进行排序。
Definition
FilterCache的标准定义如下:
<filterCache
class="solr.FastLRUCache"
size="16384"
initialSize="4096"
autowarmCount="4096" />
有以下的配置可供选择:
class:实现类。建议使用
solr.FastLRUCache,它能在大量的GET、PUT操作下,提供更好的性能。
size:cache的最大值。
initialSize:cache的初始化值。
autowarmCount:从旧的cache到新的cache时,需要被复制的数量。
minSize:在full restoraton的情况下,将cache减小后的值
acceptableSize:如果minSize没有设置,则该值会替代之
cleanupThread:默认false,如果设为true则会使用一个分离的topic来清理cache。
大部分情况下,设置initialSize和autowarmCount就已经足够了。
How to configure?
cache的大小,需要根据基本的查询语句而定;maximum大小应该至少等于我们使用的过滤字段的大小。举个例子说明:如果在某个时间内,你的应用程序使用了2000个查询参数,则minimum的大小应该最小设为2000。
Efficient use
然而,光有配置是不够的,我们还需要让查询能够使用它。请看下面的例子:
q=name:solr+AND+category:ksiazka+AND+section:ksiazki
初看起来,查询语句是正确的。但是有个问题:它并没有用到filterCache。所有的请求将会绑定到queryResultCache中并创建一个单独的条目。我们来作一下修改:
q=name:solr&fq=category:ksiazka&fq=section:ksiazki
有什么变化呢?在这个例子中,一个条目会写入到queryResultCache中;另外,还会有两个条目会写入到filterCache中。现在看一下下面的语句:
q=name:lucene&fq=category:ksiazka&fq=section:ksiazki
这个查询会创建一个条目到queryResultCache中,但是会使用filterCache中两个已经存在的条目。这样查询的执行时间会降低,IO的使用也会节省。
然而,对于下面的查询:
q=name:lucene+AND+category:ksiazka+AND+section:ksiazki
solr不能使用任何cache并且需要从lucene索引中收集所有的信息。
Last few words
就像你所看到的,配置cache 的正确方法不是如何保证solr能够使用它,而是如何构建查询语句来提升性能。当考虑查询的时候,请考虑这一点。
分享到:
相关推荐
ik-analyzer分词器,支持solr5-5.x
solr-mongo-importer-1.1.0.jar solr-mongo-importer-1.1.0.jar solr-mongo-importer-1.1.0.jar
中文分词器ik-analyzer-solr5-5.x.jar,已经打包好,直接用就可以
solr-import-export-json最新代码solr-import-export-json最新代码solr-import-export-json最新代码solr-import-export-json最新代码solr-import-export-json最新代码solr-import-export-json最新代码solr-import-...
solr6 solr-dataimporthandler-scheduler-1.1源码,可以自己编译适应不同版本solr
solr7,ik-analyzer中文分词,带配置文件,放到solr的classes目录即可配置自己的分词规定
solr6.6-IK分词 solr6.6-IK分词 solr6.6-IK分词 solr6.6-IK分词 solr6.6-IK分词 solr6.6-IK分词 solr6.6-IK分词
solr(solr-9.0.0-src.tgz)源码
solr增量更新-
solr数据库导入所需jar包,包括solr-dataimporthandler-6.0.1.jar,solr-dataimporthandler-extras-6.0.1.jar
solr 增量更新所需要的包 solr-dataimporthandler-6.5.1 + solr-dataimporthandler-extras-6.5.1 + solr-data-import-scheduler-1.1.2
solr自动更新包
solr5.0.0 所需jar包,包含 IKAnalyzer-5.0 ,solr-analyzer-extra-5.1.0 , solr-dataimportscheduler-1.1.1,solr-dataimporthandler-5.0.0 ,solr-dataimporthandler-extras-5.0.0
solr 5.x定时生成索引依赖jar
solr-data-import-scheduler-1.1.2,用于solr定时更新索引的jar包,下载后引入到solr本身的dist下面,或者你tomcat项目下面的lib下面
兼容最新的solr6.1,tomcat启动不会报错