博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Solr 4.x定时、实时增量索引 - 修改、删除和新增索引
阅读量:6985 次
发布时间:2019-06-27

本文共 1756 字,大约阅读时间需要 5 分钟。

hot3.png

一、开始增量索引前的准备工作。

1、认识data-config.xml中相关属性

注意这个query只返回ID字段
注意这个只返回ID字段

最主要的是我们要知道这样一个事实: last_index_time是DataImportHandler的一个默认字段,(可查看conf目录下的dataimporter.properties文件)

我们可以在任何SQL中引用,该字段用于表明上次做full import或者是delta import(增量导入)的最后一次时间。

2、数据库配置注意事项

1)、如果只涉及添加与修改业务,那么数据库里只需添加一个类型为timpstamp,默认值为当前系统时间的字段 :CURRENT_TIMESTAMP(MySQL)

2)、如果还涉及删除业务,那么数据里就需额外再多添加一个字段isdelete,int类型的用0,1来标识,此条记录是否被删除,当然也可以用其他字段标识,ture或false都可以

3、dataimporter.properties / {corename}_dataimporter.properties

在C:\solr-tomcat\solr\item\conf中查看是否存在文件dataimporter.properties,如果没有,则新建该文件。

这个配置文件很重要,它是用来记录索引的最新一次修改时间的,通过该配置文件可以找出新增的、修改的或者删除的记录。相关实例:

在data-config中添加如下配置信息。

<dataConfig> <!--- 此段话配置的是一个MySQL的数据源,(数据源也可以配置在solrconfig.xml中) ---> <dataSource name="activityDB" type="JdbcDataSource" driver="com.mysql.jdbc.Driver" url="jdbc:mysql://localhost/test" user="swang6" password="swang6"/> <document> <entity pk="ID" dataSource="activityDB" name="myentity" query="select * from myentity WHERE isdelete=0" deltaQuery="select ID from myentity where my_date >'${dih.last_index_time}'" deletedPkQuery="select ID from myentity where isdelete=1" deltaImportQuery="select * from myentity where ID='${dih.delta.id}">

</document> </dataConfig>

<!-- pk="ID" 必须,因为其中的增量索引查询主键ID时需要 -->

注:如果有必要,则可以在schema.xml中添加一个timestamp的field

<field name="timestamp" type="date" indexed="true" stored="true" default="NOW" />

做了以上配置后,可以设置linux的cron job或者spring 的TaskSchuduler或者Cron Job后,可以定时发url:

当然也可以用Solr自带的Scheduler来做增量索引:

转载于:https://my.oschina.net/fight123/blog/677837

你可能感兴趣的文章
springmvc @valid
查看>>
抓包工具 - Fiddler - (三)
查看>>
使用Hibernate注解 @Transient
查看>>
【POJ3294】 Life Forms(SA)
查看>>
让思路更清晰——我是怎样使用思维导图的
查看>>
nohup
查看>>
iTextSharp生成pdf的一个简单例子
查看>>
php操作Access数据库
查看>>
【原译】一个可定制的WPF任务对话框
查看>>
zabbix agent 类型自带的key
查看>>
转:sql篇 select from where group by having order by
查看>>
Leangoo如何颠覆传统项目管理软件?
查看>>
GCD中有哪几种Queue?你自己建立过串行Queue吗?背后的线程模型是什么样的
查看>>
express框架学习笔记
查看>>
Django---模型
查看>>
Linux salt
查看>>
eclipse
查看>>
angularjs定时任务的设置与清除
查看>>
C#获取文件的MD5值
查看>>
字符串子串查找strstr
查看>>