Network Security Internet Technology Development Database Servers Mobile Phone Android Software Apple Software Computer Software News IT Information

In addition to Weibo, there is also WeChat

Please pay attention

WeChat public account

Shulou

How to configure solr incremental import data

2025-01-19 Update From: SLTechnology News&Howtos shulou NAV: SLTechnology News&Howtos > Servers >

Share

Shulou(Shulou.com)05/31 Report--

这篇文章主要介绍"solr增量导入数据怎么配置",在日常操作中,相信很多人在solr增量导入数据怎么配置问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答"solr增量导入数据怎么配置"的疑惑有所帮助!接下来,请跟着小编一起来学习吧!

简介: solr5.0是一个独立的应用程序,不再依赖其他Web服务器就能提供Web服务(这是和4.x版本最大的差异,内置jetty)。

启动solr

solr提供了启动脚本

bin/solr start前台运行 bin/solr start -f指定端口号 bin/solr start -p 8984(默认端口号8983)查看solr状态 bin/solr status结束solr bin/solr stop -p 8984

后台管理地址 http://localhost:8984/solr

logging:显示日志

Core Admin: core就是搜索示例,放置索引。

java properties:查看java配置信息

Thread dump:查看线程信息

创建一个搜索实例

{solr安装路径}/server/solr/新建一个文件夹命名为test

拷贝{solr安装路径}/server/solr/configsets/sample_techproducts_configs到test目录下

目录结构如下:

在后台采用如下配置:

配置smartcn分词期

第一步:导入smartcn的jar包

在{solr安装路径}/server/solr/test/conf/solrconfig.xml加入如下代码

第二步:配置分词器

1.solr5

在{solr安装路径}/server/solr/test/conf/schema.xml加入如下代码

2.solr6

在{solr安装路径}/server/solr/test/conf/managed-schema加入如下代码

第三步:检查是否正确配置

如果可以搜索到text_cn即表示配置成功,最好用一段文字测试下分词结果。

配置数据导入handler(用于数据导入,生成索引)

第一步:导入相关jar包(solr6不需要这一步)

在{solr安装路径}/server/solr/test/conf/solrconfig.xml加入如下代码

第二步:配置handler(solr6不需要这一步)

在{solr安装路径}/server/solr/test/conf/solrconfig.xml加入如下代码

db-data-config.xml

第三步:配置数据源,源数据与索引的隐射关系

在{solr安装路径}/server/solr/test/conf/下新建db-data-config.xml,配置如下:

第四步:验证配置是否成功

在后台core admin中reload当前搜索实例的配置

then在搜索实例的dataimport出现下图情形即为成功

导入数据

第一步:导入mysql的jar包 下载地址:见参考资料5

将jar放置到{solr安装路径}/dist目录下,

在{solr安装路径}/server/solr/test/conf/solrconfig.xml加入如下代码

第二步:验证配置(配置见第六点)

如果显示indexing completed. Added/Updated: 1847 documents. Deleted 0 documents

documents的个数大于0说明我们成功导入x条数据到solr中

设置field的索引方式

查询

更新索引

删除索引

优化

定时完整数据重新导入

crontab -ecurl -d "command=full-import&clean=true&commit=true&optimize=true&wt=json&indent=true&verbose=false&debug=false" "http://ip:port/solr/{core名称}/dataimport"

14.增量导入数据配置

修改db-data-config.xml添加deltaQuery、deltaImportQuery、pk三个属性

1.pk设置主键字段名称,该字段必须在managed-schema配置过字段名

2.deltaQuery该属性用于查询主键字段值

3.deltaImportQuery该属性用于查询需要被索引的所有字段的sql

15.配置定时数据更新

16.搜索词建议

https://cwiki.apache.org/confluence/display/solr/Suggester

更新中~~~

错误信息:

1.配置好的solr没有任何数据,启动时报错:SolrException: Invalid Number: MA147LL/A

这不是你的错,你可能是把solr schema.xml的id设置成了int类型,设置成int类型没什么错,但是solr启动是会扫描conf目录下的elevate.xml文件,这个文件中定义的id值是MA147LL/A所以就会出现异常SolrException: Invalid Number: MA147LL/A

解决问题的方法是修改elevate.xml文件,将其中的id值设置为数字,就可以了。

2.全量导入数据报:

Caused by: java.sql.SQLException: Illegal value for setFetchSize().

在db-data-config.xml的dataSource标签添加batchSize属性并赋值-1即可,修改后的内容

到此,关于"solr增量导入数据怎么配置"的学习就结束了,希望能够解决大家的疑惑。理论与实践的搭配能更好的帮助大家学习,快去试试吧!若想继续学习更多相关知识,请继续关注网站,小编会继续努力为大家带来更多实用的文章!

Welcome to subscribe "Shulou Technology Information " to get latest news, interesting things and hot topics in the IT industry, and controls the hottest and latest Internet news, technology news and IT industry trends.

Views: 0

*The comments in the above article only represent the author's personal views and do not represent the views and positions of this website. If you have more insights, please feel free to contribute and share.

Share To

Servers

Wechat

© 2024 shulou.com SLNews company. All rights reserved.

12
Report