solr与hadoop结合
solr4.4支持索引存储到hdfs中下载hadoop2.1.0-beta下载解压solr4.4,hadoop2.1.0-beta我的solr是运行在tomcat web容器中solr4.4用的是hadoop2.0.5alpha版本,如果不改成hadoop2.1.0-beta会报很多奇怪的错误。删除solr webapp/WEB-INF/lib中的jar包,用我已
·
solr4.4支持索引存储到hdfs中下载
hadoop2.1.0-beta下载
解压solr4.4,hadoop2.1.0-beta
我的solr是运行在tomcat web容器中
solr4.4用的是hadoop2.0.5alpha版本,如果不改成hadoop2.1.0-beta会报很多奇怪的错误。
删除solr webapp/WEB-INF/lib中的jar包,用我已经整合好的lib替换
整合好的tomcat下载
注意修改的地方
solrconfig.xml
1
2
3
4
5
6
7
8
9
10
11
12
|
<
directoryFactory
name
=
"DirectoryFactory"
class
=
"solr.HdfsDirectoryFactory"
>
<
str
name
=
"solr.hdfs.home"
>hdfs://192.168.1.100:9000/solr</
str
>
<
bool
name
=
"solr.hdfs.blockcache.enabled"
>true</
bool
>
<
int
name
=
"solr.hdfs.blockcache.slab.count"
>1</
int
>
<
bool
name
=
"solr.hdfs.blockcache.direct.memory.allocation"
>true</
bool
>
<
int
name
=
"solr.hdfs.blockcache.blocksperbank"
>16384</
int
>
<
bool
name
=
"solr.hdfs.blockcache.read.enabled"
>true</
bool
>
<
bool
name
=
"solr.hdfs.blockcache.write.enabled"
>true</
bool
>
<
bool
name
=
"solr.hdfs.nrtcachingdirectory.enable"
>true</
bool
>
<
int
name
=
"solr.hdfs.nrtcachingdirectory.maxmergesizemb"
>16</
int
>
<
int
name
=
"solr.hdfs.nrtcachingdirectory.maxcachedmb"
>192</
int
>
</
directoryFactory
>
|
1
|
<
lockType
>${solr.lock.type:hdfs}</
lockType
>
|
hadoop集群配置可以参考hadoop官方伪分布式
要修改yarn.resourcemanager.hostname,由于我RM,NM,SecondaryNameNode都是在一台机器,所以就直接指定这个为一台机器的主机名
启动hadoop后查看http://192.168.1.100:8088/cluster/nodes
如果所有节点都可以看到说明正常
这时启动solr会出现不能创建文件夹错误Problem creating directory:
所以把权限限制关闭掉并且支持webhdfs,修改hdfs-site.xml
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
|
<
property
>
<
name
>dfs.webhdfs.enabled</
name
>
<
value
>true</
value
>
<
description
>
Enable WebHDFS (REST API) in Namenodes and Datanodes.
</
description
>
</
property
>
<
property
>
<
name
>dfs.permissions.enabled</
name
>
<
value
>false</
value
>
<
description
>
If "true", enable permission checking in HDFS. If "false", permission checking i
s turned off, but all other behavior is unchanged. Switching from one parameter
value to the other does not change the mode, owner or group of files or director
ies.
</
description
>
</
property
>
|
hadoop2的新特性是出现了yarn
更多推荐
已为社区贡献1条内容
所有评论(0)