分类分类
大小:470 KB更新:2026-02-19
类别:Linux教程系统:PDF
这是本人在完全分布式环境下在Cent-OS中配置Nutch-1.1时的总结文档,但该文档适合所有Linux系统和目前各版本的nutch。
目 录
介绍 ............................................................... 2
0 集群网络环境介绍 ................................................. 2
1 /etc/hosts文件配置 ............................................... 2
2 SSH无密码验证配置 ................................................ 2
2.1配置所有节点之间SSH无密码验证 ................................ 2
3 JDK安装和Java环境变量配置 ........................................ 3
3.1 安装 JDK 1.6 ................................................ 3
3.2 Java环境变量配置 ............................................ 4
4 Hadoop集群配置 ................................................... 4
5 Hadoop集群启动 ................................................... 6
6 Nutch分布式爬虫 .................................................. 9
6.1配置Nutch配置文件 ............................................ 9
6.2 执行Nutch分布式爬虫 ........................................ 10
7 Nutch检索 ....................................................... 13
7.1 Windows下Nutch单机搜索本地索引数据 ......................... 13
7.2 Linux下Nutch单机搜索本地索引数据 ........................... 14
7.2.1 WEB前端搜索 ........................................... 14
7.2.2 命令行搜索 ............................................ 15
7.3 Linux下Nutch搜索HDFS中索引数据 ............................. 15
7.3.1 WEB前端搜索
运维工程师必会的109个Linux命令Linux教程85 KB2011-09-30
下载如何搭建Linux服务器Linux教程222 KB2011-09-30
下载大学生攻克Linux系统教程Linux教程4.46 MB2011-09-28
下载Linux 5.4 RHCE NIS学习笔记Linux教程340 KB2011-09-18
下载RHEL5企业级Linux服务攻略(全12季)Linux教程16.1 MB2011-09-14
下载北大青鸟Linux服务器搭建课程 2.0Linux教程3.90 MB2011-09-14
下载即用即查Linux命令行实例参考手册Linux教程268 KB2011-09-05
下载Vi命令详解Linux教程119 KB2011-02-23
下载深入理解Linux内核(第三版)Linux教程6.2 MB2011-02-21
下载OpenOffice.org学以致用Linux教程2.7 MB2011-02-20
下载使用 /proc 文件系统来访问 Linux 内核的内容Linux教程252 KB2011-02-12
下载Linux下Nutch分布式配置和使用Linux教程470 KB2011-01-24
下载