nutch的首页,比较难看,实现了一些基本页面,像baidu一样。你如果像对它进行二次开发的话,你就得读一下源码了,然后进行build.xml 重新打包在tomcat里发布了,当然。这里我已经对它进行了读写哈。
nutch 里的页面,是通过xslt 里编写的,在源码src/web/style/nutch-page.xsl 编写,这里有一个xsl格式的源码。这里你应该要读懂它的基本结构,不然会build.xml失败的。所以你要一步一步的试。
基本结构:
<?xml version="1.0"?>
<xsl:stylesheet xmlns:xsl="http://www.w3.org/1999/XSL/Transform"
version="1.0">
<xsl:output method="html" doctype-public="-//W3C//DTD HTML 4.01 Transitional//EN" />
<xsl:template match="page">
<html>
<xsl:comment>
This page is automatically generated. Do not edit!
</xsl:comment>
<head>
<!-- page title -->
<title>
<xsl:text>你自己定义的title
</xsl:text>
<xsl:value-of select="title" disable-output-escaping="yes" />
</title>
<!-- insert style 插入你的样式
-->
<xsl:copy-of select="document('../include/style.html')" />
<!-- specify icon file 引入js包
-->
<script language="javascript" src="../resources/js/navMore-min.js"></script>
<script src="../resources/js/autoComplete-min.js"></script>
<script src="../resources/js/goso-slide-min.js"></script>
<script src="../resources/js/goso-waterMark-min.js"></script>
<script src="../resources/js/helpers-min.js"></script>
<script language="javascript" src="../resources/js/index.js"></script>
<script type="text/javascript">
<xsl:comment>
function queryfocus() {
search = document.search;
if (search != null) { search.query.focus(); }
}
<xsl:text>// </xsl:text>
</xsl:comment>
</script>
</head>
<body class="homeLink" onLoad="queryfocus();">
<xsl:call-template name="body" />
<xsl:copy-of select="document('../include/footer.html')"/>
</body>
</html>
</xsl:template>
<!-- included menu -->
<xsl:template name="subnavi">
</xsl:template>
<!-- /included menu -->
<!-- included body -->
<xsl:template name="body">
你的body
</xsl:template>
<!-- /included body -->
</xsl:stylesheet>
我作了简单的增删,你认真比较,应该能看出它的变化。
这样重新打包部署应该就没有问题了。
分享到:
相关推荐
nutch官方简单案例,请版本是nutch-1.2.war
Nutch 1.2 学习笔记,讲的比较清楚的文档
配置好的nutch1.2 java工程,由于上传文件大小限制,只缺少plugins没有传.感觉配置过程太麻烦了,所以感觉有必要分享一下。
配置好的nutch1 2 java工程 由于上传文件大小限制 只缺少plugins 自己可以添加
nutch1.2测试文档
nutch1.2源码,可与hadoop分布式布置,欢迎下载
将nutch1.2源码嵌入到myeclipse8.5 在window环境的nutch1.2的简单应用 将其放于tomcat的webapp下
Windows下cygwin+MyEclipse 8.5+Nutch1.2+Tomcat 6.0 Windows下cygwin+MyEclipse 8.5+Nutch1.2+Tomcat 6.0 Windows下cygwin+MyEclipse 8.5+Nutch1.2+Tomcat 6.0
nutch Nutch是一个由Java实现的,刚刚诞生开放源代码(open-source)的web搜索引擎。 尽管Web搜索是漫游Internet的基本要求, 但是现有web搜索引擎的数目却在下降。 并且这很有可能进一步演变成为一个公司垄断了几乎...
Nutch1.7二次开发培训讲义,非常详细
nutch Nutch是一个由Java实现的,刚刚诞生开放源代码(open-source)的web搜索引擎。 尽管Web搜索是漫游Internet的基本要求, 但是现有web搜索引擎的数目却在下降。 并且这很有可能进一步演变成为一个公司垄断了几乎...
我们需要去抓取网页数据的时候我们就用nutch来爬取,我们对它进行二次开发使其更加符合我们的需求
Nutch1.7二次开发培训讲义 之 腾讯微博抓取分析
有点小问题,学过jsp的应该会,这里不解释了
nutch部分网页乱码BUG修正,有代码和详细修改说明
一步一步详细解释了如何搭建nutch web开发环境,对nutch1.2有效,nutch1.3以上已经没有web这部分内容了
Nutch 高级 插件是开发 多Nutch内部的流程有很好的解释和说明
利用Nutch和IKanalyzer构造中文分词搜索引擎