开发自己的搜索引擎 Lucene+Heritrix(第2版)中文PDF 自动发货

开发自己的搜索引擎 Lucene+Heritrix(第2版)中文PDF

发布时间: 2020-02-20

类型 视频 授权 免费 百度网盘 自动发货 发布者 itkec

¥免费

立即下载 加入收藏

   关注度:454 ℃

开通VIP会员 享受全站资源免费下载

视频详情:

课程名称:开发自己的搜索引擎 Lucene+Heritrix(第2版)中文PDF


第1章 搜索引擎与信息检索 1
1.1 搜索引擎的历史 1
1.1.1 萌芽:Archie、Gopher 1
1.1.2 起步:Robot(网络机器人)的出现与Spider(网络爬虫) 3
1.1.3 发展:Excite、Galaxy、Yahoo等 4
1.1.4 繁荣:Infoseek、AltaVista、Google和Baidu 6
1.2 信息检索系统的基本知识 9
1.2.1 信息检索系统 9
1.2.2 信息检索的过程 11
1.2.3 传统查找的优点和不足 12
1.2.4 使用索引提高检索速度 12
1.2.5 倒排索引 13
1.2.6 评价信息检索系统的标准 14
1.3 Lucene的简介 14
1.4 小结 15

第2章 Lucene入门实战 16
2.1 实战介绍 16
2.1.1 实战说明 16
2.1.2 开发过程 16
2.2 准备工作 17
2.2.1 将文档的全角标点转成半角标点 17
2.2.2 将大文档切分成多个小文档 20
2.2.3 预处理源文件的统一接口 21
2.3 创建Eclipse工程 22
2.3.1 准备工作 22
2.3.2 创建工程并引入Lucene的JAR包 24
2.3.3 运行文档预处理类 31
2.3.4 创建处理文档的索引类:IndexProcessor 32
2.3.5 创建检索索引的搜索类 34
2.4 运行效果 38
2.5 小结 41

第3章 索引的建立 42
3.1 Document逻辑文件 42
3.1.1 Lucene的Document 42
3.1.2 为Document添加多种Field 43
3.1.3 Document的内部实现 45
3.2 Field的内部实现 46
3.2.1 Field包含的类 47
3.2.2 Field类的构造方法 48
3.3 Lucene的索引工具IndexWriter 49
3.3.1 IndexWriter的初始化 50
3.3.2 向索引添加文档 52


课程截图:

开发自己的搜索引擎 Lucene+Heritrix(第2版)中文PDF.png

版权信息:本站所有资源均收集于互联网或会员发布,仅供学习与参考,请勿用于商业用途,如有侵犯您的版权,请您出示版权证明及时联系客服,我们将在24小时之内删除。

暂无评论

嘿,我来帮您!