解密搜索引擎技术实战(附光盘Lucene & Java精华版第3版全新升级)

扫一扫即可关注本站(PDF之家)微信公众账号
发送您想要找的书籍名称即可找到书籍

Image

上传用户: 仲夏艳卉   


本书主要包括总体介绍部分,爬虫部分,自然语言处理部分,全文检索部分以及相关案例分析.爬虫部分介绍了网页遍历方法和如何实现增量抓取,并介绍了从网页等各种格式的文档中提取主要内容的方法.自然语言处理部分从统计机器学习的原理出发,包括了中文分词与词性标注的理论与实现及在搜索引擎中的应用等细节,同时对文档排重,文本分类,自动聚类,句法分析树,拼写检查等自然语言处理领域的经典问题进行了深入浅出的介绍,并总结了实现方法.在全文检索部分,结合Lucene介绍了搜索引擎的原理与进展.用简单的例子介绍了Lucene的最新应用方法,包括完整的搜索实现过程:从完成索引到搜索用户界面的实现.此外还进一步介绍了实现准实时搜索的方法,展示了Solr的用法以及实分布式搜索服务集群的方法.最后介绍了在地理信息系统领域和户外活动搜索领域的应用.


解密搜索引擎技术实战(附光盘Lucene & Java精华版第3版全新升级)

请输入验证码: