会员
自己动手写搜索引擎
罗刚编著更新时间:2018-12-28 22:52:39
最新章节:参考资料开会员,本书免费读 >
本书是猎兔企业搜索开发团队的软件产品研发和项目实践的经验汇总。本书全方位展现出一个商用级别的Lucene搜索解决方案,主要包括爬虫、自然语言处理和搜索实现部分。爬虫部分介绍了网页遍历方法和从网页提取主要内容的方法。自然语言处理部分包括了中文分词从理论到实现以及在搜索引擎中的实用等细节。其他自然语言处理的经典问题与实现包括:文档排重、文本分类、自动聚类、语法解析树、拼写检查、拼音转换等理论与实现方法。
上架时间:2009-12-01 00:00:00
出版社:电子工业出版社
上海阅文信息技术有限公司已经获得合法授权,并进行制作发行
最新章节
罗刚编著
主页
同类热门书
最新上架
- 会员
64位汇编语言的编程艺术
本书源于作者的经典书籍TheArtofAssemblyLanguage,从32位汇编语言升级为64位汇编语言,基于Microsoft宏汇编程序(MASM)讲解x86-64CPU上汇编语言的编程艺术。本书从计算机的组成结构开始介绍,包括计算机数据表示和运算,以及内存的访问和组织等。之后详细讲解汇编语言程序设计,涉及过程和算术运算的相关知识,再通过低级控制结构过渡到高级主题,如表查找和位操作。计算机33.4万字 - 会员
Podman实战
本书主要介绍了如何构建、管理和运行容器,解释如何将人们在Docker中学到的技能轻松地转移到Podman上,以及如果你以前从未使用过容器引擎,你该如何轻松地学习使用Podman。本书还教你使用像pod这样的高级功能,并指导你构建准备在Kubernetes边缘或内部运行的应用程序。最后,本书解释了Linux内核中用于将容器与系统和其他容器进行隔离的所有安全功能。本书适用于希望了解、开发和使用容器的软计算机11.9万字 - 会员
TensorFlow程序设计
本书全面介绍TensorFlow2.x框架及其在深度学习中的应用,内容包括TensorFlow简介、Python语言基础、环境搭建与入门、TensorBoard可视化、多层感知机实现、卷积神经网络实现、循环神经网络实现、强化学习、迁移学习、生成对抗网络和GPU并行计算等。计算机7.9万字 - 会员
动手学数据结构与算法
本书系统介绍了数据结构与算法的基本概念和相关知识,既注重理论,又注重算法设计,更突出代码实现,是一本着眼于数据结构与基本算法的教学实践的教材。本书介绍了线性表、队列与栈、树与优先级队列、集合与静态查找表、动态查找表、排序、外部查找与排序、图、最小生成树与最短路径、算法设计思想等内容,将数据结构的理论与真实应用的实践紧密结合,从各种数据结构的代码实现到火车票管理系统的代码实现,手把手地指导读者学习数计算机15.5万字 C语言程序设计习题解析与上机指导(第4版)
本书是与朱鸣华、罗晓芳、董明等编著的《C语言程序设计教程》配套使用的习题解答与上机指导,根据教学要求设置了三部分内容,包括C语言编程环境简介、知识提要及习题解析、上机指导及实验。本书首先介绍计算机程序实验的一般方法以及在VisualC++2010下编写和调试C语言程序的具体步骤;然后对主教材各章后面的习题以及C语言程序设计课程学习中的疑难问题和常见问题进行了详细的解析,同时,还汇总了各章的知识计算机6.3万字- 会员
openGauss数据库开发实战
openGauss数据库是华为公司在多年数据库领域研发经验基础上开发的数据库产品,为企业级场景需求而设计。本书由浅入深地介绍了openGauss数据库的开发过程,主要内容包括openGauss数据库的安装和配置、体系结构和主要运行机制、GUC参数、用户管理和审计、数据类型、表和索引、SQL基础、常用函数、过程化SQL程序设计,以及数据库的备份与恢复等。本书通过实战帮助读者深入理解openGauss计算机9.5万字 - 会员
Python AI游戏编程入门:基于Pygame和PyTorch
本书以Python为开发环境,以小游戏开发为载体,对编程及人工智能技术进行讲解,让读者同时学习编程及人工智能知识。本书共16章,可分为4个部分。第1部分为第1~3章,分别是编程、游戏和AI,Python环境准备及Pygame基础知识。第2部分为第4~7章,分别讲解了贪吃蛇游戏编程、打砖块游戏编程、笨鸟先飞游戏编程和五子棋游戏编程。第3部分为第8~12章,分别介绍了神经网络和PyTorch基础、蒙特计算机9.3万字 - 会员
游戏设计的底层逻辑
本书主要讲述了游戏设计中最基础的方法论,并针对每则理论提供相应的设计实例进行说明。就布局谋篇而言,全书依序涵盖了一个游戏策划从未入行到需要负责某个模块所需掌握的主要知识方法。第一部分的主题是游戏通识知识,即关于游戏行业这个整体的基础知识。第一章对游戏的本质进行剖析,着重从用户、反馈、体验等角度展开论述。第二章对游戏团队的游戏制作过程进行说明。第三章对游戏的未来发展趋势作出分析。第二部分讲述了游戏策计算机17.4万字 - 会员
剑指大数据:企业级数据仓库项目实战(金融租赁版)
本书从需求规划、需求实现到可视化展示等,遵循项目开发的主要流程,全景介绍了金融租赁行业离线数据仓库的搭建过程。在整个数据仓库的搭建过程中,介绍了主要组件的安装部署、需求实现的具体思路、问题的解决方案等,并在其中穿插了许多大数据和数据仓库相关的理论知识,包括数据仓库的概念介绍、金融租赁业务概述、数据仓库理论介绍和数据仓库建模等。本书的第1章至第3章是项目前期准备阶段,主要为读者介绍了数据仓库的概念、计算机7.4万字
同类书籍最近更新
- 会员
算法设计与分析:基于C++编程语言的描述
本书注重理论与实践紧密结合,系统介绍算法设计方法、分析技巧和C++编程实战。作者本着“易理解,重实用”的指导思想,结合多年的教学经验,以算法设计策略为主线,沿着“算法思想—算法设计—构造实例—算法描述—算法分析—C++实战”的思路组织学习内容,共包括算法及基础知识、贪心法、分治法、动态规划、搜索法、随机化算法、线性规划问题与网络流、数论算法及计算几何算法和NP完全理论等9章内容。程序设计16.9万字 软件开发中的决策:权衡与取舍
本书详细阐述如何在设计、规划和实现软件时做出更好的决策,通过真实的案例,以抽丝剥茧的方式分析那些失误的决策,探讨还有哪些可能的解决方案,并对比各种方案的优缺点,摸索软件设计的常青模式。本书通过实例来说明某些决策的后果,例如代码重复如何影响系统的耦合与演进速度,以及如何在日期和时间信息方面隐藏细微差别。本书还介绍如何根据帕累托法则有效地缩小优化范围,确保分布式系统的一致性。通过阅读本书,读者很快就可程序设计23.9万字