大数据搜索与日志挖掘及可视化方案:ELK Stack:Elasticsearch、Logstash、Kibana (第2版)
上QQ阅读APP看书,第一时间看更新

序言
Preface

云计算、智慧城市、移动互联网、大数据与物联网已经成为大数据时代的前瞻技术,实现了人、机器与实物的多维互联互通,监测数据、内容数据、社交数据、关系数据裂变式增长,大数据时代已全方位到来。大数据具有多(体量大)、快(生成速度快)、好(价值大)、省(高效)的特征,传统的信息搜索、数据挖掘与知识呈现技术难以满足当下多样化的需求。大数据的理念与理论已经成为人所共知的科学常识,但是大数据搜索、挖掘与可视化等落地的工程实践尚有较大距离,也是当下的工程急需。

本书从分布式大数据搜索、日志挖掘与可视化三个角度出发,以非结构化文本信息、半结构化的日志数据为处理对象,进行宏观解决方案与微观方法技巧的全面阐释。具体地说,如何利用在全文检索开源软件Lucene之上的Elasticsearch对大数据进行分布式计算与全文检索;如何利用Logstash对日志文件进行智能分析与处理;如何利用Web接口Kibana对日志进行高效的搜索、可视化、分析等,是本书的论述重点。

从工程实践的角度掌握ElasticSearch、Logstash、Kibana的基本使用方法和技巧,很有必要。目前,国内专门针对Elasticsearch、Logstash、Kibana进行介绍的书很少。本书是目前国内较早综合介绍ELK架构的图书,涉及范围广泛,内容新颖,条理清晰,组织合理。

高凯老师是我多年的朋友,我们都在大数据搜索与挖掘方向上从事教学、科研与开发工作。他严谨的治学态度、理论联系实际的做法以及敬业的态度也一直为我所学习。非常荣幸能够有这个机会来为高老师的新著作序。认真拜读后,我以为本书实战性很强,是大数据搜索与挖掘所需的上乘之作,是大数据“知著、见微、晓意”的必备工具,值得推荐!

(张华平 博士,副教授,北京理工大学大数据搜索挖掘实验室主任,ICTCLAS及NLPIR分词软件发明者。)