译者序
为什么要阅读本书
当年译者向美国移民局证明自己是美国本土难以找到的特殊人才的证据是:会自动化测试。三五年之后,自动化测试人才在美国不再难寻了。现在,图数据库领域也是同样的情况。你是愿意像译者当年一样马上开始学习图数据库,成为稀缺的特殊人才,还是愿意在多年以后被迫随大流去学习图数据库呢?
译者曾经是印象笔记的忠实付费用户,然而当Roam Research因为使用图数据库从而天然支持双向链接和图显示时,就立即通过迁移工具跟印象笔记说再见了。也许今天,你的产品/工具/服务有一群看似稳固的付费用户,然而随着数据量的增加,用户对数据分析的要求越来越高,图数据库的优势也将越来越明显。你可能会发现,这些付费用户离跳到竞争对手那里其实只差一个迁移工具……
所以还等什么呢?比竞争对手抢先掌握图数据库技术也许能解决这个问题!
译者曾经做过几年搜索引擎开发,但在用图数据库重写了搜索引擎的部分内容之后,深刻感受到在某些场景中,图数据库能以百分之一的代码量更轻松、更高效地进行实现。感兴趣的朋友们可以关注“神机妙算Fintech信息汇总”网站的开发。如果你被数据关系方面的某些技术难题所困扰,不如试试图数据库吧,也许会有惊喜哦。
本书与其他图数据库图书的不同之处
译者从2020年开始一直关注着图数据库的发展,终于遇到了这本门槛较低的图数据库入门书。与其他图数据库图书相比,本书门槛更低,十分适合有关系数据库背景的朋友入门。
内容简介
本书通过开发一个餐厅推荐应用程序示例,带领你轻松步入图数据库的世界。它以主流的TinkerPop Gremlin技术作为抓手,让你可以立即着手设计、开发和部署自己的图数据库应用程序。Gremlin是主流云商(如AWS Nepture图数据库)支持的遍历语言,掌握这项技术就能顺利地把自己的应用程序接入云端。
图数据库要解决的重点问题就是关系。在我们的现实世界中,既有实体,又有实体间的关系。比如某上市公司发行了股票,那么这家公司和其股票分别为两个实体,它们之间的关系就是从公司到股票的“发行”。如果某基金持有这支股票,便形成了该基金和这支股票及其公司之间的关系。这些关系可以更复杂,比如一家公司有很多关联的公司或人,也会有上下游公司等。图数据库就是方便我们建立和查询这些复杂关系的工具。
通过传统的关系数据库,也许也能存储和查询这些信息,但是效率低、实现复杂。通过图的形式,则可直接表达这些关系。因此图数据库是存储和查询这类信息的最佳途径。
反洗钱和反欺诈是图技术的常见应用场景,公司、上下游、关联方等之间迷雾般的复杂关系也许隐藏着某种风险。
读完本书,译者印象最深的有三点:
● 关系在图数据库中和实体一样,都是“一等公民”——图数据库是存储和查询实体和关系的最佳技术之一;
● 对遍历语句做少量修改便是Java代码——Gremlin有自己的一套像SQL那样的查询和遍历语句,如果你使用Java,就可以把大部分Gremlin语句直接转换成Java代码,实现高效编程;
● 要用遍历图的思维来解决图的问题——抛开我们熟悉的关系数据库思维,用全新的思维面对新的问题。
欢迎你通过本书和我们一起遨游图技术的全新世界。
叶伟民 刘华
于2021年8月