购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

前言

目标

本书的目标是向你介绍图数据结构、图分析和图机器学习的概念、技术和工具。当你读完这本书时,我们希望你能理解如何使用图分析来解决一系列现实世界的问题。我们希望你能够回答以下问题:图是否适合任务?应该使用哪些工具和技术?数据中有哪些有意义的关系,应该如何根据关系分析来制定任务?

根据经验,我们发现许多人能够快速掌握图的一般概念和结构,但要“思考”图,要培养如何最佳地将数据建模为图的直觉,然后将分析型任务制定为图查询,则需要更多的努力和经验。几乎每章的开头都列出了对应的目标,它们大致分为三个方面:学习图分析和机器学习的概念;用图分析解决特定问题;了解如何使用GSQL查询语言和TigerGraph图平台。

目标读者和前提条件

本书的目标读者是对数据分析感兴趣并想学习图分析的人。你不必是一位严肃的程序员或数据科学家,但了解一些数据库和编程的概念肯定有助于你理解本书内容。当我们深入讲解一些图算法和机器学习技术时,我们会给出一些涉及集合、求和与极限的数学方程式。这些方程式只是本书文字和图像的补充。

在本书的案例部分,我们将在TigerGraph Cloud平台上运行预先编写好的GSQL代码。你只需要一台可以访问互联网的计算机即可。如果你熟悉SQL数据库查询语言和任意主流编程语言,那么你将能够理解大部分的GSQL代码。如果你不熟悉它们,也可以简单地按照说明并跟随书中的注释来运行预先编写的案例示例。

阅读方法和路线

我们旨在以实际的数据分析需求(而不是理论原理)为导向来呈现内容。我们会尝试使用最简单的术语来解释事情,并尽量使用日常概念而不是难懂的技术术语。

本书通过完整的示例来介绍GSQL语言。在本书开头,我们逐行描述了每行示例代码的目的和功能。我们还对特别重要的语言结构、语法和语义进行了强调。若要获得更全面的GSQL教程,可以参阅本书之外的其他资源。

排版约定

本书中使用以下排版约定:

斜体( Italic

表示新的术语、URL、电子邮件地址、文件名和文件扩展名。

等宽字体(Constant width)

表示程序清单,以及段落中引用的程序元素,例如变量名、函数名、数据库、数据类型、环境变量、语句及关键字。

等宽粗体( Constant width bold

表示顶点或边类型。

该图示表示提示或建议。

该图示表示一般性说明。

该图示表示警告或注意。

示例代码

本书有自己的GitHub存储库,地址为 https://github.com/TigerGraph-DevLabs/Book-graph-powered-analytics

该网站的初始内容是所有用例的副本。我们把书中的GSQL技巧汇总到一个文档中作为入门指南。我们希望得到读者的反馈,并会发布常见问题的答案。我们还将增加或修改GSQL示例,或指出如何利用TigerGraph平台的新功能。

有关TigerGraph和GSQL语言的其他资源,可通过TigerGraph的主网站( https://www.tiger graph.com )、文档网站( https://docs.tigergraph.com )找到最全面的资料。

非常欢迎读者使用本书中的代码,希望(但不强制)注明出处。注明出处时包含书名、作者、出版社和ISBN,例如:

Graph-Powered Analytics and Machine Learning with TigerGraph ,作者Victor Lee、Phuc Kien Nguyen和Alexander Thomas,由O'Reilly出版,书号978-1-098-10665-2。

读者可以通过 gpaml.book@gmail.com 与作者联系。

O'Reilly在线学习平台(O'Reilly Online Learning)

40多年来,O'Reilly Media致力于提供技术和商业培训、知识和卓越见解,来帮助众多公司取得成功。

我们拥有独一无二的专家和革新者组成的庞大网络,他们通过图书、文章、会议和我们的在线学习平台分享他们的知识和经验。O'Reilly的在线学习平台允许你按需访问现场培训课程、深入的学习路径、交互式编程环境,以及O'Reilly和200多家其他出版商提供的大量文本和视频资源。有关的更多信息,请访问 http://oreilly.com

如何联系我们

对于本书,如果有任何意见或疑问,请按照以下地址联系本书出版商。

美国:

O'Reilly Media,Inc.

1005 Gravenstein Highway North

Sebastopol,CA 95472

中国:

北京市西城区西直门南大街2号成铭大厦C座807室(100035)

奥莱利技术咨询(北京)有限公司

要询问技术问题或对本书提出建议,请发送电子邮件至 errata@oreilly.com.cn

本书配套网站 https://oreil.ly/gpaml 上列出了勘误表、示例以及其他信息。

关于书籍和课程的新闻和信息,请访问我们的网站 http://oreilly.com

我们在Linkedln上的地址: https://linkedin.com/company/oreilly-media

我们在Twitter上的地址: https://twitter.com/oreillymedia

我们在YouTube上的地址: https://youtube.com/oreillymedia

致谢

如果没有TigerGraph的市场副总裁Gaurav Deshpande,本书就不会存在,是他建议我们写这本书,并且坚信我们有能力完成这项任务。他撰写了最初的提案和章节大纲,并且提出将本书的结构划分成三部分。感谢TigerGraph的CEO兼创始人许昱博士(Dr. Yu Xu),是他支持我们的工作,并在这个项目上给予我们很大的自由度。许博士还设想了GraphStudio及其入门套件(Starter Kits)。Mingxi Wu和Alin Deutsch则基于高效的图分析功能开发了GSQL语言。

除了署名作者之外,还有几位人士对这本书做出了贡献。当写作障碍和拖延症成为我们最大的敌人时,Tom Reeve运用他的专业写作技巧和图概念知识帮助我们撰写了第2章。Emily McAuliffe和Amanda Morris设计了本书早期版本中的图形。在我们需要数据科学家来审查关于机器学习的章节时,我们求助了Parker Erickson和Bill Shi,他们不仅是图机器学习方面的专家,还开发了TigerGraph ML Workbench。

我们要感谢Xinyu Chang,他是TigerGraph最初的GSQL查询和解决方案专家,亲自开发或监督开发了本书中许多案例的入门套件和图算法实现。感谢Yiming Pan编写并优化了几个图算法和查询。书中的许多示例都基于他们为TigerGraph的客户做的设计。这些入门套件中的模式、查询和输出显示与英文段落一样,都是本书内容的一部分。我们对入门套件做了一些改进,以适配本书。还有许多人帮助我们审查、标准化了入门套件:开发者关系主管Jon Herke,以及TigerGraph的实习生Abudula Aisikaer、Shreya Chaudhary、McKenzie Steenson和Kristine Zheng。感谢负责TigerGraph Cloud和GraphStudio的设计和开发工作的Renchu Song和Duc Le,是他们确保我们修改后的入门套件被发布到了产品中。

万分感谢O'Reilly的两位编辑:Nicole Taché为我们指点迷津,让我们首次提前发布了两章内容,并对这个项目提供了有见地的意见、建议和鼓励;Gary O'Brien带领我们历经艰难险阻完成了写作。两人都是很棒的编辑,和他们合作是我们的荣幸。同时还要感谢本书的制作编辑Jonathon Owen和文字编辑Adam Lawrence。

Victor想要感谢他的父母George Lee和Sylvia Lee对他在学术和非学术领域的追求给予的不懈支持。他想要感谢他的妻子Susan Haddox一直在他身边,容忍他在深夜写作,并陪他一起观看《星际迷航》的所有剧集,感谢她成为他的榜样,让他知道一个人可以非常聪明、善良和有趣。

Kien想要感谢他的母亲My Linh Ly,她一直是他灵感的来源和事业的动力。他还要感谢他的妻子Sammy Wai-lok Lee,她一直陪伴在他身边,给他的生活增添色彩,照顾他和他们的女儿Liv Vy Ly Nguyen-Lee(在写这本书时出生)。

Alexander想要感谢他的父母Chris Thomas和Becky Thomas,以及他的妹妹Ari,感谢他们在写作过程中作为讨论伙伴给予的支持和鼓励。他尤其感谢他的妻子Gloria Zhang,感谢她惊人的力量、无穷的智慧和无限的灵感。 sjgFzHH5yX9N7P6q9mpXtYyo8qI2eTK3sresReu4SmTUdtvv3te2nhHNO8PFbHn5

点击中间区域
呼出菜单
上一章
目录
下一章
×