目录

图数据库基本概念

Neo4j 简介

Neo4j 使用属性图(Property Graph)模型1

一个图包含节点(Objects)和边(Relationships)。

Neo4j 的属性图模型包含了:

  • 节点
  • 节点标签:用于区分节点的类型,0个或多个
  • 边:源节点与目标节点之间的一条有向边
  • 边类型:用于区分边的类型,有且仅有1个
  • 属性:节点和边都可以有属性(键值对)用于描述节点和边

注意这些名词的英文:noderelationshiplabel(节点可以有0个或多个标签)、type(边只有一个类型)、property

在数学的图论中,node 也称 vertex、point,relationship 也称 edge、link、line。

属性图

https://cdn.jsdelivr.net/gh/dfface/img0@master/2022/05-27-6fmgqw.svg

上面这个图可以用 Cypher 语句这样表示:

CREATE (:Person:Actor {name: 'Tom Hanks', born: 1956})-[:ACTED_IN {roles: ['Forrest']}]->(:Movie {title: 'Forrest Gump'})<-[:DIRECTED]-(:Person {name: 'Robert Zemeckis', born: 1951})

Cypher 查询语言2,是 Neo4j 图查询语言,能让你从图中获取数据。类似图的 SQL ,也是被 SQL 启发的,让你能专注于你想要什么数据而不是怎么拿到它。目前,它是最易于学习的图语言,因为跟其他语言相似,并且很主观。

https://cdn.jsdelivr.net/gh/dfface/img0@master/2022/05-27-jgoSdU.png

后面我们会详细介绍这门语言。可以看到,圆括号包裹了节点,而方括号包裹了边,还有类似ASCII艺术风格的箭头表示。

Cypher 可以说是 Neo4j 的主要接口。

节点 Node

节点被用来表示一个域的实体。

节点的标签 Label 用来区分实体类型,一个实体可以有0个或多个标签。

标签可以在运行时动态添加或删除,因此可以用来表示节点的临时状态。

不同的标签可以表达数据的不同维度。

https://cdn.jsdelivr.net/gh/dfface/img0@master/2022/05-27-AHD7Gb.svg

建议节点标签命名用大驼峰,如 :VehicleOwner3

边 Relationship

一条边描述了源点与目标点之间的关系。

边是有向边,并且必须有一个类型 Type 来区分是何关系。

边可以用很多属性即键值对,可用来进一步描述关系。

边可以与节点组装起来,形成一个结构,如链表、树、图、环、化合物等等。

要创建边,必须创建或引用节点。

边总是有方向的,但是这个方向在你不用的时候可以忽视。这意味着,你没必要添加相反方向的重复边,除非你认为这是必要的。

一个节点可以有指向自己的边。

一条边必须有一个确切的类型。

https://cdn.jsdelivr.net/gh/dfface/img0@master/2022/05-27-8UjfZO.svg

建议边类型用全大写+下划线,如:OWNS_VEHICLE3

属性 Property

属性就是键值对,用来存储节点或边的数据。

键类似变量,值可以是:

  • 不同的数据类型,如数值、字符串、布尔值
    • Integer, Float, String, Boolean, Point, Date, Time, LocalTime, DateTime, LocalDateTime, and Duration4.
  • 同构的列表或数组,也就是元素类型都得相同

建议属性(值得键)用小驼峰,如firstName5

更多命名习惯,请看 Naming rules and recommendations - Neo4j Cypher Manual

模式 Schema

在 Neo4j 中模式指的是索引和约束。

Neo4j 的模式是可选的,意味着没必要创建索引和约束,你可以直接创建数据。

当然你也可以创建索引和约束来提升性能或是建模所带来的好处。

索引 Index

索引用于提升性能。主要就是用来找到遍历的起始点6

一旦起始点找到了,遍历就依赖图的结构而能取得高性能。

索引可以在任何时候添加。

CREATE INDEX example_index_1 FOR (a:Actor) ON (a.name)

在大多数情况下,查询的时候不必指定索引,因为会自动选用合适的索引。

例如下面的语句将使用上面的索引:

MATCH (actor:Actor {name: 'Tom Hanks'})
RETURN actor

也存在复合索引:

CREATE INDEX example_index_2 FOR (a:Actor) ON (a.name, a.born)

查询有哪些索引:

SHOW INDEXES YIELD name, labelsOrTypes, properties, type
Rows: 2

+----------------------------------------------------------------+
| name              | labelsOrTypes | properties       | type    |
+----------------------------------------------------------------+
| 'example_index_1' | ['Actor']     | ['name']         | 'BTREE' |
| 'example_index_2' | ['Actor']     | ['name', 'born'] | 'BTREE' |
+----------------------------------------------------------------+

约束 Constraint

约束用来保证数据是遵守了域的规则的。

例如唯一性约束:

CREATE CONSTRAINT constraint_example_1 FOR (movie:Movie) REQUIRE movie.title IS UNIQUE

约束可以在已有数据上添加,但要保证这些已有数据是服从这个约束的。

查询有哪些约束:

SHOW CONSTRAINTS YIELD id, name, type, entityType, labelsOrTypes, properties, ownedIndexId
Rows: 1

+----------------------------------------------------------------------------+
| id | name | type  | entityType | labelsOrTypes | properties | ownedIndexId |
+----------------------------------------------------------------------------+
|4| 'constraint_example_1' | 'UNIQUENESS' | 'NODE' | ['Movie']| ['title']| 3 |
+----------------------------------------------------------------------------+

这个唯一性约束所有版本都支持,其他约束得在企业版中才能支持。