# 知识图谱

# 安装 neo4j 图数据库

jdk 版本只支持 11，需要到系统环境变量中去改（现在已经改至 11）

# 启动 neo4j

在 neo4j 解压的文件夹的 bin 文件夹下，打开 cmd
安装 / 卸载服务（cmd 命令）：

# 安装
neo4j install-service
# 卸载
neo4j uninstall-service
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30

4.  启动服务：neo4j.bat console。

5. 浏览器打开：[http://localhost:7474/](https://link.zhihu.com/?target=http%3A//localhost%3A7474/)，默认账号和密码均为：neo4j。首次登录会提醒修改密码

6. 常见命令：如开始服务、停止服务、重启服务、安装、卸载、更新等。
   Usage: neo4j { console | start | stop | restart | status | install-service | uninstall-service | update-service } < -Verbose >

## 知识图谱基础知识

1. 存储信息在节点和关系中的
2. 每个节点和关系都可以有属性、键值对
3. 节点可以被赋予标签以帮助将它们分组在一起
4. 关系始终有类型和方向

![image-20241220202343473](https://cdn.jsdelivr.net/gh/Aura-HY/blogImage@main/img/image-20241220202343473.png)

LangChain

## 查询知识图谱

### Querying the movie knowledge graph

取一个Python中的多行字符串，赋值给cypher

```python
cypher=""""
	MATCH(n)  #匹配子句，模式匹配，可以寻找的最小模式匹配是一个单节点模式·将结果赋值给n
	RETURN count(n) As numberOfNodes #返回这些节点的个数
""""

要运行查询本身，就要利用之前设置好的 LangChain 集成

1 2	result = kg.query(cypher) result ===>[{'numberOfNodes':171}]

cypher=""""
	MATCH(m:movie)  //寻找一个标签是电影的
	RETURN count(m) As numberOfMovie 
""""

kg.query(cypher)

cypher=""""
	MATCH(tom:Person {name:"Tom Hanks"})  //寻找一个标签是人的，名字属性是"Tom Hanks"的
	RETURN tom
""""

kg,query(cypher)

# 为 RAG 准备文本

from dotenv import load_dotenv
import os

from langchain_community.graphs import Neo4jGraph

# Load from enviroment
load_dotenv('../.env.studiomac',override=Ture)
NEO4J_URI = os.getenv('NEO4J_URI')
NEO4J_USERNAME = os.getenv('NEO4J_USERNAME')
NEO4J_PASSWORD = os.getenv('NEO4J_PASSWORD')
NEO4J_DATABASE = os.getenv('NEO4J_DATABASE') 
OPENAI_API_KEY = os.getenv('OPENAI_API_KEY')

# 创建与知识图的连接，以便发送一些查询
kg = Neo4jGraph(
	url=NEO4J_URI,username=USERNAME,password=PASSWORD,database=DATABASE
)

启用向量搜索的第一步是创建一个向量索引

要关注的是 OPTIONS 部分中向量的索引有多大，维度有多大（这里是 OpenAI 嵌入模型的默认大小）

还有相似函数

1	question = "What movies are about adenture？"

kg.query("""
	WITH ganai.vector.encode(
		$question,
		"OpenAI",
		{token:$openAiApiKey}) AS question_embedding
	CALL db.index.vector.queryNodes(
		'movie_tagline_embeddings',
		$top_k,
		quesion_embedding
		) YIELD node AS movie,score
	RETURN movie.title,movie.tagline,score
""",
params={"openAiApiKey":OPENAI_API_KEY,
		"question":quesion,
		"top_k":5
		})

WITH 用于将前一句的结果传递给下一句，并且可以在这个过程中进行计算或过滤。
ganai.vector.encode : 这是一个自定义的函数调用，可能是通过扩展或插件添加到图数据库中的。它接受三个参数
AS question_embedding : 将 ganai.vector.encode 函数返回的结果（即问题的向量表示）赋值给一个新的变量 question_embedding
CALL : 调用一个过程或函数
'movie_tagline_embeddings' : 指定要查询的向量索引名称，这里是指包含电影标语嵌入的索引。
question_embedding : 使用之前生成的问题嵌入作为查询条件。
YIELD 关键字用于从被调用的过程中提取结果。
node 是查询返回的节点，我们将其重命名为 movie
score 是匹配度得分，表示查询向量与节点向量之间的相似度