分类目录归档:斯坦福CS224W 图机器学习 | Digital Garden

分类目录归档：斯坦福CS224W 图机器学习

CS224W 图机器学习11：基于 GNN 的推荐

发表评论

1055 views

1 推荐系统的任务与评价
2 推荐系统的损失函数
3 NGCF 神经图协同过滤
4 LightGCN 轻量版 NGCF
5 PinSAGE 大规模图的推荐

1 推荐系统的任务与评价

推荐系统可以建模为二分图（bipartite graph）

具有两种类型的节点——用户（user）和项（item）
边用于连接用户和项，表示二者间的互动（比如点击、购买或评论）

任务：给定历史图，预测每个用户未来将产生的交互项（链接预测问题）

前置知识：推荐排序模型评价指标

基于嵌入表示的推荐系统建模思路

对于每一个用户 $u$，基于编码器生成对应的用户嵌入表示
对于每一个可交互项 $v$，基于编码器

CS224W 图机器学习10：子图的匹配和计数

发表评论

1934 views

1 神经网络子图
2 子图模式 Motifs
3 子图的重要性度量
4 子图嵌入表示和匹配
5 顺序嵌入 GNN 的训练
6 SPMiner：频繁子图的挖掘

1 神经网络子图

子图（subgraphs）是构建图的基础块，能够描述和区分图网络

给定图 $G=(V,E)$，可以给出 2 种方式定义子图 $G'=(V',E')$

子图的定义方式 1：节点诱导子图（Node-induced subgraph）

从图 $G$ 的节点集合中筛选子集来构建子图，$V'\subseteq V$
然后从图 $G$ 的边集合中筛选子图所有节点的对应边，$E'={(u,v)\in E|u,v\in V'}

CS224W 图机器学习09：知识图的推理

发表评论

1035 views

1 推理的类型
2 知识图的路径查询
3 联合查询的基本概念
4 Query2box 联合查询
5 联合查询中的交集操作
6 联合查询中的并集操作
7 Query2box 的训练

本小节的示例均围绕以下知识图展开：

该示例数据描述了疾病、药物、不良事件和蛋白质之间的相互关系

1 推理的类型

常见的三种知识图推理类型：

单跳查询（one-hop queries），从起始节点经过一条边是否可以达到终止节点，即预测两个节点之间是否有边连接（示例：Fluvestrant 这种药物可能导致哪些不良反应？）
路径查询（path queries），从起始节点经过 n 条边是否可以达到终止节

CS224W 图机器学习08：知识图的学习

发表评论

860 views

1 知识图基本介绍
2 知识图嵌入表示
3 知识图嵌入表示：TransE
4 知识图嵌入表示：TransR
5 知识图嵌入表示：DistMult
6 知识图嵌入表示：CompIEx

1 知识图基本介绍

知识图（Knowledge graph）：以图的形式存储知识

节点表示实体（entitles），节点的标签可以是实体类型
节点之间的边表示两个实体之间的关系
所以知识图是异构图的一种特殊情况

知识图示例：生物知识图（蛋白质/药物/疾病/不良事件）

知识图应用：信息检索服务、问答和对话

常见的开源 KG ：知识图数据资源

这类知识图一般是百万级别的，存在很多边的缺失（考虑补齐）

比

CS224W 图机器学习07：异构图的学习

发表评论

2735 views

1 异构图的定义与理解
2 RGCN：异构图版 GCN
3 HGT：异构图版 GAT
4 异构图总结

1 异构图的定义与理解

异构图（Heterogeneous Graph），存在不同类型的节点和边

即节点和边至少有一个具有多种类型，常见于知识图谱的场景

举例：引文网络

节点的类型可以是作者（Author）或文章（Paper）
边的类型可以是引用（Cite）或类似（Like）

从异构图到标准图：

可以将节点和边的类型视为 one-hot 形式的特征，以此区分类型
比如将特征 [1, 0] 附加到每个“作者节点”；将特征 [0, 1] 附加到每个“纸节点”
但该方法不适用于不同类

CS224W 图机器学习06：GNN 的理论理解

发表评论

1193 views

1 计算图与邻域信息
2 GNN 的模型表达能力
3 已有模型的表达能力局限
4 图同构网络 GIN
5 补充：图训练技巧

1 计算图与邻域信息

关键问题：GNN 节点嵌入能否区分不同节点的局部邻域结构？

GNN 通过邻域定义的计算图生成节点嵌入：

节点 1 和节点 5，因其度数不同而具有不同的邻域结构信息
节点 1 和节点 2，具有相同的邻域结构信息；二者在图中是对称的
节点 1 和节点 4，其 2 跳邻居的信息存在差异（邻居的度不同）

由于 GNN 主要依赖节点特征，而不考虑节点 ID

因此 GNN 无法区分位置同构的节点（节点 1 和节点 2）

2 GNN 的模型表达能力

CS224W 图机器学习05：GNN 的训练与预测

发表评论

1401 views

1 GNN 的预测
2 GNN 的标签
3 GNN 的损失函数
4 GNN 的评价指标

图训练的完整 Pipeline：

1 GNN 的预测

不同的任务级别需要不同的预测头（Prediction head）

节点（node-level）级预测：直接使用 $d$ 维的节点嵌入 $h_v^{(L)}$ 进行预测

$$ \widehat{\boldsymbol{y}}_v=\mathrm{Head}_{\mathrm{node}}(\mathbf{h}_v^{(L)})=\mathbf{W}^{(H)}\mathbf{h}_v^{(L)} $$

边（edge-level）级预测：使用

CS224W 图机器学习04：GNN 深入理解

发表评论

1258 views

1 单层图神经网络
2 经典 GNN 层之 GCN
3 经典 GNN 层之 GraphSAGE
4 经典 GNN 层之 GAT
5 GNN 实践技巧
6 图的扩展与增强

1 单层图神经网络

图神经网络（GNN）的通用框架：

可以发现，GNN 层的输入为一组向量，输出为单个向量
所以单层 GNN 的核心过程在于邻域信息的转换（1）和聚合（2）
在转换和聚合邻域信息时，还要注意考虑节点本身的信息保留

所以单层 GNN 的计算过程可表示如下： $$ \begin{aligned} \mathbf{m}_u^{(l)}&=\mathrm{MSG}^{(l)}\left(\math

CS224W 图机器学习03：图神经网络

发表评论

1400 views

1 深度学习基础
2 图神经网络的难点
3 图神经网络入门
4 训练图神经网络
5 对比传统神经网络

1 深度学习基础

损失函数、梯度下降法族、基础神经元、卷积神经网络

2 图神经网络的难点

图数据的复杂性：

存在任意大小和复杂的拓扑结构（不存在网格那样的空间局部性）
没有固定的节点顺序或参考点；通常是动态的并且具有多模式特征

直接将邻接矩阵或节点特征输入到传统神经网络的问题：

$O(|V|)$ 级参数量，难以适用节点数较多的网络
无法适用不同尺寸的图/网络，传统网络对节点顺序敏感

置换不变性 vs 置换等价性

如果 $f(T(x))=f(x)$，则函数 $f(x)$ 对

CS224W 图机器学习02：图嵌入表示

发表评论

1274 views

1 图嵌入表示
2 编码与解码
3 基于随机游走的节点嵌入
4 节点嵌入的目标函数
5 随机游走策略的改进
6 整图的嵌入表示
7 矩阵分解与嵌入表示
8 嵌入表示的应用与局限性
课外拓展与代码练习

1 图嵌入表示

传统图机器学习 VS 图表示学习

给定输入图，传统图机器学习需要提取节点、链接和图级特征；然后学习将特征映射到/预测标签的模型（SVM、普通神经网络等），并应用于下游任务
图表示学习则不需要额外特征工程，而是给定输入图，自动学习独立于任务的特征（节点、链接和图级嵌入表示），然后用于算法的训练学习和下游任务

嵌入表示的好处：

节点间嵌入的相似性表明了它们在网络中的相似性

个人笔记

Digital Garden | 王半仙

1 推荐系统的任务与评价

1 神经网络子图

1 推理的类型

1 知识图基本介绍

1 异构图的定义与理解

1 计算图与邻域信息

2 GNN 的模型表达能力

1 GNN 的预测

1 单层图神经网络

1 深度学习基础

2 图神经网络的难点

1 图嵌入表示