GraphSAGE图神经网络算法详解
其实无论是哪种用途,需要注意的是图本身,我们还是主要用它来完成 embedding 的操作。也就是得到一个节点的 embedding 后比较有效的 feature vector。那么做无监督时,如何知道它的 embedding 结果是对是错呢? 作者选择了一个很容易理解的思路,就是邻居的关系。默认当两个节点距离相近时,就会让它们的 embedding 结果比较相似,如果距离远,那 embedding 的结果自然应该区别较大。这样一来下面的损失函数就很容易理解了: z_v 表示是目标节点 u 的邻居,而 v_n 则表示不是,P_n(v) 是负样本的分布,Q 是负样本的数量。 那么现在剩下唯一的问题就是邻居怎么定义? 作者选择了一个很简单的思路:直接使用 DeepWalk 进行随机游走,步长为 5,测试 50 次,走得到的都是邻居。 总结 实验结果我们就不展示了,其实可以看到作者在很多地方都用了一些比较 baseline 的思路,大家可以在对应的地方进行更换和调整,以适应自己的业务需求。 后面我们也会继续分享 GNN 和 embedding 方面比较经典和启发性的一些 paper,欢迎大家持续关注~~~
(编辑:应用网_阳江站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |