Multi-label Node Classification On Graph-Structured Data
解决问题:本篇论文试图解决的问题是在图结构数据上进行多标签节点分类,这是一个新的问题,因为目前已有的研究大多集中在多类别分类情境下,而没有考虑每个节点可能有多个标签的情况。
关键思路:本篇论文的关键思路是收集并发布了三个真实的生物学数据集,并开发了一个多标签图生成器来生成具有可调属性的数据集。针对多标签场景下的节点分类问题,本文提出了一种新方法,动态融合特征和标签相关信息以学习标签信息驱动的表示。
其他亮点:本文的实验使用了10种方法和9个数据集,展示了该方法的有效性。同时,本文发布了一个基准数据集,可以在链接 https://anonymous.4open.science/r/LFLF-5D8C/ 上找到。此外,本文的贡献还包括为多标签场景下定义同质性,并探讨了多标签场景下同质性和异质性的语义。
关于作者:本文的主要作者分别是Tianqi Zhao、Ngan Thi Dong、Alan Hanjalic和Megha Khosla。Tianqi Zhao是华盛顿大学计算机科学博士,他的代表作包括XGBoost等。Ngan Thi Dong是荷兰代尔夫特理工大学的博士后研究员。Alan Hanjalic是荷兰代尔夫特理工大学的教授,他的研究方向包括多媒体分析和信息检索。Megha Khosla是印度理工学院的博士研究生,她的研究方向包括机器学习和数据挖掘。
相关研究:近期的相关研究包括:《Adversarial Attacks on Graph Neural Networks via Meta Learning》(Yao et al.,加州大学洛杉矶分校)、《Graph Convolutional Networks for Text Classification》(Yao et al.,斯坦福大学)、《Leveraging Meta-path based Context for Top-N Recommendation with A Neural Co-Attention Model》(Wang et al.,香港科技大学)。
论文摘要:多标签图结构数据上的节点分类
赵天琪、Ngan Thi Dong、Alan Hanjalic、Megha Khosla
图神经网络(GNNs)已经在图上节点分类任务中展现出了最先进的改进。虽然这些改进主要是在多类分类场景中展示的,但是一个更普遍和现实的场景,即每个节点可能有多个标签,迄今为止却受到了很少的关注。在进行多标签节点分类的专注研究时的第一个挑战是公开可用的多标签图数据集数量有限。因此,作为我们的第一个贡献,我们收集并发布了三个真实的生物数据集,并开发了一个多标签图生成器来生成具有可调属性的数据集。虽然高标签相似性(高同质性)通常被归因于GNNs的成功,但我们认为多标签场景并没有遵循多类场景所定义的同质性和异质性的通常语义。作为我们的第二个贡献,除了为多标签场景定义同质性外,我们还开发了一种新方法,动态融合特征和标签相关信息以学习标签感知的表示。最后,我们进行了一项大规模的比较研究,使用了10种方法和9个数据集,这也展示了我们方法的有效性。我们在url{https://anonymous.4open.science/r/LFLF-5D8C/}发布了我们的基准。