LLM+Graph,让大模型学会图表示学习!

1,243次阅读
没有评论

LLM+Graph,让大模型学会图表示学习!

大模型时代,图学习的发展方向是什么?

过去一年图学习领域有哪些值得盘点的技术

在复杂图分析、大规模数据处理、推荐、风控等领域的应用有哪些进展?2024年1月27日,DataFun将邀请行业专家学者共同分享机器学习的年度进展以及在复杂图分析、大规模数据处理、推荐、风控等领域的应用实践探索。LLM+Graph,让大模型学会图表示学习!

议题详情

LLM+Graph,让大模型学会图表示学习!

00

LLM+Graph,让大模型学会图表示学习!

主论坛

LLM+Graph,让大模型学会图表示学习!

出品人:吴凌飞 AnytimeAI,CEO&联合创始人

个人介绍:吴凌飞博士,毕业于公立常春藤盟校之一的威廉与玛丽学院 计算机系。他的主要研究方向是机器学习,表征学习,和自然语言处理的有机结合,特别是图神经网络及其应用。目前他是AnytimeAI的CEO&联合创始人。在这之前,他是京东硅谷研究中心的首席科学家,带领 了30 多名机器学习/自然语言处理科学家和软件工程师组成的团队,构建智能电子商务个性化系统。他目前著有图神经网络图书一本,并发表了100多篇顶级会议和期刊的论文,谷歌学术引用将近3000次(H-index 28, I10-index 68)。他主持开发的Graph4NLP软件包,自2021年中发布以来收获1500+ Stars,180+ Forks,深受学术界和工业界欢迎。他曾是 IBM Thomas J. Watson 研究中心的高级研究员,并领导10 多名研究科学家团队开发前沿的图神经网络方法和系统,三次获得IBM杰出技术贡献奖。他是 40 多项美国专利的共同发明人,凭借其专利的高商业价值,共获得八项IBM发明成果奖,并被任命为 IBM 2020 级发明大师。他带领团队获得两个2022年AAAI人工智能创新应用奖(全球八个), IEEE ICC’19, DLGMA’20, DLG’19等多个会议和研讨会的最佳论文奖和最佳学生论文奖。他的研究被全球众多中英文媒体广泛报道,包括 NatureNews, YahooNews, AP News, PR Newswire, The Time Weekly, Venturebeat, 新智元,机器之心,AI科技评论等。他是KDD,AAAI,IEEE BigData会议组委会委员,并开创和担任全球图深度学习研讨会(与 AAAI20-22 和KDD20-22等联合举办)和图深度学习自然语言处理研讨会(与 ICLR22 和NAACL22等联合举办)的联合主席。他目前担任IEEE Transactions on Neural Networks and Learning Systems 和ACM Transactions on Knowledge Discovery from Data的副主编,并定期担任主要的 AI/ML/NLP 会议包括 KDD,EMNLP, IJCAI,AAAI等的SPC/AC。

石川 北京邮电大学 教授

个人介绍:石川 北京邮电大学计算机学院教授、博士研究生导师、智能通信软件与多媒体北京市重点实验室副主任。主要研究方向: 数据挖掘、机器学习、人工智能和大数据分析。近5年以第一作者或通讯作者在CCF A类期刊和会议发表论文60余篇,中英文专著五部,谷歌学术引用过万,连续入选爱思唯尔高被引学者;授权发明专利30余项,相关研究成果应用于阿里、蚂蚁、腾讯、华为、美团等公司。研究成果获得中国电子学会科技进步一等奖和北京市科学技术奖自然科学二等奖等奖励。

演讲题目:图基础模型初探

演讲提纲:近年来,将神经网络应用到图数据,形成了图神经网络(即图学习)的研究热潮。图学习不仅成为人工智能的热点技术方向,而且广泛应用在电商、生物医药等众多领域。随着以ChatGPT为代表的大规模语言模型表现出通用人工智能的潜力,大语言模型改变了很多领域(如自然语言处理,计算机视觉)的研究范式,同样也对图学习方向的研究产生影响。本报告介绍面向大模型的图学习新范式,图基础模型,的概念、相关工作和我们在该方向的初步探索。

听众收益:

1. 大模型对图机器学习的影响

2. 如何利用大模型解决图的问题

3. 现有工作的进展

陈红阳之江实验室 图计算研究中心副主任

个人介绍:陈红阳,2011年于东京大学获博士学位,曾任日本富士通研究所研究员,现任之江实验室图计算研究中心副主任/高级研究专家(正高级研究员),主要从事大数据与人工智能,数据驱动智能系统方向的研究。曾担任多个IEEE知名期刊编辑和IEEE国际会议领域主席等学术职位。主持国家重点研发课题、国自然基金面上项目等。发表ACM/IEEE期刊和CCF-A类会议论文80多篇。在ICT领域拥有30余项国际专利,多项专利被采纳成为国际标准。获IEEE PIMRC2009国际会议最佳论文奖,ICDM2023最佳学生论文奖,OGB图机器学习挑战赛全球冠军,2020年当选IEEE Distinguished Lecturer,获评“2022年中国智能计算科技创新人物”和2023“算力中国”青年先锋人物。

演讲题目:图计算加速科学发现

演讲提纲:在科学计算领域,图计算技术可以启动很重要的作用。通过图计算,在生物制药,进行药物分子生成、药物性质预测、靶点发现等,已经展示出很好的潜力。本报告介绍图计算相关成果,及与科学计算结合的应用案例。并介绍通过软硬件协同优化,图计算可以是加速科学发现的重要手段。

LLM+Graph,让大模型学会图表示学习!

扫码免费报名观看

01

LLM+Graph,让大模型学会图表示学习!

复杂图分析论坛

LLM+Graph,让大模型学会图表示学习!

出品人:杜仑 微软 主管研究员

个人介绍:杜仑,目前是微软DKI组主管研究员,主要研究方向包括图深度学习、表格分析智能、以及它们和大语言学模型结合的相关研究。目前已发表学术会议和期刊论文60余篇,其中包括两篇获奖文章,荣获了Best Research Paper Runner-UP Award (CIKM’19)以及Best Short Paper Award (CIKM’21),曾担任KDD, ICML, NeurIPS, WWW等多个顶级学术会议的PC或SPC,并荣获NeurIPS’22 Top Reviewer称号。曾带领队伍在WSDM’22和NeurIPS’22两次不同场景的链接预测问题上都收获亚军。在加入微软亚洲研究院前,2019年他硕士毕业于北京大学智能科学系。

毕文东 腾讯 研究员

个人介绍:腾讯算法研究员,主要研究方向为图神经网络、社交网络挖掘,中科院计算所硕士,本科毕业于上海交通大学,曾获国奖、北京市优秀毕业生,一作论文发表在KDD、WWW、CIKM、WSDM等学术会议。

演讲题目:复杂图上的图迁移学习

演讲提纲:迁移学习被广泛应用于缓解数据稀疏、噪声等问题,图迁移学习成为近期的研究热点。复杂图的异质性、异配性、不均衡等问题为图上的知识迁移带来了全新的挑战,本次分享将围绕图上的节点知识迁移展开,并介绍复杂图上的图重连算法、及图重连增强的图迁移学习方法,相关成果已发表在WWW2023、CIKM2023等学术会议。

听众收益:

1. 复杂图上如何实现迁移学习

2. 复杂图上如何实现高效图重连

3. 图重连增强的图迁移学习

何东晓 天津大学 教授

个人介绍:何东晓,天津大学智能与计算学部教授、博士生导师。主要从事图数据挖掘和图机器学习研究,主持国家自然科学基金项目3项(含面上项目2项),国家重点研发课题1项。在人工智能、机器学习和数据挖掘领域的顶刊或顶会上发表论文50余篇,其中一作或通讯发表CCF A类期刊或会议长文20余篇,谷歌引用超2700次,H因子30。以通讯作者指导学生获数据挖掘顶会ICDM21最佳学生论文奖亚军(4/990),一作获全国社会媒体处理大会SMP2022最佳论文奖,一作获《自动化学报》年度优秀论文奖;入选百度学术AI华人女性青年学者(全球80名)入选、天津市131人才。

演讲题目:真实复杂场景下图神经网络

演讲提纲:当前图神经网络在处理真实复杂图数据的时候存在“同质性限制”、过平滑以及标签难获得的问题,本报告针对这些问题介绍基于生成对抗模型设计的对抗表征机制而非传统的对抗表征结果的无监督图表征学习算法;针对图神经网络“同质性限制”的问题,介绍基于块建模对邻域信息进行分类传播聚合的新型图神经网络传播聚合机制,该新机制图神经网络在同配和异配网络上均取得较好的效果;针对图神经网络过平滑的问题,介绍由类别区分度引导的深层图神经网络,通过层间过滤、初始补偿以及全局优化等三阶段生成具备区分不同类别能力的节点表征;针对图数据标签难获得的问题,介绍自监督下利用自适应边同质性判别机制同时解决对比学习无增强场景中采样问题和编码器异质信息传播问题,使自监督编码器在同异配数据集均能获取较好的表征。

听众收益:

1. 如何突破图神经网络的“同质性限制”?

2. 图神经网络如何可以做到深层?

3. 图神经网络如何做成无监督模型?

杨亮 河北工业大学 人工智能与数据科学学院 副院长、教授、博士生导师

个人介绍:杨亮,河北工业大学人工智能与数据科学学院教授、博士生导师、河北省大数据技术重点实验室副主任、校学术委员会委员。分别于2004年和2007年在南开大学数学科学学院获得理学学士和硕士学位,于2016在中国科学院信息工程研究所信息安全国家重点实验室获得工学博士学位。他有着丰富的工业界经验,先后就职于腾讯数据平台部,百度商务搜索部。他的研究集中于复杂网络分析,主要包括社区发现、网络嵌入、图神经网络等主题。他在包括NeurIPS、WWW、AAAI、IJCAI、ACM MM、ECCV、ICDM、IEEE T-Cyber、IEEE TIP、ACM TOMM等重要国际会议和期刊上发表多篇论文;并在2021年WWW上荣获最佳论文亚军(Best Paper Runner-up)。

演讲题目:From Propagation to Ego-network Modeling in GNNs

听众收益:

1. 图神经网络底层建模

2. 图自监督学习的本质探索

3. 图神经网络的底层原理

裴红斌 西安交通大学 网安学院 助理教授

个人介绍:裴红斌,西安交通大学网安学院助理教授,研究方向为复杂网络表示学习,在TPAMI、NeurIPS、ICLR等国际顶级刊物发表论文20余篇,入选国家博新计划,主持国家基金委青年基金,获得吉林省自然科学一等奖。他发表在ICLR’20上的论文引发了新的研究热点——异配图表示学习,该文Google学术引用已超800次;他将复杂网络理论研究落地到疟疾主动监控系统中,在云缅边境的疟疾防控中取得了显著的应用效果。

演讲题目:嵌入物理空间的坐标图学习:从分子到城市

演讲提纲:网络广泛存在于真实世界中,且往往与真实物理空间紧密相连。以蛋白质的分子图为例,它不仅是由原子与化学键构成的分子图,也嵌入在三维空间中,而城市地面交通网络则展开在二维的地球表面。为表示这些嵌入物理空间的网络,我们提出了“坐标图”的概念。坐标图中,节点代表空间中的实体,边代表实体间的非欧交互与联系;同时,节点和边带有物理坐标,指示空间中所处位置。如何感知坐标图的空间结构对图表示学习带来了新的挑战与机遇。

听众收益:

1. 什么是嵌入物理空间的坐标图?

2. 如何表示嵌入物理空间的坐标图?

3. 表示嵌入物理空间的坐标图有什么用?

李朝卓 微软 主管研究员

个人介绍:李朝卓,微软亚洲研究院社会计算组主管研究员,20年毕业于北京航空航天大学获得博士学位。主要研究方向:数据挖掘、自然语言处理和图表示学习。近5年在NeurIPS, WWW和 SIGIR等知名会议或期刊上发表论文70余篇,先后获得WSDM 2023、PAKDD 2023最佳论文提名奖。相关研究成果应用于Bing搜索等业务产品中。

演讲题目:文本图上的表示学习及应用

演讲提纲:近年来,图神经网络获得了蓬勃的发展,并被广泛的应用于各种场景中。然而,在工业界应用中,纯粹的图拓扑结构是很少存在的,更为常见的是文本图(Textual Attributed Graph)。这类图中的节点中包含了大量且丰富的文本信息,与拓扑结构互为补充和增强。本报告将探索如何在文本图上学习合适的节点表示,并来提升工业界真实业务的效果。

听众收益:

1. 图中节点属性和拓扑结构之间的关系;

2. 属性图上的表示学习;

3. GNN的实用性

LLM+Graph,让大模型学会图表示学习!

扫码免费报名观看

02

LLM+Graph,让大模型学会图表示学习!

大规模图学习论坛

LLM+Graph,让大模型学会图表示学习!

出品人:姚亮 腾讯 高级研究员

个人介绍:姚亮,现任腾讯高级研究员,博士毕业于浙江大学,曾在美国西北大学任博士后研究员。以第一作者在AAAI、SIGIR、TKDE等顶级会议及期刊发表论文多篇,谷歌学术H指数21,入选全球前2%顶尖科学家、AI 2000人工智能全球最具影响力学者。现在腾讯游戏从事图学习、大语言模型相关的研究和落地。

演讲题目 :腾讯游戏大规模图学习研究与落地

演讲提纲:

1. 大规模图学习算法 PB-GNN

2. 链路预测算法的研究与应用落地

3. 图预训练算法

听众收益:熟悉大规模图学习算法,链路预测算法,图预训练算法。


曾立 华为 数据智能计算专家

个人介绍:本科和博士毕业于北京大学计算机科学技术专业,在图处理领域有九年多的实践经验,主导研发过图数据库系统gStore、电信图查询引擎、分布式图学习加速组件,将亿级电信网络的图查询和图学习性能提升至行业标杆TigerGraph和DGL的2倍以上,内存占用降低一半。当前负责图技术探索及大模型全栈加速。

演讲题目:电信网络中的图学习性能优化

演讲提纲:网络运维和体验是电信领域的重要业务,其中高效精准的故障根因定位是保障网络性能持续领先的关键,而以用户为中心的产商品推荐是实现5G用户发展的重要策略。通过将网络域、业务域、社会域数据建模成图,并通过图学习进行深度分析和挖掘隐性关联,可以更好地实现故障定位和产商品推荐。由于电信网络高达百亿边万亿属性,以及客户资源受限、数据安全等约束,图学习的性能和成本存在巨大挑战,需在分布式集群中实现倍数提升。

听众收益:

1. 客户集群复杂异构、内存有限,如何既快又好地完成超大电信网络的子图分割?

2. 训练时图表征更新频繁,跨机通信代价高昂,如何设计合适的分布式图索引?

3. 原始数据须从HDFS加载,面对加载解析及图构建代价高的问题,如何系统优化?

汤嘉斌 香港大学 博士研究生

个人介绍:香港大学一年级博士生, 导师为黄超老师,研究方向为图神经网络,大语言模型,时空数据挖掘。其工作曾发表在CIKM,WSDM等会议上,并且担任TNNLS期刊审稿人。开源项目GraphGPT的主要贡献者。

演讲题目:GraphGPT: Graph Instruction Tuning for Large Language Model

演讲提纲:论文首先提出了一个叫GraphGPT的框架,目标是通过规范化的图指导调教范式,将图结构知识与大语言模型的语言理解能力实现有效对齐。框架的亮点包含:

1. 提出双阶段图指导调教范式,依次进行自监督图匹配任务调教和下游任务特定调教,使LLM逐步掌握图结构知识。

2. 设计轻量级图文对齐投影器,将编码后的图表示映射为图令牌,注入结构信息。

3. 基于对比的图文对齐机制,将图表示对齐到语言空间。

4. 引入链条思维知识蒸馏,增强模型的逐步推理能力。 实验结果显示,该框架在多个图学习任务上都优于其他SOTA方法,展现了极佳的泛化能力!

听众收益:

1. 如何将大语言模型和图数据结合

2. 如何让大语言模型理解图结构

3. 图模型可不可以进行zero-shot 学习

LLM+Graph,让大模型学会图表示学习!

扫码免费报名观看

03

LLM+Graph,让大模型学会图表示学习!

图与推荐论坛

LLM+Graph,让大模型学会图表示学习!出品人:纪厚业 京东集团博士管培生,京东推荐视频/直播召回负责人

个人介绍:纪厚业博士,京东集团博士管培生,京东推荐视频/直播召回负责人,主要关注图神经网络和推荐系统,在 WWW / AAAI / TKDE / TOIS / ICDM / EMNLP / MM等顶级会议/期刊发表论文10+篇并担任相应的审稿人,引用2100+,荣获WebConf最有影响力论文(2019),WebConf best paper nomination(2021), 世界人工智能大会青年优秀论文提名奖(2022)。曾在中科院自动化所/字节/淘宝/蚂蚁金服/达摩院/华为/京东/腾讯分享图与推荐技术。孙庆赟 北京航空航天大学计算机学院 助理教授

个人介绍:孙庆赟,博士,北京航空航天大学计算机学院助理教授。主要研究方向为图机器学习、网络空间大数据分析,已在 TPAMI、TKDE、NeurIPS、WWW、AAAI 等国际权威学术期刊和顶级会议发表多篇学术论文,获国际服务质量顶级会议 IWQoS 2022 唯一最佳论文奖、国际数据挖掘顶级会议 CIKM 2022 最佳论文提名奖、ICDM 2021 最佳论文候选,工作入选 WWW 最具影响力论文、WWW 2023热点论文;获2023年ACM北京优博、2022年北京市大数据与脑机智能高精尖创新中心卓越研究奖等;担任国际著名期刊 TKDE、TNNLS、TWEB、TMM、PR、NN、JMLC、JCST 和国际顶级会议 NeurIPS、ICLR、AAAI、IJCAI、WWW、KDD、ICDM 审稿人。

演讲题目:动态推荐场景下的图学习

演讲提纲:本次报告针对动态图推荐场景下常面临的数据拓扑不均衡、时空分布偏移以及海量历史信息难利用问题,分别介绍位置感知的图结构学习方法、动态图分布外泛化方法以及大规模图数据的极致压缩方法。相关工作发表在NeurIPS 2023、WWW 2023、CIKM 2022上,并获得CIKM 2022最佳论文提名奖以及WWW 2023热点论文。

听众收益:

1. 如何缓解图推荐面临的拓扑不均衡问题?

2. 如何实现动态推荐场景面临的图数据分布外泛化?

3. 如何从海量历史数据中有效提取图结构知识?

LLM+Graph,让大模型学会图表示学习!

扫码免费报名观看

04

LLM+Graph,让大模型学会图表示学习!

图与风控论坛

LLM+Graph,让大模型学会图表示学习!

出品人:徐德华 翼支付 风险管理部总监

个人介绍:风险管理部总监,模型团队负责人,负责支付、电商、金融、通讯反诈等风控模型体系建设。

李祥 度小满 数据智能应用部 图机器学习负责人

个人介绍:博士毕业于中科院信息安全国家重点实验室,期间主要研究社交网络数据挖掘相关方向。加入度小满后,长期从事图机器学习方向的技术创新和业务落地,主导迭代了多版基于征信报告的图风控模型,并在实际业务中有效提升了风控能力。

演讲题目:图机器学习在度小满风控中的探索和实践

演讲提纲:

图机器学习是近几年较为热门的研究方向,同时,金融风控是图机器学习技术落地较为热门也较为成熟的业务场景。度小满在图风控上已经进行了长时间的探索、创新和落地,建设了完善的数据、模型和应用体系,最终在实际业务中证明了图机器学习技术在风控场景中的潜力和价值。

听众收益:

1、图机器学习的发展历史和应用现状

2、图机器学习和金融风控

3、度小满图风控能力建设

陈曦 蚂蚁集团 技术应用开发

个人介绍:复旦大学硕士毕业,在蚂蚁集团主要负责图领域技术应用,致力于应用图挖掘技术解决风险管理业务中的实际难题,推动风管技术的创新与效率提升。

演讲题目:图技术在金融反欺诈中的应用

演讲提纲:

在金融反欺诈的实践中,图技术发挥着至关重要的作用。通过构建客户、账户、交易等实体的关系图谱,我们能够有效地揭示隐藏在庞大数据背后的欺诈行为。本次演讲将通过图在蚂蚁风控中的真实案例,展示图技术在揭示复杂网络中的欺诈行为、加强风险控制、提高风险识别效率等方面的巨大潜力,以及当前图技术在金融反欺诈中面临的挑战和未来的发展趋势。具体包括:

1. 图在金融反欺诈中的应用背景

2. 图驱动的感知研判决策处置

3. 图在金融反欺诈中的演进

4. 图在金融反欺诈中的总结与展望

听众收益:

1. 图技术如何被实际应用于金融反欺诈工作

2. 图在反欺诈中如何提供对数据的深度洞见,以加强数据驱动的决策过程

3. 如何利用图技术来发现复杂的欺诈模式

4. 图技术在反欺诈中的演进过程是怎样的

5. 未来图在反欺诈中如何发展

张梦玫 翼支付 高级技术专家

个人介绍:张梦玫,博士毕业于北京邮电大学,电信翼支付高级技术专家,主要关注可信图神经网络与金融风控领域,相关工作发表在WWW,AAAI,ICDM,NeurIPS,USENIX等国际会议。

演讲题目:风控场景中图模型的范式变迁

演讲提纲:

1. 风控图机器学习模型

2. 风控图深度学习模型

3. 风控图大模型

4. 翼支付实践案例

听众收益:通过技术与业务应用案例的分享,听众将深入了解图模型在金融风控的应用场景和范式变迁,了解应用中的挑战、解决方案和成功案例。

LLM+Graph,让大模型学会图表示学习!

扫码报名,更多内容更新中……

 

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 
评论(没有评论)
Generated by Feedzy