大模型的工程落地包含复杂的长链路,比如数据准备、架构适配、模型训练、模型优化、场景适配等等,为普及大模型的全链路实践,DataFunCon2023·深圳站邀请国内外知名企业专家,汇集了各个阶段的实践案例,涉及数据访问加速、端云协同、多模态训练、幻觉缓解,以及对法务、金融、游戏、广告、教育、电商运营等场景的适配。欢迎广大从业者参与,探讨大模型时代Data+AI的技术逻辑变化,以及新技术如何适应与促进不变的业务增长。
扫码报名参加
Alexis Rolland,Ubsoft China,Development Director
个人介绍:Alexis Rolland, 自2012年加入育碧,曾先后在大数据、数据分析和机器学习等领域担任多个关键职务。目前,作为La Forge中国团队开发总监,他领导着团队在技术创新领域迈出坚实的步伐。出于对新兴科学技术的执着追求,Alexis一直致力于架起学术前沿和视频游戏产业之间的桥梁,尤其在积极推动育碧生成式AI助力内容创作的革新中,发挥着关键的作用。
演讲题目:助力3A大作:领跑2D图像生成技术
演讲提纲:
本次演讲将介绍育碧(Ubisoft)在为3A游戏创建专有图像生成式模型方面的方法。
演讲内容将包括以下部分:
• 为什么需要创建微调图像生成式模型
• 育碧的方法和方法论
• 介绍Caption Studio实用工具
• 展示图像生成式模型
听众收益:
您将了解到育碧在微调图像生成式模型方面的实现方法和道德原则,及相关的指导方针和最佳实践。
扫码报名参加
陈宸 OPPO 研究院 高级算法工程师
个人介绍:陈宸,本科毕业于上海交通大学,博士毕业于香港科技大学。主要研究方向包括视频编解码、图像处理、持续学习/鲁邦学习等机器学习基础问题、计算机视觉在细粒度识别上的应用、多模态预训练在AIGC方向的应用等。曾任腾讯高级研究员,负责腾讯全媒体内容安全识别体系的搭建。现任OPPO研究院高级算法工程师,负责多模态预训练在跨模态检索、理解和生成的端云场景应用研究。在大模型预训练、端侧轻量化以及下游应用都有长期业务实践经验。
演讲题目:多模态预训练模型在OPPO端云场景的落地实践
演讲提纲:主要围绕图文多模态预训练模型在检索、理解、生成等各个方向的云端两侧的技术优化和落地场景介绍。如何在低资源的情况下用最少的算力优化多模态大模型已经成功落地到移动终端。
1. 图文检索云端两侧优化思路
2. 文图生成大模型继续预训练优化思路
3. 文图生成下游垂域优化思路(个性化生成、垂域微调、文字渲染等)
4. 文图生成大模型端侧轻量化落地介绍
听众收益:
1. 了解大模型在低资源下持续优化的算法实践经验;
2. 了解大模型在移动终端的轻量化落地优化链路;
3. 了解图文预训练模型在理解和生成方向的业务落地场景和实践经验。
扫码报名参加
付凡 vivo 人工智能部门算法总监
个人介绍:毕业于中国地质大学(武汉)信息技术相关专业,超10年算法经验。2017年加入vivo,从事NLP算法相关工作,期间参与Jovi语音助手、电话秘书、手语翻译官等算法研发,从0到1搭建千万日活产品。目前在vivo从事大模型算法开发及产品落地相关工作。
演讲题目:大模型从训练到产品落地分享
演讲提纲:
1、大模型演进 & 技术架构;
2、vivo在大模型训练分享;
3、vivo在大模型产品落地技术;
4、vivo大模型成果展示;
听众收益:
1、预训练数据如果构建及预处理方案?
2、SFT 如何提高模型效果?
3、大模型如何适配到产品应用?
扫码报名参加
傅正佳 Alluxio 研发负责人
个人介绍:本科毕业于上海交通大学电子系,随后取得香港中文大学信息工程博士学位,毕业后加入新加坡高级数字科学中心(美国伊利诺伊大学在新加坡的研究所)从事科研工作,在计算机网络和分布式系统领域相关的顶级国际会议发表多篇论文。加入Alluxio前,傅正佳曾在新加坡科技公司Bigo Technology担任机器学习研发总监。
演讲题目:简化并加速AI/ML模型训练&推理的数据访问
演讲提纲:
人工智能(AI)的应用正在迅速增长,49% 的首席信息官表示他们已经使用或计划使用人工智能。最近,生成式人工智能的蓬勃发展进一步加速了这一应用,使人工智能成为企业创造收入、提高客户满意度和组织生产力的当务之急。
成功的人工智能项目需要访问数据,为应用程序快速提供数据的能力至关重要。随着人工智能用例越来越复杂,我们需要了解数据访问模式以及如何使用正确的解决方案来解决这些问题。
此次分享将介绍现代AI/ML平台中的数据访问模式,将探讨机器学习管道每个阶段的数据访问特点,以及为大规模AI优化数据访问的策略。
1. AI/ML工作流在访问数据时的挑战
2. 针对分析和AI的高性能数据访问层介绍
3. 使用Alluxio进行模型训练的主要场景和价值
4. 主要用户案例分享
听众收益:
了解全新的AI/ML训练解决方案,通过构建高校的数据平台架构快速生成分析结果。
扫码报名参加
陈祖龙 阿里巴巴 企业智能算法负责人
个人介绍:阿里巴巴企业智能算法负责人,浙江省人工智能协会智能制造分会百人专家,山东人工智能协会专家成员,中国“双法”学会数学建模分会理事,现负责面向大型企业的数字化智能文档、企业级办公助手以及法务等领域大模型相关工作,曾负责阿里巴巴飞猪算法(搜索、推荐、广告、供应链等)团队和淘宝首页人群个性化推荐,带领团队在业务相关技术走向国内外先进水平,在WWW、SIGIR、SIGKDD、ICDE、WSDM、CIKM、AAAI等国际顶级会议和VLDB、TITS、TOIS、ITOJ等国际顶级期刊发表论文30多篇等。
演讲题目:EILaw : 面向企业法务数字化的中文LLM
演讲提纲:
1.企业法务数字化介绍
2.企业法务数字化挑战&难点
3.EILaw
3.1EILaw 法务LLM的数据
3.2EILaw 法务LLM的训练
3.3EILaw 法务LLM的效果
4.EILaw 业务落地&实践
5.法务数字化展望
听众收益:
了解企业法务数字化的进程,同时完成的了解企业法务LLM模型训练以及产业落地。
扫码报名参加
金志鹏 百度 资深研发工程师
个人介绍:硕士毕业于中科院自动化研究所,2016年加入百度商业广告团队,先后从事凤巢点击率模型优化、商业多模内容理解等工作,目前在商业技术中台团队担任内容中台资深算法工程师,负责多模态理解与生成方向,相关工作多次发表于 SIGIR,CIKM,BigData 等国际会议。
演讲题目:多模内容理解在百度商业广告中的探索实践
演讲提纲:
1. 商业图文预训练大模型
2. 多模内容表征如何赋能商业系统,包括排序系统、召回系统
3. 多模内容理解与生成大一统
听众收益:
1. 如何训练一个百亿的图文大模型?
2. 多模态内容如何赋能商业系统?
3. 排序模型的 ID 记忆性问题如何解决?
扫码报名参加
刘焕勇 360人工智能研究院 算法专家
个人介绍:360人工智能研究院算法专家、知识图谱方向负责人、360智脑项目组核心成员,“老刘说NLP”公众号作者,曾就职于中国科学院软件研究所。主要研究方向为大模型数据挖掘与自动化评估、领域知识/事件图谱的构建与落地应用,主持或参与研制全行业事理图谱、百科图谱、知识图谱平台、事件情报分析、右侧推荐、大模型研发等落地项目,申请发明专利十余项、论文数篇。近年来在OGB-Wikikg2、CCKS多模态实体对齐、可解释类案匹配等评测中获得多项冠亚军。致力于自然语言处理技术开源共享,在github开源项目60+,收获star数超2W+。
演讲题目:大模型幻觉的起因、评估及落地场景下基于知识图谱的缓解策略探索
演讲提纲:幻觉问题是制约大模型在某容错性较低场景的拦路虎。而幻觉问题本身来源于多个方面,包括数据、训练方式以及解码策略等。本报告将围绕大模型幻觉的起因、如何评估、在真实落地场景下如何结合外部知识图谱进行缓解等几个方面进行介绍。
听众收益:
1. 什么是大模型幻觉,幻觉是好是坏?
2. 为什么会出现幻觉,又如何评价幻觉?
3. 幻觉在落地场景中如何用知识图谱加以缓解?外挂 or 受控生成 or 其他?
扫码报名参加
刘文强 腾讯 IEG Global Manager
个人介绍:刘文强在18年博士毕业之后加入腾讯,曾负责游戏领域知识图谱构建和应用。现任腾讯IEG Global算法中心NLP组长,主要负责多语言自然语言处理的算法研发以及在腾讯海外游戏的应用设计和开发工作。
演讲题目:Game+Agent 我们的初步尝试
演讲提纲:随着最新大语言模型,例如GPT系列,PaLM2的兴起,大语言模型强大的能力为AI Agent 的突破带来了契机。大模型涌现出了上下文学习能力、推理能力、思维链等类似人类思考方式的多种能力。将大模型作为Agent的核心大脑,就可以实现以往难以实现的将复杂问题拆解成可实现的子任务、类人的自然语言交互等能力。本次分享主要分为下面三个部分:
1. Agent 的整体介绍
2. Agent 的技术架构拆解
3. 我们在 Agent 上一些尝试
4. 总结
听众收益:
1. 了解目前 Agent 的一些主流进展
2. 了解目前 Agent 的技术细节
3. 具体如何实践
扫码报名参加
苏喻 合肥综合性国家科学中心人工智能研究院 副研究员
个人介绍:苏喻,工学博士,硕士生导师,合肥综合性国家科学中心人工智能研究院副研究员,合肥师范学院计算机学院副教授,专业负责人,中国计算机学会大数据专家委员会通讯委员,安徽省计算机学会青少年信息学教育专委会秘书长,研究方向为自然语言理解,数据挖掘与推荐系统。2011年7月-2022年2月就职于科大讯飞研究院,历任科大讯飞AI教育研究院副院长,AI研究院认知群教育条线负责人,学习机业务线业务总监,重点负责教育领域个性化学习业务,其研发的多项成果已经成功的应用到讯飞智学网、讯飞学习机等相关产品中,于2018年获得讯飞首届华夏创新奖,获2020年吴文俊人工智能科学技术奖科技进步一等奖。同时,先后参与多项安徽省、部级等层面的重大项目科研工作,如国家自然科学基金重点项目“基于多模态数据的学习者认知诊断理论与关键技术研究”、科技部重大专项“面向分类用户个性化需求的科技大数据精准服务技术”等。其间获得多项发明专利,并在AAAI、KDD、IJCAI等国际知名学术会议与期刊发表文章近50余篇。
演讲题目:教育领域大模型的技术和应用
演讲提纲:随着技术的不断演进,大语言模型,如GPT-4,及其相关技术已经深深影响了许多行业。尤其在教育领域,这些模型已经促进了许多前沿的应用与实践的出现。通过将大语言模型融入智慧教育,我们希望其能够解决传统方法所面临的问题。本次演讲将重点探讨如何利用大语言模型来应对智能教育所遭遇的技术问题,并分享我们团队的最新研究进展。此外,演讲的最后还将介绍我们在教育场景下结合上述技术所取得的应用成果。
1.简述大语言模型在通用教育下有哪些应用场景
2.阐述目前智慧教育在技术上所面临的问题 (有标签数据少、闭环周期长、需要融入领域知识)
3.介绍团队在教育领域大模型相关的技术
4.1基于大语言模型的知识构建
(1)人机合的知识图谱构建技术:通过与大语言模型的结合,实现人机协作的方式,可以更高效、准确地构建领域内的知识图谱;
(2)大模型的小知识学习技术:允许大模型专门针对某一领域或主题进行微学习,从而生成更加准确的领域相关内容;
4.2基于大语言模型的仿真强化试题推荐技术
11)基于大语言模型的学生学习行为仿真技术:通过大模型分析学生的学习行为,模拟其学习路径和趋势,从而预测学生在进行某个学习和做题后的知识水平情况;
(2基于大语言模型的强化试题推荐技术:结合强化学习和大语言模型仿真,系统可以根据学生的学习历程和反馈,动态推荐适合其学习水平和需求的试题,帮助学生更加高效地学习和巩固知识;
5.教育领域大模型相关的应用
(1)数字人AI录播课
(2) AI智慧编译器
听众收益:
听众将从本次演讲中获得对大语言模型在教音领域的深入了解,探索其如何解决智慧教育的技术挑战,以及实际应用中的具体案例,为教育者和技术从业者提供有价值的启示和激发创新思维的灵感。
扫码报名参加
杨剑 奇富科技 高级算法总监
个人介绍:负责奇富科技风控、营销、获客等相关算法和数据挖掘业务。构建奇富科技大数据体系,大语言模型、图计算等技术框架。在意图识别、行为序列、图计算等算法上,带领团队进行算法创新,实现金融信贷领域的深度落地。多年从事信贷风控领域算法研究和实施,曾经负责全场景风控模型的建设、数据生态建设等。
演讲题目:业务理解和逻辑推理是金融行业大模型运转的动力
演讲提纲:金融行业几乎是众多行业中,最早进行数字化的行业,科技一直伴随着金融行业的发展,而大模型的运用将带来金融的科技属性的又一次飞升。金融行业的大模型和其他行业最大的区别,在于金融行业的业务复杂程度、行业经营规范的要求以及安全隐私保护上。并且金融场景中有很多业务判断要求十分严谨,容错率很低,对于当前大模型的能力是一个挑战。金融业务在实际经营过程中,不仅需要有总结归纳和表达输出的能力,更要具备逻辑推理的能力,而支持逻辑推理落实,并做出差异化的方法,是通过结合私有化的领域知识图谱构建的思维链、思维树或思维图。同时面对各类复杂金融业务场景,也不是单纯算力、数据和参数规模的比拼,而是要针对具体场景,利用对业务的理解,有区别化、精确化的挑选参与模型预训练、指令精调、进行RLHF所需的数据。产出的大模型所扮演的角色,也应该是单一或者有限几个领域的专家。
演讲提纲:
1、科技是金融行业发展的动力,大模型是助推金融科技能力提升的又一个助推器
2、金融行业大模型的特殊性及其难点与挑战
3、利用科技属性以及科技优势提升金融行业大模型效果
4、面对挑战,金融行业大模型可以解决哪些问题
听众收益:
1、理解金融行业大模型与其他行业的差异性
2、理解金融行业大模型在落地过程中存在哪些难点
3、理解如何发挥科技优势,提升金融行业大模型效果
4、理解金融行业大模型在金融业务开展中扮演哪些角色
扫码报名参加
张爱喜 淘天集团 算法专家
个人介绍:张爱喜,2014年获香港科技大学研究型硕士(MPhil)。先后在京东、小红书、阿里巴巴等公司从事计算机视觉算法研发,目前主持阿里巴巴淘天集团内容技术多模态生成算法组,研究视频生成等AIGC技术。个人研究领域包含视频内容理解和视觉生成,累计发表含CVPR、NeurIPS、ICCV、TPAMI、TIP、ACM MM等CCF-A类文章10余篇,获得CVPR竞赛冠军3项。主持的高校合作项目获得“2022年度阿里巴巴优秀学术合作成果”奖。
演讲题目:淘宝内容化业务中的 AIGC 研究与应用
演讲提纲:演讲主要介绍AIGC技术在淘宝内容化业务中的算法研发和业务应用。具体包括:
1. NvwaGPT 在人设化账号运营上的应用
2. 视频生成技术研究与应用
3. UGC 互动玩法中的 AIGC 技术
听众收益:
1. 如何集成大语言模型、文生图模型等 AIGC 技术,创建自动运营的人设化账号?
2. 如何生成清晰稳定、服饰一致的模特视频?
3. 在 UGC 创作方面 AIGC 技术可以怎样应用落地?
Join us!
扫码咨询报名
更多主题论坛策划中,更多重磅嘉宾邀约中,敬请期待!