DataFunCon2023·深圳站回顾|附PPT下载

777次阅读
没有评论

DataFunCon2023·深圳站回顾|附PPT下载

由上海市数据科学重点实验室指导,DataFun主办的「DataFunCon2023·深圳站:大模型时代,Data+AI的变与不变」,于2023年11月24-25日成功在深圳举办。本次大会特邀80余位国内外一线Data+AI方向的专家学者,与 1200 余名技术管理者、大数据/算法工程师等技术开发者共同分享和交流大模型时代下的最新思考与技术实践,推动前沿技术在更多的企业落地,碰撞出新的火花

大模型时代,Data+AI的变与不变

本次大会规模超过预期,有来自 400+ 家企业的 1200+ 技术从业者;80余位来自国内外知名高校、企业和明星创业公司的嘉宾分享。


DataFunCon2023·深圳站回顾|附PPT下载

DataFunCon2023·深圳站回顾|附PPT下载

大模型是大数据与人工智能行业的变革性力量,他在数据架构、数据效能、算法创新、智能应用4个层面带来巨大的影响。围绕其产生的影响,本次大会共设置了1个主论坛和17个分论坛,助力企业走向Data+AI融合的新阶段。

也期望通过本次大会,可以带你领略数据智能技术实践最前沿的景观,我们也相信总有一个分享会影响你很久很久。

主会场分享

DataFunCon2023·深圳站回顾|附PPT下载

本次主论坛,我们以大模型时代,Data+AI的变与不变为主题,分别从大数据AI融合、垂域大模型、降本增效、大模型中场阶段的思考与总结四个方面进行了主题分享:


DataFunCon2023·深圳站回顾|附PPT下载

首先我们邀请到了阿里云计算平台事业部首席架构师,阿里云 PAI & DataWorks 负责人林伟,分享「大数据 AI 一体化解读」:


DataFunCon2023·深圳站回顾|附PPT下载

林伟老师指出最近模型发展范式的一种变化,原来模型的开发是以模型作为中心,因为算力和数据的限制,算法工程花了大量精力在设计模型结构,希望通过模型结构变化去提高模型的泛化能力,解决模型过拟合,欠拟合,去除噪声等等问题,并且那个时候模型训练对于标注的数据非常依赖,而这些标注数据成本很高,我们往往不会在数据集上有多变化的空间。但是随着transformer结构出现,以及我们进入大模型时代,或者预训练模型时代,我们进入到以数据为中心的模型开发范式,其实核心模型结构都是transformer的为基础的,相反因为此类模型需要大量的数据,大量的算力才能萃取,并且因为数据暴涨,我们需要花更多精力去很好的处理数据,并且在各种环境,要反反复复多角度去验证数据质量,并有数据质量,实验反馈等来推动模型的迭代。在这个过程中我们需要打造和积累各种数据处理工具,这往往需要非常多数据工程以及大数据平台能力。这也是大家为什么提出以数据为中心的模型开发形式。


DataFunCon2023·深圳站回顾|附PPT下载

林伟老师指出正是在这种趋势下,阿里云从去年就开始慢慢在提出大数据和AI是一体两面,需要紧密把大数据和AI一体化从而顺应模型开发范式的演进,阿里云智能计算平台正式在这样理念上来构建,这在底层丰富计算基础设施上打造大数据和AI一体化的PaaS平台。在计算基础设施上提供高效适应场景多样的计算集群,包括大数据计算,数仓集群以及高速RDMA网络的高密计算的PAI灵骏计算集群。


DataFunCon2023·深圳站回顾|附PPT下载

接下来,我们邀请了度小满技术委员会执行主席、数据智能应用部总经理杨青,分享「金融大模型技术创新与应用探索」:


DataFunCon2023·深圳站回顾|附PPT下载

杨青老师指出随着训练参数和数据量的增加,大模型“涌现“出了超出预期的能力和表现。仅如此,大模型在实践中展现出强大的泛化性、通用性和实用性。无论是对新数据的适应能力,解决多样化任务的能力,还是在实际应用中的可用性和效率,大模型都表现得非常出色。因此在金融行业,杨青老师认为:大模型技术有望为金融行业创造巨大价值。可以提高生产效率–>提升决策精度–>创造价值增量–>重塑行业格局。


DataFunCon2023·深圳站回顾|附PPT下载

杨青老师还指出,通用模型难胜任金融任务,大模型落地金融面临挑战:

  • 金融知识挑战:行业数据流通难、私域数据共享难、知识更新时效长,导致大模型专业知识欠缺  
  • 金融能力挑战:大模型普遍存在的幻觉问题、计算准确性问题、遗忘问题等不满足金融任务的要求
  • 应用成本挑战:GPU算力、能耗、推理、维护等都需要高昂的成本


DataFunCon2023·深圳站回顾|附PPT下载

进一步的,我们邀请了OPPO互联网应用研发平台总经理赖洪科,分享「OPPO应用分发在推荐领域提效上的实践与思考」:


DataFunCon2023·深圳站回顾|附PPT下载


赖洪科老师指出,OPPO应用分发场景跨度大的海量数据带来的首要问题是数据稀疏,这在OPPO的应用分发场景中体现的尤其明显。“不限于软件商店的话,应用分发包括了接近20个场景,每个场景之间的数据是割裂的。有一些场景的流量特别小,导致特征很稀疏,怎么估都估不准。”
DataFunCon2023·深圳站回顾|附PPT下载
“在一个场景上面做到最优始终是有局限的,希望数据增强所有场景,提供最优质的服务。”为此,OPPO在推荐系统中落地了全场景统一建模技术。这种设计下,除了应用分发推荐的效果提升,效能提升也是显著的。比如算法迭代上免去了大量数据打通工作,部分场景的资源投入产出比提升明显。

总体而言,随着推荐算法模型越来越透明,在业界落地中,算法与工程的协同设计才是落地的核心工作,“怎么把模型结合场景或者业务,将价值最大化,关键在于数据能不能支持到位,工程能力能不能跟得上。”

DataFunCon2023·深圳站回顾|附PPT下载

来到主论坛Keynote的最后一个分享,我们荣幸的邀请到了复旦大学教授,上海市数据科学重点实验室主任肖仰华,分享「走向千行百业的大模型」,这也是肖仰华教授关于大模型产业发展到中场阶段的全面总结与思考,是在业界的首次公开~

DataFunCon2023·深圳站回顾|附PPT下载

肖仰华教授指出,人类有限的认知能力难以满足日益复杂、不确定、变化增速的世界是人类面临的主要问题之一。人类智能发展受限于缓慢的生物进化速度,其能力是有限的。发展具备认知能力的机器,是应对日益复杂世界的必经之路。
生成式大模型成为认知智能新底座,其规模越来越大,“涌现”出了令人惊讶的“智能”。以生成式人工智能为代表,通用人工智能时代到来,引发新一轮产业变革。而历次技术突破只是人类智能的产物,而唯独通用人工智能是‘智能’本身的革命,是一场技术元革命。

DataFunCon2023·深圳站回顾|附PPT下载

肖仰华教授还指出,大模型释放了数据价值、推动了数据要素市场的发展。使数据成为第五个生产要素,数据成为数字中国战略实施的重要元素。当前的数据价值变现全链路上的各个环节,仍然需要人类专家的密集参与;难以实现数据要素的有效、高效流通,难以实现数据价值变现。
最后,肖仰华教授指出,我们要合理定位、正确认识,场景多元,积极开辟新赛道,重视大模型的成本与价值,促进大模型与千行百业的深度融合;大模型不能只是炼金术,要成为科学才能持续发展;大模型背后的“人”学研究是关键。

DataFunCon2023·深圳站回顾|附PPT下载

最后在圆桌讨论环节,我们更是邀请了大数据、数据科学、算法和学界的代表:复旦大学教授,上海市数据科学重点实验室主任肖仰华;阿里云大数据产品负责人刘一鸣;腾讯 IEG Global Manager刘文强;奇富科技首席算法科学家费浩峻,讨论了本次大会的主题「大模型时代,Data+AI的变与不变」。围绕以下问题进行了深度的交流与探讨:

· 结合您所从事的领域,谈谈您对『大模型时代,Data+AI的变与不变』的理解。

· 国内企业如何面对来自OpenAI等国外头部企业的竞争压力?如何找到自己独有的优势?

· 大模型目前在行业内的落地如何?能与不能的边界是什么?如何评估投入产出比?还存在哪些边界或局限?以及未来大模型的发展方向。

分论坛

本次大会共设置了:湖仓一体架构演进、数据指标体系建设与应用、大模型训练推理与微调、大模型行业实践、图机器学习前沿与应用、游戏与AIGA、极致效能OLAP、新一代数据架构、云原生大数据迭代、推荐系统变革、DEEPNOVA大模型、AIGC与智能交互、数据治理发展趋势、AB实验应用与发展、AIGC与业务提效、数智金融效能建设、数据产品设计实践等17个分论坛,受限于篇幅,这里简单制作了合集相册,大家可以慢慢欣赏:

DataFun社区

DataFun成立于2017年底,是专注于服务数据智能开发者的垂直社区。在“成就百万数据智能开发者,助力万家企业数智化”的使命驱动下,通过近6年的持续运营,邀请了超过4000位领域专家分享、以视频和图文的形式沉淀了超过2000个应用案例、并在全网影响了50w精准开发者。

在DataFun,你可以链接到数据智能领域权威专家、前沿技术、最佳实践和优秀的开发者群体。希望DataFun可以陪伴开发者、企业和行业一起奔赴数据智能的大时代。


DataFunCon2023·深圳站回顾|附PPT下载

鸣谢

感谢包括上海市数据科学重点实验室、阿里云、OPPO、炎凰数据、滴普科技、Alluxio、异步社区、Clickhouse、数造科技、聚云速算等组织和企业对本次大会的支持,感谢与会的80余位嘉宾,感谢到场的1200+参会者,感谢所有参与本次大会的志愿者及相关工作人员。

DataFunCon2023·深圳站回顾|附PPT下载

NEXT:上海站

新一届DataFunCon2024·上海站将于2024年4/5月份在上海举行,届时DataFun社区将针对更多的技术领域和垂直行业,带来更多的落地经验和前沿探索!


DataFunCon2023·深圳站回顾|附PPT下载

扫码添加大会小助手

回复「PPT」下载大会课件

点击文末阅读原文,即可查看本次大会的所有精彩瞬间!

 

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 
评论(没有评论)
Generated by Feedzy