2024年,如何精准押注大模型?

660次阅读
没有评论

2024年,如何精准押注大模型?

过去一年,经历过百模大战之后,由于没有出现杀手级的应用,人们当前倾向于保守,场景限于 To B 提效上,这个场景价值明确,同时更关注性能和成本,当然天花板并不高。目前发展比较快速的场景更多在于内部协作以及对外营销服务。

内部协作包括代码生成与办公协作。代码生成方面,企业正在对各种开发功能进行封装,最大程度满足开发平台易用性和规模化的需求。如果按难度进行分级,前端代码和客户端的采纳率较高,而服务器端的采纳率较低,但也基本上是可用的状态。

另外,在开发办公提效上,部分企业会开发一个问答助手,来回答研发过程中开发人员对“这个 API 如何调用”、“这个字段是什么含义”等等的困惑,这个 AI 助手如今可以替换原有的值班人员。在电商场景中,企业也可以不再依赖于传统电商背后的人货场标签体系,而是可以通过挂载知识库来解决大量的问题,节省了很多运营成本。在操作系统层面,大家也会尝试利用一个 AI Agent 进行协议式或对话式的方式来进行工作。

但业内对大模型统一应用接口的可行性仍持保留态度,认为 app 仍然会继续存在,只是每一个 app 都会多出一个智能助手。

对外营销服务方面,大模型在智能创作场景的应用更加顺畅。目前的新趋势是将广告创意自动生成与推荐系统召回结合起来,从两阶段变成一阶段,原来是手动制作创意然后检索式召回,现在广告主只要表达创意然后让模型自动生成就行了。在创作工具方面,也会努力提升普通用户的发布积极性,比如提供大量易于使用的创作模板,并通过社交网络激励分享和传播。

文字生成视频创业想法在业内受到很大关注,并倾向于看好,毕竟国内有较成熟的短视频生态和仍未挖掘的庞大前景。不过文生视频在技术上还处于早期阶段,在剧情完整性、画面清晰度、关键帧之间的稳定性等方面,还是有一系列的挑战。相比之下,利用图片拼接或者视频剪辑拼接制作视频,这样的技术已经非常成熟了。总之,未来多模态方向肯定是关注点。

大模型在搜广推的应用方向分成两类,一类是大模型与推荐系统各阶段的结合,目前还处于召回阶段的探索早期。另外一类是对话式推荐,这个方向与大模型的工作模式比较匹配,目前落地程度更高。大模型在推理性能上的瓶颈给推荐带来很大挑战,用户习惯的推荐体验已经到了需要百毫秒反馈的水平,大模型至少还需要提升100倍才能达到这一程度。

技术方面,大模型遇到的挑战主要涉及推理速度、大模型可控性、推理不确定性感知以及设备资源。业内认为,国内不管是开源大模型还是闭源大模型,真正能解决上述问题的可以说还没有出现。

针对推理速度慢,目前的主要手段是规避,也就是尽量不直接用到 C 端应用中去。可控性、不确定性感知方面可以结合向量数据库、RAG、模型微调等方式缓解,并且实践中也发现,即便采用了向量数据库、检索增强,也无法完全消除幻觉的影响,而在前置阶段采用正则表达式等方法就可以解决很多问题。

很多人可能觉得这些方法很初级,但确实很有用,比如针对涉黄涉暴内容的检测,不一定要采用意图判断算法,特别是这些内容样本量不大的情况下。毕竟从产品化的体系来看,它是面对一个技术面来解决,而不是针对一个技术点来解决。

最大的问题自然还是设备资源,特别是 GPU 紧缺。尽管业内都在发展自己的生态,但相对于国外头部而言,还很不完善。

因此,企业也需要在更高层面探索异构算力环境下,如何最大化算力利用,避免稳定性、安全性问题。深入来看,芯片设计、算子层、图层都容易出现 bug,如何在这些层次和国外头部形成对等校验,进而构筑基础软硬包,对于算力安全非常重要,这是过去一年比较大的挑战。

长期来看,要与学界深入合作,构建完善体系,持续发展大规模推理、训练能力,特别是后者。

面向未来,开源大模型会是 2024 年的关键变量,目前还是 Llama 大模型在生态上做的比较好,同时它也有开源的数据集,毕竟如果只是开源预训练大模型,人们能做的事情是有限的。

一些企业正在尝试用大模型作为 API 查询接口来接入企业用户,以此执行用户意图判断等任务,目前来看,只有 GPT 系列模型能够比较好地满足需求,但也要考虑到这样做有可能泄露数据,特别是在 C 端应用中。

因此,企业会更倾向于使用国内的大模型服务,或者也在探索如何基于本地大模型来执行此类任务。未来,这项工作将持续推进,基于 GPT 系列(需要绕过一些限制)、国内大模型或者本地大模型来不断扩展接口规模。

Agent 的核心技术是 planning,planning 技术目前还没有得到很好的解决。业内也有人认为,Agent 不一定是大模型最佳的应用方向,这个概念不适用于 C 端应用,而在企业内部协作中作为 NLP 工具更加适合一些,NLP 工具在过去开发成本和难度很高,现在有了大模型,就极大加速了这一过程。

大模型仍将是以语言模型或者包含文字模态的多模态模型为主角,尽管目前学界已经出现了纯像素生成的视觉模型,但从技术角度看,计算复杂度还太高。

从数据集成、数据治理,到模型训练、模型推理,大数据与人工智能始终是紧密关联和作用的。秉持“数聚垂域,智领未来”信念,DataFunCon2024·上海站将继续顺应趋势,邀请数据智能技术专家、行业专家,与你共同探讨数据智能落地的现在与未来。

2024年,如何精准押注大模型?

大会议程详情

2024年,如何精准押注大模型?

04/19-04/20

时间

2024年,如何精准押注大模型?

2024年,如何精准押注大模型?点击『阅读原文』参与报名~

 

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 
评论(没有评论)
Generated by Feedzy