2024年，如何精准押注大模型？

过去一年，经历过百模大战之后，由于没有出现杀手级的应用，人们当前倾向于保守，场景限于 To B 提效上，这个场景价值明确，同时更关注性能和成本，当然天花板并不高。目前发展比较快速的场景更多在于内部协作以及对外营销服务。

内部协作包括代码生成与办公协作。代码生成方面，企业正在对各种开发功能进行封装，最大程度满足开发平台易用性和规模化的需求。如果按难度进行分级，前端代码和客户端的采纳率较高，而服务器端的采纳率较低，但也基本上是可用的状态。

另外，在开发办公提效上，部分企业会开发一个问答助手，来回答研发过程中开发人员对“这个 API 如何调用”、“这个字段是什么含义”等等的困惑，这个 AI 助手如今可以替换原有的值班人员。在电商场景中，企业也可以不再依赖于传统电商背后的人货场标签体系，而是可以通过挂载知识库来解决大量的问题，节省了很多运营成本。在操作系统层面，大家也会尝试利用一个 AI Agent 进行协议式或对话式的方式来进行工作。

但业内对大模型统一应用接口的可行性仍持保留态度，认为 app 仍然会继续存在，只是每一个 app 都会多出一个智能助手。

对外营销服务方面，大模型在智能创作场景的应用更加顺畅。目前的新趋势是将广告创意自动生成与推荐系统召回结合起来，从两阶段变成一阶段，原来是手动制作创意然后检索式召回，现在广告主只要表达创意然后让模型自动生成就行了。在创作工具方面，也会努力提升普通用户的发布积极性，比如提供大量易于使用的创作模板，并通过社交网络激励分享和传播。

文字生成视频的创业想法在业内受到很大关注，并倾向于看好，毕竟国内有较成熟的短视频生态和仍未挖掘的庞大前景。不过文生视频在技术上还处于早期阶段，在剧情完整性、画面清晰度、关键帧之间的稳定性等方面，还是有一系列的挑战。相比之下，利用图片拼接或者视频剪辑拼接制作视频，这样的技术已经非常成熟了。总之，未来多模态方向肯定是关注点。

大模型在搜广推的应用方向分成两类，一类是大模型与推荐系统各阶段的结合，目前还处于召回阶段的探索早期。另外一类是对话式推荐，这个方向与大模型的工作模式比较匹配，目前落地程度更高。大模型在推理性能上的瓶颈给推荐带来很大挑战，用户习惯的推荐体验已经到了需要百毫秒反馈的水平，大模型至少还需要提升100倍才能达到这一程度。

技术方面，大模型遇到的挑战主要涉及推理速度、大模型可控性、推理不确定性感知以及设备资源。业内认为，国内不管是开源大模型还是闭源大模型，真正能解决上述问题的可以说还没有出现。

针对推理速度慢，目前的主要手段是规避，也就是尽量不直接用到 C 端应用中去。可控性、不确定性感知方面可以结合向量数据库、RAG、模型微调等方式缓解，并且实践中也发现，即便采用了向量数据库、检索增强，也无法完全消除幻觉的影响，而在前置阶段采用正则表达式等方法就可以解决很多问题。

很多人可能觉得这些方法很初级，但确实很有用，比如针对涉黄涉暴内容的检测，不一定要采用意图判断算法，特别是这些内容样本量不大的情况下。毕竟从产品化的体系来看，它是面对一个技术面来解决，而不是针对一个技术点来解决。

最大的问题自然还是设备资源，特别是 GPU 紧缺。尽管业内都在发展自己的生态，但相对于国外头部而言，还很不完善。

因此，企业也需要在更高层面探索异构算力环境下，如何最大化算力利用，避免稳定性、安全性问题。深入来看，芯片设计、算子层、图层都容易出现 bug，如何在这些层次和国外头部形成对等校验，进而构筑基础软硬包，对于算力安全非常重要，这是过去一年比较大的挑战。

长期来看，要与学界深入合作，构建完善体系，持续发展大规模推理、训练能力，特别是后者。

面向未来，开源大模型会是 2024 年的关键变量，目前还是 Llama 大模型在生态上做的比较好，同时它也有开源的数据集，毕竟如果只是开源预训练大模型，人们能做的事情是有限的。

一些企业正在尝试用大模型作为 API 查询接口来接入企业用户，以此执行用户意图判断等任务，目前来看，只有 GPT 系列模型能够比较好地满足需求，但也要考虑到这样做有可能泄露数据，特别是在 C 端应用中。

因此，企业会更倾向于使用国内的大模型服务，或者也在探索如何基于本地大模型来执行此类任务。未来，这项工作将持续推进，基于 GPT 系列（需要绕过一些限制）、国内大模型或者本地大模型来不断扩展接口规模。

Agent 的核心技术是 planning，planning 技术目前还没有得到很好的解决。业内也有人认为，Agent 不一定是大模型最佳的应用方向，这个概念不适用于 C 端应用，而在企业内部协作中作为 NLP 工具更加适合一些，NLP 工具在过去开发成本和难度很高，现在有了大模型，就极大加速了这一过程。

大模型仍将是以语言模型或者包含文字模态的多模态模型为主角，尽管目前学界已经出现了纯像素生成的视觉模型，但从技术角度看，计算复杂度还太高。

从数据集成、数据治理，到模型训练、模型推理，大数据与人工智能始终是紧密关联和作用的。秉持“数聚垂域，智领未来”信念，DataFunCon2024·上海站将继续顺应趋势，邀请数据智能技术专家、行业专家，与你共同探讨数据智能落地的现在与未来。

2024年，如何精准押注大模型？

大会议程详情

2024年，如何精准押注大模型？

04/19-04/20

时间

2024年，如何精准押注大模型？

点击『阅读原文』参与报名~

2024 年 2 月
一	二	三	四	五	六	日
	1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29

ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง

tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.

ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.

ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.

ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.

Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.

ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.

ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!

ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.

2024年，如何精准押注大模型？

小说创作

清库存！DeepSeek突然补全R1技术报告，训练路径首次详细公开

训具身模型遇到的很多问题，在数据采集时就已经注定了丨鹿明联席CTO丁琰分享

「北京版幻方」冷不丁开源SOTA代码大模型！一张3090就能跑，40B参数掀翻Opus-4.5和GPT-5.2

开源“裸考”真实世界，国产具身智能基座模型拿下全球第二！

悲报！Stack Overflow彻底凉了，比18年前上线首月问题数量还少

全自主、更好用！北京人形 “干活机器人” 惊艳亮相 CES2026

1956-2026：人类与机器智能的七十年对话

港科大教授实测AI眼镜“作弊”：30分钟碾压95%的学生，把传统教学评估体系整破防了

海信CES发布全新一代RGB-Mini LED，全球首创玲珑4芯真彩背光

文心AIGC

小说创作

清库存！DeepSeek突然补全R1技术报告，训练路径首次详细公开

训具身模型遇到的很多问题，在数据采集时就已经注定了丨鹿明联席CTO丁琰分享

「北京版幻方」冷不丁开源SOTA代码大模型！一张3090就能跑，40B参数掀翻Opus-4.5和GPT-5.2

开源“裸考”真实世界，国产具身智能基座模型拿下全球第二！

悲报！Stack Overflow彻底凉了，比18年前上线首月问题数量还少

全自主、更好用！北京人形 “干活机器人” 惊艳亮相 CES2026

1956-2026：人类与机器智能的七十年对话

港科大教授实测AI眼镜“作弊”：30分钟碾压95%的学生，把传统教学评估体系整破防了

海信CES发布全新一代RGB-Mini LED，全球首创玲珑4芯真彩背光