我们讲了太多的理论,例如,如何做大模型的数据,如何结合知识图谱提大模型的幻觉问题。
我们今天换换脑子,来看看大模型相关的一些入门实践以及一些产业界关于大模型落地的思考,这个能够让大家理论与实践相结合
首先,对于一些大模型研发与应用的开放课程当前已经有许多,本文主要介绍五个开源的大模型实践教程,包括其中涉及到大模型的入门级别概念讲解、提示工程(Prompt Engineering)、LangChain开发。
其次,我们再来看看五个关于大模型话题的有趣研报,涉及ChatGPT用户时长及流量分析【当前大模型热潮退去在流量上的反映】、向量数据库【当前大模型在私域落地上的重要支撑】以及产业界对大模型落地的观点【2C和2B】方面。
供大家一起参考,并希望大家可以静下来看看研报,辩证地看看其中的一些落地想法和存在的风险。
一、五个开源的大模型实践教程
1、HuggingLLM
该项目聚焦于如何使用ChatGPT相关API创造新的功能和应用,对相关任务有详细的背景和系统设计介绍,并提供示例代码和实现流程。
根据项目描述,项目适合对ChatGPT感兴趣,希望在实际中运用该技术创造提供新的服务或解决已有问题,有一定编程基础的人员,不适合研究其底层算法细节,比如PPO怎么实现的,能不能换成NLPO或ILQL,效果如何等,自己从头到尾研发一个 ChatGPT,对其他技术细节感兴趣。
地址:https://github.com/datawhalechina/hugging-llm
2、面向开发者的LLM入门课程
该项目提供了《ChatGPT Prompt Engineering for Developers》、《Building Systems with the ChatGPT API》、《LangChain for LLM Application Development》等由吴恩达老师与 OpenAI 联合推出的官方教程,支持研究如何提升 ChatGPT 在中文语境下的理解与生成能力。
项目适用于所有具备基础 Python 能力,想要入门 LLM 的开发者。
B站地址:https://www.bilibili.com/video/BV1Bo4y1A7FU/?share_source=copy_web&vd_source=d670de3e996c9a3b795a0e40e028adeb
地址:https://github.com/datawhalechina/prompt-engineering-for-developers
3、Prompt Engineering提示工程指南
提示工程(Prompt Engineering)是一门较新的学科,关注提示词开发和优化,帮助用户将大语言模型(Large Language Model, LLM)用于各场景和研究领域。 掌握了提示工程相关技能将有助于用户更好地了解大型语言模型的能力和局限性。
该项目基于对大语言模型的浓厚兴趣,编写了提示工程指南,介绍了大语言模型相关的论文研究、学习指南、模型、讲座、参考资料、大语言模型能力以及与其他与提示工程相关的工具。
地址:https://www.promptingguide.ai/zh
4、LangChain中文网
LangChain是一个开发由语言模型驱动的应用程序的框架,LangChain中文网,提供500页超详细中文文档教程,助力LLM/chatGPT应用开发。
学习该项目有助于提升大家对langchain的理解,对其中的一些基本概念,项目构成以及组件定义
地址:https://www.langchain.asia
5、构筑大语言模型应用:应用开发与架构设计
《构筑大语言模型应用:应用开发与架构设计》一本关于LLM在真实世界应用的开源电子书,介绍了大语言模型的基础知识和应用,以及如何构建自己的模型。其中包括Prompt的编写、开发和管理,探索最好的大语言模型能带来什么,以及LLM应用开发的模式和架构设计。
学习该项目可以学习到一些有趣的实操案例。
地址:https://github.com/phodal/aigc
二、五个关于大模型话题的有趣研报
1、数据研究·科技专题:AI产业人士看大模型发展趋势
本报告基于来自中国AI科技团队的产业人士问卷调研,分析了中国AI产业在资源投入、模型发展、数据隐私保护和行业合作等方面的表现,以及面临的挑战和机遇。用科学数据证据给读者提供全面的视角洞察中国AI产业的发展现状和未来趋势。
地址:https://pdf.dfcfw.com/pdf/H3_AP202307041592030187_1.pdf?1688491719000.pdf
2、计算机行业专题:ChatGPT用户数据:用户时长及流量分析
报告指出:2023年3月,OpenAI对于Plus付费用户的GPT-4访问连续下降阈值,GPT-4访问限制由第一天的150msg/4hr到100msg/4hr到50msg/3hr到最近的25msg/3hr,在较短的时间内GPT-4下降了4次访问阈值;ChatGPT流量受限,4月开始用户总时长进入平台期。本报告进行了解读分析。
地址:https://pdf.dfcfw.com/pdf/H3_AP202306281591776196_1.pdf?1687962590000.pdf
3、计算机行业深度报告:ChatGPT的流量去哪了?
本报告认为,对ChatGPT流量的统计存在显著低估;同时,仅通过应用访问量判断AI市场热度的观点,并未深刻理解Open AI等巨头的商业战略和产业发展。所谓ChatGPT的“流量瓶颈”,主要由以下三方面原因导致,分别是1、Open AI战略,流量高低在API结构;2、算力短缺;3、访问时长(ChatGPT限流)+访问人数(部分地区封锁账号)。
大模型型应用加速落地,桌面端+移动端构筑AI生态。报告指出:目前,Open AI API接口+plugin插件打造AI助手已初步落地,从网络浏览器、代码解释器到第三方工具,联网功能全场景应用。此外,ChatGPT已经推出iOS版应用程序,移动端已经推出联网模式,有望开启ChatGPT第二波成长曲线。此外,Open AI持续深化布局,据The Information最新消息,OpenAI正准备发布一个类似App Store针对定制化模型/软件的交易市场平台。我们认为随着桌面端的布局日臻完善,移动端将成为大模型厂商的主战场。
地址:https://pdf.dfcfw.com/pdf/H3_AP202306291591883603_1.pdf?1688071687000.pdf
4、人工智能专题研究:向量数据库——AI时代的技术基座
受大模型热潮催化,向量数据库方兴未艾。NVIDIA CEO 黄仁勋在3月的NVIDIA GTC Keynote 中,首次提及向量数据库,并强调其在构建专有大型语言模型的组织中的重要性。
本报告介绍了向量数据库的内容,报告指出:大模型作为新一代的 AI 处理器,提供了数据处理能力;而向量数据库提供了存储能力,成为大模型时代的重要基座。向量数据库是一种专门用于存储和查询向量数据的数据库系统,与传统数据库相比,向量数据库使用向量化计算,能够高速地处理大规模的复杂数据;并可以处理高维数据,例如图像、音频和视频等,解决传统关系型数据库中的痛点;同时,向量数据库支持复杂的查询操作,也可以轻松地扩展到多个节点,以处理更大规模的数据。
地址:https://pdf.dfcfw.com/pdf/H3_AP202306211591148216_1.pdf?1687342714000.pdf
5、计算机行业专题研究:办公场景重塑,详解金山办公AI时代的竞争壁垒
该报告主要介绍了大模型再文档场景下的例会,报告指出:AI启发Microsoft 365 Copilot,打造C端强力型应用,将大语言模型的强大功能与业务数据和Microsoft365应用相结合,为用户实现更大的创造力、更高的生产能力和更强的技能。B端在GPT-4加持下增效提价,赋能各商业应用,通过TEAMS载体,微软正重塑办公场景。AI赋能下,海外应用有望显著提升用户接入和付费。
地址:https://pdf.dfcfw.com/pdf/H3_AP202306291591882833_1.pdf?1688073278000.pdf
关于我们
老刘,刘焕勇,NLP开源爱好者与践行者,主页:https://liuhuanyong.github.io。
老刘说NLP,将定期发布语言资源、工程实践、技术总结等内容,欢迎关注。
对于想加入更优质的知识图谱、事件图谱实践、相关分享的,可关注公众号,在后台菜单栏中点击会员社区->会员入群加入。