Datawhale开源
贡献者:邹雨衡,Datawhale团队
大模型正逐步成为信息世界的新革命力量,其通过强大的自然语言理解、自然语言生成能力,为开发者提供了新的、更强大的应用开发选择。随着国内外井喷式的大模型 API 服务开放,如何基于大模型 API 快速、便捷地开发具备更强能力、集成大模型的应用,开始成为开发者的一项重要技能。
目前,关于大模型的介绍以及零散的大模型开发技能课程已有不少,但质量参差不齐,且没有很好地整合。开发者需要搜索大量教程并阅读大量相关性不强、必要性较低的内容,才能初步掌握大模型开发的必备技能,学习效率低,学习门槛也较高。
《动手学大模型应用开发》是一个面向小白开发者的教程,旨在结合个人知识库助手项目,通过一个课程完成大模型开发的重点入门。我们想要帮助每一位想要迈入大模型世界的学习者和开发者,用最少的时间和精力完成最必要的大模型开发入门。项目英文名为 LLM Universe,意味着我们并不囿守在大模型本身,我们想要基于通用大模型的强大能力,搭建起一个丰富多彩、熠熠生辉的大模型宇宙,在通用人工智能的协助下,我们必将领航星辰大海,扬帆浩瀚未来。
开源地址:
https://github.com/datawhalechina/llm-universe
开源初心
本项目起源于「奇想星球 | AIGC共创社区平台」(链接:https://1aigc.cn/)。奇想星球是萌芽于 Datawhale AIGC应用开发课程的 AIGC 共创平台,在平台的建设中,我们发现大模型应用本身的固有门槛与不同大模型提供商的服务提供差异给大模型开发的入门带来了一定难度。通用大模型是一个打通不同领域,将“编程”这一技术技能提供给更多不同领域、非CS专业的开发者的创新产物,是一个将程序语言范式转化为自然语言范式的生产力工具。这样的重要工具,不应也不会受到领域的固有局限,将会有越来越多的“非专业”、“跨领域”的学习者来拥抱大模型,搭建大模型的广阔宇宙。
因此,我们开始想要做这样一个教程,它可以帮助降低大模型应用开发的门槛,帮助更多的“小白”、“初学者”迈入到大模型开发的世界中来。我们基于 Datawhale 已有的开源教程内容与众多大模型应用开发经验,由该教程的核心开发者团队着手,通过更深入理解初学者处境、更全面面向小白开发者、更强调短而精悍的必要学习内容,来打造这样一个最小而又最全面的教程。
所谓最小,是我们希望我们的教程是可以帮助学习者尽可能快、尽可能轻松地掌握大模型开发的核心理念和技能。我们去掉了很多冗余或非必要的内容,仅保留我们认为最核心的部分,来打造一个“帮助你半天学会大模型应用开发”的小教程。
所谓最全面,是我们希望我们的教程也可以在最小的基础上尽可能全面,包括所有核心的技术技能,保证每一位学习者在完成教程的学习后都可以做到基础大模型应用的开发。为此,我们调研了多款热门大模型应用,选择了最通用的个人知识库助手项目作为示例,将教程内容和项目构建深度结合,来实现不仅要学,更要“动手学”!
我们希望我们的项目能成为未来众多大模型开发者的入门路径,帮助更多跨领域的开发者走入这个无限可能的世界,用自己的奇思妙想,打造大模型的灿烂星空!
教程内容
本项目是一个面向小白开发者的大模型应用开发教程,旨在结合个人知识库助手项目,通过一个课程完成大模型开发的重点入门,涵盖了大模型应用开发的方方面面,主要包括:
教程一共有七章内容:
学习指南
本教程出发点便是降低大模型开发的学习门槛,帮助更多初学者入门大模型开发领域,因此本教程的受众是所有具备基础 Python 能力,想要掌握 LLM 应用开发技能的开发者。也就是说,本项目对学习者的人工智能基础、算法基础没有任何要求,仅需要掌握基本 Python 语法、掌握初级 Python 开发技能即可。同时,本项目对本地硬件基本没有要求,不需要 GPU 环境,个人电脑及服务器均可用于学习。
在具体学习的过程中,由于本项目充分面向实践,学习者应该先阅读并充分理解教程本身内容,掌握大模型开发的基本理念与技能。然后结合本项目同时提供的个人知识库助手项目源码,深入理解项目的构建过程,尝试基于教程学习内容复现个人知识库助手项目的搭建。事实上,每一位学习完教程全部内容的学习者,都应该可以具备独立搭建一个简单大模型应用的能力。
在完成本教程的学习后,建议学习者在本教程内容基础上进一步深入,结合自己的奇思妙想,搭建属于自己的、具有充分个人特色的大模型应用。
大模型应用开发是一个充分面向实际、面向需求、面向创意的新领域,欢迎每一位学习者不断拓展、自我学习,以自己的智慧,打造更精彩的大模型宇宙;也欢迎每一位开发者来到奇想星球,价值相同,技能互补,链接让每个价值都被放大!一起在 AIGC 的世界里不断共创,不断成就。
文章最后
最后,由于贡献者团队时间仓促、精力有限,教程难免有些疏漏甚至错误,我们期望学习者在学习的同时,也能积极给我们建议,或者直接对项目进行贡献,让我们共同打磨教程,为后面的学习者提供更好的内容。我们期望所有学习者都能够学有所得,在 AIGC 的世界里不断前行,在 LLM Universe 里探索无限可能,共同成长。
干货学习,点赞三连↓