Stability AI 开源大语言模型StableLM,类ChatGPT,支持中文

1,788次阅读
没有评论

4月20日,生成人工智能艺术工具Stable Diffusion背后的初创公司Stability AI今天开源了一套文本生成人工智能模型,这是一个类ChatGPT模型,支持文本问答、创意写作、代码生成等功能。旨在与OpenAIGPT-4等系统正面对决。

Stability AI被称为StableLM,在GitHub和Hugging Face(一个托管AI模型和代码的平台)上以“alpha”形式提供,Stabletease AI表示,这些模型可以生成代码和文本,并“演示小型高效模型如何通过适当的培训提供高性能。”

据悉,StableLM推出了30亿、70亿参数两种版本,后续还将推出150亿和650亿,1750亿的大参数也在计划中。该模型允许商业化但必须遵守CCBY-SA-4.0许可的条款。

支持中文。StableLM仅用10个小时github已突破3000颗星,其高性能低资源消耗非常适用于中小型企业和个人开发者,普通笔记本也能运行。

稳定人工智能团队在公司网站上的一篇博客文章中写道:“语言模型将构成我们数字经济的支柱,我们希望每个人都在设计中拥有发言权。”

stability.ai:https://stability.ai 

Github开源地址:https://github.com/stability-AI/stableLM/

测试地址:https://huggingface.co/spaces/stabilityai/stablelm-tuned-alpha-chat 

Stability AI 开源大语言模型StableLM,类ChatGPT,支持中文

Discord公告摘录:

我们非常兴奋地宣布推出StableLM-Alpha;一个漂亮而闪亮的新发布的开源语言模型!开发人员、研究人员和好奇的业余爱好者都可以自由检查、使用和调整我们的StableLM基础模型,用于商业和/或研究目的!兴奋了吗?

我们来谈谈参数吧!该模型的Alpha版本有30亿和70亿个参数,随后将有150亿至650亿个参数模型。StableLM是在EleutherAI的“The Pile”上构建的新实验数据集(一个825GiB的多样化的开源语言建模数据集,由22个更小、高质量的数据集组合在一起!)尽管StableLM的参数很小,但该数据集的丰富性使StableLM在会话和编码任务中的高性能出人意料。

 

相关报道:https://techcrunch.com/2023/04/19/stability-ai-releases-chatgpt-like-language-models/ 

这些模型是在名为The Pile的数据集上训练的,该数据集混合了来自PubMed、StackExchange和维基百科等网站的互联网刮擦文本样本。但Stability AI声称它创建了一个自定义训练集,将标准桩的大小扩大了3倍。

Stability AI在StableLM的回购协议中写道:“就像任何没有额外微调和强化学习的预训练大型语言模型一样,用户获得的响应质量可能各不相同,并可能包括冒犯性语言和视图。”“预计这将随着规模、更好的数据、社区反馈和优化而得到改善。”

尽管如此,就其所能完成的任务而言,StableLM模型似乎相当有能力——特别是alpha版本中包含的微调版本。在开源数据集上使用斯坦福大学开发的名为Alpaca的技术进行调整,包括来自人工智能初创公司Anthropic的StableLM模型,其行为类似于ChatGPT,响应指令(有时带有幽默感),如“为软件开发人员写求职信”或“为史诗般的说唱战斗歌曲写歌词”。

随着大小公司都在日益有利可图的生成人工智能空间中争夺知名度,开源文本生成模型的数量实际上每天都在增长。在过去的一年里,Meta、Nvidia和Hugging Face支持的BigScience项目等独立团体发布了与GPT-4和Anthropic的Claude等“私人”API模型大致相当。

一些研究人员过去批评了沿稳定LM路线发布开源模型,认为它们可能被用于创建网络钓鱼电子邮件或协助恶意软件攻击等不良目的。但Sistability AI认为,开源实际上是正确的方法。

“我们开源我们的模型,以促进透明度和培养信任。研究人员可以“在引擎盖下”验证性能,研究可解释性技术,识别潜在风险并帮助制定保障措施,”Stability AI在博客文章中写道。“开放、细粒度地访问我们的模型,使广泛的研究和学术界能够开发超出封闭模型可能性的可解释性和安全性技术。”

这可能有一些道理。即使是门控,像GPT-4这样的商业化型号,有过滤器和人调节团队,也被证明具有毒性。再说一遍,开源模型需要更多努力来调整和修复后端——特别是当开发人员跟不上最新的更新时。

无论如何,从历史上看,稳定人工智能并没有回避争议。

该公司正处于法律案件的十字路口,这些案件声称它使用网络刮的、受版权保护的图像开发人工智能艺术工具,侵犯了数百万艺术家的权利。网络上的一些社区利用了Stability的工具来生成色情名人的深度伪造和暴力的图形描述。

此外,尽管其博客文章具有慈善基调,但Stability AI也面临着将其庞大努力货币化的压力——这些努力从艺术和动画到生物医学和生成音频。稳定人工智能首席执行官Emad Mostaque暗示了首次公开募股的计划,但Semafor最近报告称,稳定人工智能——去年10月筹集了超过1亿美元的风险资本,报告估值超过10亿美元——“正在耗费现金,收入创造速度缓慢。”

 

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 0
评论(没有评论)

文心AIGC

2023 年 4 月
 12
3456789
10111213141516
17181920212223
24252627282930
文心AIGC
文心AIGC
人工智能ChatGPT,AIGC指利用人工智能技术来生成内容,其中包括文字、语音、代码、图像、视频、机器人动作等等。被认为是继PGC、UGC之后的新型内容创作方式。AIGC作为元宇宙的新方向,近几年迭代速度呈现指数级爆发,谷歌、Meta、百度等平台型巨头持续布局
文章搜索
热门文章
潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026 Jay 2025-12-22 09...
面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25

面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25

面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25 鹭羽 2025-12-13 22:37...
5天连更5次,可灵AI年末“狂飙式”升级

5天连更5次,可灵AI年末“狂飙式”升级

5天连更5次,可灵AI年末“狂飙式”升级 思邈 2025-12-10 14:28:37 来源:量子位 让更大规...
钉钉又发新版本!把 AI 搬进每一次对话和会议

钉钉又发新版本!把 AI 搬进每一次对话和会议

钉钉又发新版本!把 AI 搬进每一次对话和会议 梦晨 2025-12-11 15:33:51 来源:量子位 A...
商汤Seko2.0重磅发布,合作短剧登顶抖音AI短剧榜No.1

商汤Seko2.0重磅发布,合作短剧登顶抖音AI短剧榜No.1

商汤Seko2.0重磅发布,合作短剧登顶抖音AI短剧榜No.1 十三 2025-12-15 14:13:14 ...
最新评论
ufabet ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง
tornado crypto mixer tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.
ดูบอลสด ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
Obrazy Sztuka Nowoczesna Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.
ufabet ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
ufabet ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!
ufabet ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
热评文章
读懂2025中国AI走向!公司×产品×人物×方案,最值得关注的都在这里了

读懂2025中国AI走向!公司×产品×人物×方案,最值得关注的都在这里了

读懂2025中国AI走向!公司×产品×人物×方案,最值得关注的都在这里了 衡宇 2025-12-10 12:3...
5天连更5次,可灵AI年末“狂飙式”升级

5天连更5次,可灵AI年末“狂飙式”升级

5天连更5次,可灵AI年末“狂飙式”升级 思邈 2025-12-10 14:28:37 来源:量子位 让更大规...
戴尔 x OpenCSG,推出⾯向智能初创企业的⼀体化 IT 基础架构解决方案

戴尔 x OpenCSG,推出⾯向智能初创企业的⼀体化 IT 基础架构解决方案

戴尔 x OpenCSG,推出⾯向智能初创企业的⼀体化 IT 基础架构解决方案 十三 2025-12-10 1...
九章云极独揽量子位三项大奖:以“一度算力”重构AI基础设施云格局

九章云极独揽量子位三项大奖:以“一度算力”重构AI基础设施云格局

九章云极独揽量子位三项大奖:以“一度算力”重构AI基础设施云格局 量子位的朋友们 2025-12-10 18:...
乐奇Rokid这一年,一路狂飙不回头

乐奇Rokid这一年,一路狂飙不回头

乐奇Rokid这一年,一路狂飙不回头 梦瑶 2025-12-10 20:41:15 来源:量子位 梦瑶 发自 ...