元象开源百亿参数通用大模型 XVERSE-13B

1,388次阅读
没有评论

87日,元象XVERSE公司宣布开源其百亿参数的高性能通用大模型XVERSE-13B

XVERSE-13基于标准Transformer结构,在1.4万亿高质量、多样化tokens的训练数据上,从零训练(train from scatch)了130亿参数大模型,支持40多种语言,上下文窗口大小为8192。具有文本生成、自动化写作、数据分析、知识问答、多语言翻译、个性化交互、人物角色扮演、专业小助手等多方面能力。

展开来说,XVERSE-13B在训练预料方面构建了一个高达1.4万亿高质量、多样化tokens的训练数据集,同时优化采样策略和数据组织方式,让模型支持中、英、俄、西等40多种语言,并且多语言任务处理的性能与效果俱佳。

XVERSE-13B支持8192的上下文窗口,是同尺寸模型中最长的,从而能出色应对复杂场景,比如更长的多轮对话、知识问答与摘要等,应用范围更广泛。

模型使用标准Transforme网络结构,从零开始训练,还自主研发多项关键技术,包括高效算子、显存优化、并行调度策略、数据计算通信重叠、平台和框架协同等,让训练效率更高,模型稳定性强,在千卡集群上的峰值算力利用率可达到 58.5%,位居业界前列。

元象XVERSE方面表示,XVERSE-13B在多项权威的标准中文和英文测评中表现优异,是目前同尺寸中效果最好的多语言大模型。

元象开源百亿参数通用大模型 XVERSE-13B图源:元象XVERSE

为验证模型各项能力,XVERSE-13B通过C-EvalAGIEvalGAOKAO-Bench等三个最具影响力的中文测评基准的综合评估表现优异超越了同参数规模主流模型,如Baichuan-13BLlama-2-13BZiya-LLaMA-13B 

在中文 C-Eval 的测评中(图),XVERSE-13B 综合评分达到了 54.7 分,超越了同参数规模的主流模型。

C-EVAL测评基准由上海交通大学、清华大学以及爱丁堡大学联合创建,是面向中文语言模型的综合考试测试集,覆盖了 52 个来自不同行业领域的学科。

元象开源百亿参数通用大模型 XVERSE-13BC-Eval 中文测评结果  图源:元象XVERSE


AGIEval测评里,XVERSE-13B综合评分达到41.4分,超越了同参数规模主流模型

AGIEval测评基准由微软研究院发起,旨在全面评估基础模型在人类认知和问题解决相关任务上的能力,包含了中国的高考、司法考试,以及美国的 SATLSATGREGMAT20个公开且严谨的官方入学和职业资格考试。

GAOKAO-Bench测评中,XVERSE-13B综合评分达到了53.9分,显著领先于同参数规模的主流模型

GAOKAO-Bench 测评基准是复旦大学研究团队创建的测评框架,以中国高考题目作为数据集,用于测评大模型在中文语言理解和逻辑推理能力方面的表现。

元象开源百亿参数通用大模型 XVERSE-13B图源:元象XVERSE

英文测评表现领先 Llama-2-13B

XVERSE-13B英文表现同样出色,在英文最权威评测MMLU中,其综合评分高达55.1分,几乎在所有维度超越了同参数规模的主流模型,包括Llama-2-13BBaichuan-13B等。

元象开源百亿参数通用大模型 XVERSE-13BMMLU 英文测评结果  图源:元象XVERSE


MMLU
由加州大学伯克利分校等知名高校共同打造,集合了科学、工程、数学、人文、社会科学等领域的57个科目,主要目标是对模型的英文跨学科专业能力进行深入测评。其内容广泛,从初级水平一直涵盖到高级专业水平。

需要强调的是,测评只反映了大模型底座的核心能力,元象将持续迭代优化,全面提升模型能力。

而XVERSE-13B所体现出的高性能、全开源、可商用等诸多优势,能大大降低高校和企业部署使用大模型的成本,不仅实现了国产可替代,也是中文应用更好的选择。

XVERSE-13B有望在医疗、教育文旅、金融和娱乐等多个行业具有广阔应用前景,也将为元象自身的元宇宙应用提供强大技术支持。

免费可商用 哈工大率先使用助力研究

秉持开源精神,XVERSE-13B代码采用Apache-2.0协议,向学术研究完全开源,企业只需简单登记,即可免费商用。

哈尔滨工业大学(下称哈工大)作为我国最早从事自然语言处理研究的顶级科研团队,已经率先使用XVERSE-13B大模型推进相关研究工作。哈工大计算机科学与技术学院张伟男教授表示,开源是互联网时代主流模式,不仅能贡献社区,推动技术持续创新,还能利用协同解决算法透明性、稳定性、公众信任度等共性问题。

元象XVERSE2021年初在深圳成立,是国内领先的AI与元宇宙技术服务公司,致力于打造AI驱动的3D 内容生产与消费一站式平台,愿景为定义你的世界

20223月,公司完成AA+轮融资1.2亿美元,投资机构包括腾讯、高榕资本、五源资本、高瓴创投、红杉中国、淡马锡和CPE源峰等。元象创始人姚星是前腾讯副总裁、前腾讯AI Lab创始人、国家科技部新一代人工智能战略咨询委员会成员。

元象XVERSE创始人姚星表示:真实世界的感知智能(3D),与真实世界的认知智能(AI),是探索通用人工智能(AGI)的必由之路,也是元象持续探索3DAI前沿技术的动力。XVERSE-13B是我们在国产技术自立自强上迈出的一小步,而开源开放将激发大模型生态活力,让AI的未来发展迈出一大步,为实体经济、数字经济的发展注入强劲动力。我们期待与众多企业与开发者携手,开创大模型商用新纪元。

开源信息:

Hugging Facehttps://huggingface.co/xverse/XVERSE-13B

Githubhttps://github.com/xverse-ai/XVERSE-13B

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 0
评论(没有评论)

文心AIGC

2023 年 8 月
 123456
78910111213
14151617181920
21222324252627
28293031  
文心AIGC
文心AIGC
人工智能ChatGPT,AIGC指利用人工智能技术来生成内容,其中包括文字、语音、代码、图像、视频、机器人动作等等。被认为是继PGC、UGC之后的新型内容创作方式。AIGC作为元宇宙的新方向,近几年迭代速度呈现指数级爆发,谷歌、Meta、百度等平台型巨头持续布局
文章搜索
热门文章
潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026 Jay 2025-12-22 09...
面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25

面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25

面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25 鹭羽 2025-12-13 22:37...
商汤Seko2.0重磅发布,合作短剧登顶抖音AI短剧榜No.1

商汤Seko2.0重磅发布,合作短剧登顶抖音AI短剧榜No.1

商汤Seko2.0重磅发布,合作短剧登顶抖音AI短剧榜No.1 十三 2025-12-15 14:13:14 ...
跳过“逐字生成”!蚂蚁集团赵俊博:扩散模型让我们能直接修改Token | MEET2026

跳过“逐字生成”!蚂蚁集团赵俊博:扩散模型让我们能直接修改Token | MEET2026

跳过“逐字生成”!蚂蚁集团赵俊博:扩散模型让我们能直接修改Token | MEET2026 一水 2025-1...
10亿美元OpenAI股权兑换迪士尼版权!米老鼠救Sora来了

10亿美元OpenAI股权兑换迪士尼版权!米老鼠救Sora来了

10亿美元OpenAI股权兑换迪士尼版权!米老鼠救Sora来了 一水 2025-12-12 13:56:19 ...
最新评论
ufabet ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง
tornado crypto mixer tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.
ดูบอลสด ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
Obrazy Sztuka Nowoczesna Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.
ufabet ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
ufabet ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!
ufabet ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
热评文章
跳过“逐字生成”!蚂蚁集团赵俊博:扩散模型让我们能直接修改Token | MEET2026

跳过“逐字生成”!蚂蚁集团赵俊博:扩散模型让我们能直接修改Token | MEET2026

跳过“逐字生成”!蚂蚁集团赵俊博:扩散模型让我们能直接修改Token | MEET2026 一水 2025-1...
10亿美元OpenAI股权兑换迪士尼版权!米老鼠救Sora来了

10亿美元OpenAI股权兑换迪士尼版权!米老鼠救Sora来了

10亿美元OpenAI股权兑换迪士尼版权!米老鼠救Sora来了 一水 2025-12-12 13:56:19 ...
IDC MarketScape: 容联云位居“中国AI赋能的联络中心”领导者类别

IDC MarketScape: 容联云位居“中国AI赋能的联络中心”领导者类别

IDC MarketScape: 容联云位居“中国AI赋能的联络中心”领导者类别 量子位的朋友们 2025-1...