中文多模态大模型VisCPM开放API接口!升级版本能力远超同类模型

1,365次阅读
没有评论

中文多模态大模型VisCPM开放API接口!升级版本能力远超同类模型

今年6月底,OpenBMB开源了面壁智能、清华NLP实验室和知乎联合研发的SOTA 开源中文多模态大模型VisCPM。两个多月以来研发同学不断突破,VisCPM得到全新升级。

  • 易用性升级:提供API调用,提供在线Demo,支持用户本地图形化界面部署,支持低资源推理(最低5G显存运行);

  • 能力更强:对话能力升级至v1.1版本,在多模态对话、细节描述、复杂推理三个专项性能均超过其它中文模型;

  • 论文发布:论文对VisCPM的多语言多模态技术进行了详细介绍,并进一步推广至更多语言。目前基于LLaMA的多模态对话模型在德语、法语、西班牙语等6种语言上表现出色。

 

中文多模态大模型VisCPM开放API接口!升级版本能力远超同类模型中文多模态大模型VisCPM开放API接口!升级版本能力远超同类模型

 易用性升级VisCPM开放API接口

在易用性方面,VisCPM自发布以来持续升级:

中文多模态大模型VisCPM开放API接口!升级版本能力远超同类模型

值得一提的是,近期VisCPM-Chat 开放API ,可以使开发者更便捷地接入大模型能力,提高应用程序的开发效率,促进数据共享和生态共建。开发者仅通过如下代码,就可轻松体验中文领域图文理解最强的VisCPM-Chat,API接口支持的输入格式和使用方式如下:

import requests
import base64

url = "http://34.143.180.202:3389/viscpm"
resp = requests.post(url, json={
    # need to modify
    "image": base64.b64encode(open("path/to/image", "rb").read()).decode(),
    "question": "描述一下这张图片",
})
resp = resp.json()
print(resp)

中文多模态大模型VisCPM开放API接口!升级版本能力远超同类模型中文多模态大模型VisCPM开放API接口!升级版本能力远超同类模型

 能力更强:VisCPM v1.1测评遥遥领先

8月18日,VisCPM-Chat-v1.1版本发布,带来更强的细节理解和复杂推理能力!在LLaVA标准评测基准上的结果显示 VisCPM在中文多模态模型中综合能力最强。

可以看到,VisCPM在与其它中英双语的多模态大模型的横向比较中,中文能力整体得分最高(其中细节描述和复杂推理能力尤为突出),英文能力也媲美LLaVA。而在和v1.0版本的纵向比较中,VisCPMv1.1版本在细节描述方面的得分大幅提升。

中文多模态大模型VisCPM开放API接口!升级版本能力远超同类模型

* LLaVA评测基准基于COCO数据集(Common Objects in Context,由微软发布的标准多模态数据集)构建,从多模态对话、细节描述和复杂推理三方面全面考察多模态交互能力。

* 评测基准使用GPT-4作为打分模型,从帮助度、相关度、准确度和详细程度4个维度,给标准答案和参评模型答案打分,得到对应分数(从1至10),分数越高表明整体表现越好。

* VisCPM-Chat(v1.0):VisCPM-Chat有两个模型版本,分别为 VisCPM-Chat-balance 和 VisCPM-Chat-zhplus,前者在英文和中文两种语言上的能力较为平衡,后者在中文能力上更加突出。本文提到的VisCPM v1.1是VisCPM-Chat的升级版。

 

最后,再次欢迎大家调用API接口。相信无论您是开发者、研究人员还是企业家,都可以利用VisCPM出色的图片细节描述和复杂推理能力找到无限的可能性。VisCPM能为您提供了前所未有的创造力,让您能够重新定义您的项目,为用户带来卓越的价值。另一方面,VisCPM的成长需要您的贡献,让我们一起转动数据飞轮,共建持续进化的大模型生态。

 

 

 ➤  VisCPM开源地址 
🔗 https://github.com/OpenBMB/VisCPM
 ➤  VisCPM论文链接 
🔗https://arxiv.org/pdf/2308.12038.pdf

 ➤  加社群/ 提建议/ 有疑问 

请找 OpenBMB 万能小助手:中文多模态大模型VisCPM开放API接口!升级版本能力远超同类模型

中文多模态大模型VisCPM开放API接口!升级版本能力远超同类模型中文多模态大模型VisCPM开放API接口!升级版本能力远超同类模型中文多模态大模型VisCPM开放API接口!升级版本能力远超同类模型

中文多模态大模型VisCPM开放API接口!升级版本能力远超同类模型

官方网站

https://www.openbmb.org

GitHub
https://github.com/OpenBMB
https://github.com/thunlp

 

长期开放招聘|含实习

开发岗  |  算法岗  |  产品

交流QQ群
735930538

 

 

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 0
评论(没有评论)

文心AIGC

2023 年 9 月
 123
45678910
11121314151617
18192021222324
252627282930  
文心AIGC
文心AIGC
人工智能ChatGPT,AIGC指利用人工智能技术来生成内容,其中包括文字、语音、代码、图像、视频、机器人动作等等。被认为是继PGC、UGC之后的新型内容创作方式。AIGC作为元宇宙的新方向,近几年迭代速度呈现指数级爆发,谷歌、Meta、百度等平台型巨头持续布局
文章搜索
热门文章
潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026 Jay 2025-12-22 09...
面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25

面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25

面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25 鹭羽 2025-12-13 22:37...
5天连更5次,可灵AI年末“狂飙式”升级

5天连更5次,可灵AI年末“狂飙式”升级

5天连更5次,可灵AI年末“狂飙式”升级 思邈 2025-12-10 14:28:37 来源:量子位 让更大规...
钉钉又发新版本!把 AI 搬进每一次对话和会议

钉钉又发新版本!把 AI 搬进每一次对话和会议

钉钉又发新版本!把 AI 搬进每一次对话和会议 梦晨 2025-12-11 15:33:51 来源:量子位 A...
商汤Seko2.0重磅发布,合作短剧登顶抖音AI短剧榜No.1

商汤Seko2.0重磅发布,合作短剧登顶抖音AI短剧榜No.1

商汤Seko2.0重磅发布,合作短剧登顶抖音AI短剧榜No.1 十三 2025-12-15 14:13:14 ...
最新评论
ufabet ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง
tornado crypto mixer tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.
ดูบอลสด ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
Obrazy Sztuka Nowoczesna Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.
ufabet ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
ufabet ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!
ufabet ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
热评文章
读懂2025中国AI走向!公司×产品×人物×方案,最值得关注的都在这里了

读懂2025中国AI走向!公司×产品×人物×方案,最值得关注的都在这里了

读懂2025中国AI走向!公司×产品×人物×方案,最值得关注的都在这里了 衡宇 2025-12-10 12:3...
5天连更5次,可灵AI年末“狂飙式”升级

5天连更5次,可灵AI年末“狂飙式”升级

5天连更5次,可灵AI年末“狂飙式”升级 思邈 2025-12-10 14:28:37 来源:量子位 让更大规...
戴尔 x OpenCSG,推出⾯向智能初创企业的⼀体化 IT 基础架构解决方案

戴尔 x OpenCSG,推出⾯向智能初创企业的⼀体化 IT 基础架构解决方案

戴尔 x OpenCSG,推出⾯向智能初创企业的⼀体化 IT 基础架构解决方案 十三 2025-12-10 1...
九章云极独揽量子位三项大奖:以“一度算力”重构AI基础设施云格局

九章云极独揽量子位三项大奖:以“一度算力”重构AI基础设施云格局

九章云极独揽量子位三项大奖:以“一度算力”重构AI基础设施云格局 量子位的朋友们 2025-12-10 18:...
乐奇Rokid这一年,一路狂飙不回头

乐奇Rokid这一年,一路狂飙不回头

乐奇Rokid这一年,一路狂飙不回头 梦瑶 2025-12-10 20:41:15 来源:量子位 梦瑶 发自 ...