蚂蚁医疗大模型拿下MedBench测评“双料”冠军,原生多模态+千亿数据

988次阅读
没有评论

蚂蚁医疗大模型拿下MedBench测评“双料”冠军,原生多模态+千亿数据

评测榜单97.5、自测榜单98.2的高分

最近,国内权威医疗大模型评测平台MedBench在官网更新了榜单。

多个医疗AI产品及研究团队入榜,其中蚂蚁AI健康管家团队研发的蚂蚁医疗大模型以评测榜单97.5、自测榜单98.2的高分再度夺得双料冠军。

蚂蚁医疗大模型拿下MedBench测评“双料”冠军,原生多模态+千亿数据

(MedBench评测榜单截图)

蚂蚁医疗大模型拿下MedBench测评“双料”冠军,原生多模态+千亿数据

(MedBench自测榜单截图)

MedBench测评结果显示,蚂蚁医疗大模型在医学知识问答、医学语言生成、复杂医学推理三类单项中位居第一,同时,在医学语言理解和医疗安全和伦理等纬度也有突出表现。在此前的榜单综合测评中,蚂蚁医疗大模型也长期位居综合榜第一。

医疗行业是复杂度较高的领域,医疗大模型实时评估体系对应用稳定落地尤为关键。MedBench为中文医疗大语言模型提供了一个公平、透明且科学的评估标准,蚂蚁医疗大模型登顶榜单,意味着其当前的技术能力转化为医疗AI产品具备专业度和领先性。

据了解,蚂蚁医疗健康团队近期完成了基于强化学习的新一代医疗推理模型研发。AI引擎升级后,该垂直行业大模型不仅具备“医学思维”推理能力,还能完成“图、文、音视频等”多模态交互。基于此,蚂蚁医疗大模型添加百亿级中英文图文、千亿级医疗文本语料及千万级高质量医疗知识图谱进行专业知识训练,经过医患诊疗、药厂等真实场景问答的多任务微调,以及数百个专业医学团队、医生标注数据的强化学习。以医学报告、药品、毛发等图像识别为例,目前该模型准确率达90%以上。

在安全性上,蚂蚁医疗大模型集合了蚂蚁集团在隐私安全风控方面的技术优势,并在数据使用的去标识化方面遵循安全隐私标准。从去年7月推出以来,还面向行业开放了配套的“可信一体机+可信云”解决方案,保障数据隐私与算力效率,为医院、医疗机构提供可靠的本地部署与数据保护支持。

据悉,蚂蚁医疗健康成立至今已有10年,从2023年开始进军医疗AI领域,除了投入垂直领域大模型技术研发外,在AI应用层面同样进展迅速。

公开资料显示,其与浙江卫健委联合推出全国首个省级官方AI健康应用“安诊儿”,已累计服务近3000万人次,覆盖浙江省内1000余家医疗机构。去年7月,与国内头部三家医院、权威医疗机构成立AI医疗创新应用“联盟”以来,蚂蚁医疗健康已与各地卫健委、医保局、医院、医生合作研发了近百个医生智能体,在完成对好大夫在线收购后,双方在AI辅助医生工作方面开展探索,推出“AI科普助手”等系列产品。截至目前,蚂蚁医疗大模型已经成为业内应用场景最丰富、与医疗机构、医生、医院共建最深的垂类大模型之一。

版权所有,未经授权不得以任何形式转载及使用,违者必究。

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 0
评论(没有评论)

文心AIGC

2025 年 3 月
 12
3456789
10111213141516
17181920212223
24252627282930
31  
文心AIGC
文心AIGC
人工智能ChatGPT,AIGC指利用人工智能技术来生成内容,其中包括文字、语音、代码、图像、视频、机器人动作等等。被认为是继PGC、UGC之后的新型内容创作方式。AIGC作为元宇宙的新方向,近几年迭代速度呈现指数级爆发,谷歌、Meta、百度等平台型巨头持续布局
文章搜索
热门文章
清库存!DeepSeek突然补全R1技术报告,训练路径首次详细公开

清库存!DeepSeek突然补全R1技术报告,训练路径首次详细公开

清库存!DeepSeek突然补全R1技术报告,训练路径首次详细公开 Jay 2026-01-08 20:18:...
训具身模型遇到的很多问题,在数据采集时就已经注定了丨鹿明联席CTO丁琰分享

训具身模型遇到的很多问题,在数据采集时就已经注定了丨鹿明联席CTO丁琰分享

训具身模型遇到的很多问题,在数据采集时就已经注定了丨鹿明联席CTO丁琰分享 衡宇 2026-01-08 20:...
「北京版幻方」冷不丁开源SOTA代码大模型!一张3090就能跑,40B参数掀翻Opus-4.5和GPT-5.2

「北京版幻方」冷不丁开源SOTA代码大模型!一张3090就能跑,40B参数掀翻Opus-4.5和GPT-5.2

「北京版幻方」冷不丁开源SOTA代码大模型!一张3090就能跑,40B参数掀翻Opus-4.5和GPT-5.2...
AI金矿上打盹的小红书,刚刚醒了一「点点」

AI金矿上打盹的小红书,刚刚醒了一「点点」

AI金矿上打盹的小红书,刚刚醒了一「点点」 鱼羊 2025-12-26 17:04:08 来源:量子位 一个积...
最新评论
ufabet ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง
tornado crypto mixer tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.
ดูบอลสด ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
Obrazy Sztuka Nowoczesna Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.
ufabet ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
ufabet ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!
ufabet ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
热评文章
海信CES发布全新一代RGB-Mini LED,全球首创玲珑4芯真彩背光

海信CES发布全新一代RGB-Mini LED,全球首创玲珑4芯真彩背光

海信CES发布全新一代RGB-Mini LED,全球首创玲珑4芯真彩背光 量子位的朋友们 2026-01-06...
英特尔CES奇袭老黄大本营!英伟达显卡刚涨价,最强酷睿量产出货

英特尔CES奇袭老黄大本营!英伟达显卡刚涨价,最强酷睿量产出货

英特尔CES奇袭老黄大本营!英伟达显卡刚涨价,最强酷睿量产出货 十三 2026-01-06 13:54:54 ...
陈天桥代季峰打响2026大模型第一枪:30B参数跑出1T性能

陈天桥代季峰打响2026大模型第一枪:30B参数跑出1T性能

陈天桥代季峰打响2026大模型第一枪:30B参数跑出1T性能 鹭羽 2026-01-06 14:28:58 来...
OpenAI推理第一人离职,7年打造了o3/o1/GPT-4/Codex

OpenAI推理第一人离职,7年打造了o3/o1/GPT-4/Codex

OpenAI推理第一人离职,7年打造了o3/o1/GPT-4/Codex 衡宇 2026-01-06 13:0...