品玩6月7日讯,OPPO 研究院近日发表论文,介绍了一款专注图片标记的基础模型Recognize Anything Model ,简称为RAM。
据论文表示,RAM 中引入了一种全新的图像标记范例,对大规模图像文本进行训练,以此来代替传统的手动注释。
论文表示,通过评估测试,团队认为 RAM 在图片标记方面有着令人印象深刻的性能,其能力优于 CLIP和 BLIP。
正文完
可以使用微信扫码关注公众号(ID:xzluomor)