字节跳动联手中国科学技术大学,发布多模态大模型UniDoc

440次阅读
没有评论

品玩8月24日讯,据 Arxiv 页面显示,中国科学技术大学近日联手字节跳动,推出一款通用多模态大模型UniDoc。

据悉,UniDoc可以同时进行文本检测、识别、定位和理解。研究团队表示,UniDoc 是一种新型的多模态模型,配备了文本检测和识别功能,此外,UniDoc 利用任务之间的有益互动来提高每个任务的性能。为了实现 UniDoc的功能,研究团队在大型指令跟随数据集上进行统一的多模态指令调整。

实验结果表示,UniDoc 在多个具有挑战性的基准测试中均取得了最先进的成绩。

字节跳动联手中国科学技术大学,发布多模态大模型UniDoc

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 
评论(没有评论)
Generated by Feedzy