腾讯：零样本多模态标签的大语言模型TagGPT

2,119次阅读

标签在当代互联网时代的各种应用中起着至关重要的作用，如搜索引擎和推荐系统中的多媒体内容有效分发。最近，大型语言模型（LLMs）在各种任务中展现出了令人瞩目的能力。在本文中，本文提出了TagGPT，这是一个完全自动化的系统，能够以完全零-shot的方式进行标签提取和多模态标记。本文的核心见解是，通过精心设计的提示，LLMs能够根据多模态数据的文本提示提取和推理出适当的标签。例如，OCR，ASR，标题等。具体来说，为了自动建立反映用户意图和兴趣的高质量标签集，TagGPT通过提示LLMs预测大规模候选标签，经过词频和语义过滤。针对需要标记以进行分发的新实体，TagGPT提供两个零-shot标记的选择，即，生成方法和标签集的后期语义匹配以及早期提示中的早期匹配的选择性方法。值得注意的是，TagGPT提供了一个基于模块化框架的系统级解决方案，配备了预训练的LLM（这里使用GPT-3.5）和一个句子嵌入模型（这里使用SimCSE），可以无缝地替换为任何您想要的更高级的模型。TagGPT适用于现代社交媒体中各种数据的模态，并展示了对广泛应用范围的强大泛化能力。本文在公开可用的数据集（即Kuaishou和Food.com）上评估了TagGPT，并展示了TagGPT与现有哈希标签和现成标签器相比的有效性。

总结：

TagGPT是一种大型语言模型，具有零-shot多模式标记功能。它可以同时处理文本和图像信息，并能够在未经过任何训练的情况下为图像进行标记。TagGPT使用了Transformer架构，该架构已被证明在处理自然语言时非常有效。它还使用了零-shot学习方法，这意味着它可以使用先前未见过的标记类型进行标记，而无需进行传统的监督式训练。TagGPT的训练是由自然语言处理任务和图像标记任务组成的，这使得它成为一种具有更广泛应用领域的模型。

标题：TagGPT: Large Language Models are Zero-shot Multimodal Taggers

作者：Chen Li, Yixiao Ge, Jiayong Mao, Dian Li, Ying Shan

平台：https://github.com/TencentARC/TagGPT

腾讯：零样本多模态标签的大语言模型TagGPT

正文完

可以使用微信扫码关注公众号（ID：xzluomor）

AI AR F1 GPT HTML RSS 互联网大型语言模型架构设计

发表至：智源

2023年4月7日

【目标定位】多站纯方位被动定位(ca模型)附Matlab代码

智源团队在蛋白质结构预测竞赛CAMEO登16次榜首

“哄女友挑战”上线即爆火，两天烧掉10亿token，AI已通关

1月，25家药企裁员，1家倒闭！

早报｜Google 将把 AI 聊天加入搜索引擎/苏炳添回应使用 iPhone 14/小米 13 Ultra 本月见

MetaAI提出DIFFMAE：扩散模型与MAE的首次结合

评论（没有评论）

2023 年 4 月
一	二	三	四	五	六	日
	1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30

文心AIGC

人工智能ChatGPT，AIGC指利用人工智能技术来生成内容，其中包括文字、语音、代码、图像、视频、机器人动作等等。被认为是继PGC、UGC之后的新型内容创作方式。AIGC作为元宇宙的新方向，近几年迭代速度呈现指数级爆发，谷歌、Meta、百度等平台型巨头持续布局

文章搜索

最新评论

ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง

tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.

ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.

ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.

ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.

Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.

ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.

ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!

ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.

经典留声机

经典流行从来都不冲突

在这里，听见你曾经的故事

新浪微博：主播小D

小红书：小D就是我

抖音号：52915017

Search Episodes

薛之谦：从“人歌分离”到“深情解构者”的音乐涅槃之路（上）

2025年6月30日

主播小D

你一定听过这些经典合唱–第一篇

2025年1月20日

主播小D

缅怀一代歌王罗文的经典之声–第二篇

2024年12月30日

主播小D

缅怀一代歌王罗文的经典之声–第一篇

2024年12月27日

主播小D

在这里，听琼瑶，岁月长歌–第二篇

2024年12月24日

主播小D

在这里，听琼瑶，岁月长歌–第一篇

2024年12月21日

主播小D

你总能在这些歌里找到你的回忆–第一百零三篇

2024年12月18日

主播小D

你总能在这些歌里找到你的回忆–第一百零四篇

2024年12月13日

主播小D

《这些歌都发行在2001年–第三篇》

2024年12月10日

主播小D

《这些歌都发行在2001年–第二篇》

2024年12月7日

主播小D

Search Results placeholder

2023 年 4 月
一	二	三	四	五	六	日
	1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30