牛津大学：通过交叉注意力引导实现不需要训练的布局生成模型

1,620次阅读

最近基于扩散的生成器一般可以基于文本提示生成高质量的图像。然而，它们不能正确解释指定构图空间布局的指令。本文提出了一种简单的方法，可以在不需要对图像生成器进行训练或微调的情况下实现稳健的布局控制。本文称之为布局引导技术，它通过操纵模型用于交互文本和视觉信息的交叉注意力层，根据用户指定的布局方向引导重建。为了确定如何最好地引导注意力，本文研究了在生成图像时不同注意力图的作用，并尝试了两种备选策略，即前向和反向引导。本文通过多个实验对本文的方法进行定量和定性评估，验证了其有效性。本文进一步展示了布局引导技术的多种用途，例如将其扩展到编辑给定实际图像的布局和上下文。

总结：

本文提出了一种基于交叉注意力引导的无需训练的布局控制方法。该方法包含两个阶段：空间抽象阶段和位置校正阶段。在空间抽象阶段，算法使用交叉注意力模块来对目标布局进行抽象，将目标布局转换为类似于向量的表示。在位置校正阶段，算法利用这些抽象表示并结合简单的位置偏差差异来校正中间过程中的错误。实验结果表明该方法在多个数据集和任务中都能有效地优化布局控制，与其他方法相比具有更好的性能和速度。

标题：Training-Free Layout Control with Cross-Attention Guidance

作者：Minghao Chen, Iro Laina, Andrea Vedaldi

项目：https://silent-chen.github.io/layout-guidance/

牛津大学：通过交叉注意力引导实现不需要训练的布局生成模型

正文完

可以使用微信扫码关注公众号（ID：xzluomor）

发表至：智源

2023年4月10日

50张图“毒倒”Stable Diffusion，汽车和牛都分不清了

专访 VideoPoet 作者：视频模型技术会收敛，LLM 将取代diffusion带来真正的视觉智能

中国发展高层论坛2024丨薛澜：人工智能面临治理挑战

6次提及“人工智能”，数据局起草的“数据要素×”三年行动计划如何激活数据要素潜能

Chroma获得1800万美元种子轮融资

Adobe提出InstantBooth：无测试时间微调的个性化文本-图像生成

评论（没有评论）

2023 年 4 月
一	二	三	四	五	六	日
	1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30

文心AIGC

人工智能ChatGPT，AIGC指利用人工智能技术来生成内容，其中包括文字、语音、代码、图像、视频、机器人动作等等。被认为是继PGC、UGC之后的新型内容创作方式。AIGC作为元宇宙的新方向，近几年迭代速度呈现指数级爆发，谷歌、Meta、百度等平台型巨头持续布局

文章搜索

最新评论

ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง

tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.

ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.

ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.

ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.

Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.

ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.

ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!

ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.

经典留声机

经典流行从来都不冲突

在这里，听见你曾经的故事

新浪微博：主播小D

小红书：小D就是我

抖音号：52915017

Search Episodes

薛之谦：从“人歌分离”到“深情解构者”的音乐涅槃之路（上）

2025年6月30日

主播小D

你一定听过这些经典合唱–第一篇

2025年1月20日

主播小D

缅怀一代歌王罗文的经典之声–第二篇

2024年12月30日

主播小D

缅怀一代歌王罗文的经典之声–第一篇

2024年12月27日

主播小D

在这里，听琼瑶，岁月长歌–第二篇

2024年12月24日

主播小D

在这里，听琼瑶，岁月长歌–第一篇

2024年12月21日

主播小D

你总能在这些歌里找到你的回忆–第一百零三篇

2024年12月18日

主播小D

你总能在这些歌里找到你的回忆–第一百零四篇

2024年12月13日

主播小D

《这些歌都发行在2001年–第三篇》

2024年12月10日

主播小D

《这些歌都发行在2001年–第二篇》

2024年12月7日

主播小D

Search Results placeholder

2023 年 4 月
一	二	三	四	五	六	日
	1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30