CK 投稿

量子位 | 公众号 QbitAI

多模态，已经成为大模型最重要的发展方向之一。

从GPT-4V到GPT-4o，多模态大模型在多模态感知与理解方面的进展，正在不断惊艳世界。

然而，利用多模态大模型来应对自动驾驶中复杂场景，特别是罕见但关键的难例场景，仍然是一个未解的难题。

围绕这一挑战，现在，一场由香港科技大学、香港中文大学等研究机构发起的ECCV 2024 Workshop来了。

这场Workshop旨在研讨当前最先进的自动驾驶技术，与完全可靠的智能自动驾驶代理之间的差距，促进多模态大模型感知与理解、先进的AIGC技术在自动驾驶系统中的应用，以及端到端自动驾驶等方面的创新研究。

活动主要包括论文投稿和挑战赛两部分，如果你对此感兴趣，详情请看——

Workshop征稿

本次论文征稿关注自动驾驶场景多模态感知与理解、自动驾驶场景图像与视频生成、端到端自动驾驶、下一代工业级自动驾驶解决方案等主题，包括但不限于：

Corner case mining and generation for autonomous driving.
3D object detection and scene understanding.
Semantic occupancy prediction.
Weakly supervised learning for 3D Lidar and 2D images.
One/few/zero-shot learning for autonomous perception.
End-to-end autonomous driving systems with Large Multimodal Models.
Large Language Models techniques adaptable for self-driving systems.
Safety/explainability/robustness for end-to-end autonomous driving.
Domain adaptation and generalization for end-to-end autonomous driving.

投稿规则：

本次投稿将通过OpenReview平台实行双盲审稿，接收两种形式的投稿：

完整论文：论文篇幅在14页内，采用ECCV格式，参考文献和补充材料篇幅不限。被接收的论文将成为ECCV官方论文集的一部分，不允许重新提交到其他会议。
扩展摘要：论文篇幅为4页内，采用CVPR格式，参考文献和补充材料篇幅不限。被接收的论文不会被包含在ECCV官方论文集中，允许重新提交到其他的会议。

投稿入口：

完整论文：https://openreview.net/group?id=thecvf.com/ECCV/2024/Workshop/W-CODA
扩展摘要：https://openreview.net/group?id=thecvf.com/ECCV/2024/Workshop/W-CODA_Abstract_Paper_Track

自动驾驶难例场景多模态理解与视频生成挑战赛

本次竞赛旨在提升多模态模型在自动驾驶中极端情况的感知与理解，并生成描绘这些极端情况的能力。

赛道一：自动驾驶难例场景感知与理解

本赛道关注多模态大模型（MLLMs）在自动驾驶难例场景的感知和理解能力，包括整体场景理解、区域理解和行驶建议等方面的能力，旨在推动更加可靠且可解释的自动驾驶代理的发展。

赛道二：自动驾驶难例场景视频生成

本赛道关注扩散模型生成多视角自动驾驶场景视频的能力。基于给定的自动驾驶场景3D几何结构，模型需要生成与之对应的自动驾驶场景视频，并保证时序一致性、多视角一致性、指定的分辨率和视频时长。

竞赛时间：2024年6月15日至2024年8月15日

奖项设置：冠军1000美元，亚军800美元，季军600美元（每赛道）

时间节点

Workshop主页：
https://coda-dataset.github.io/w-coda2024/

2024 年 6 月
一	二	三	四	五	六	日
	1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30

ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง

tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.

ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.

ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.

ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.

Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.

ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.

ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!

ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.

多模态大模型+自动驾驶=？ECCV’24这场Workshop开启招募啦

Workshop征稿

自动驾驶难例场景多模态理解与视频生成挑战赛

时间节点

小说创作

清库存！DeepSeek突然补全R1技术报告，训练路径首次详细公开

训具身模型遇到的很多问题，在数据采集时就已经注定了丨鹿明联席CTO丁琰分享

「北京版幻方」冷不丁开源SOTA代码大模型！一张3090就能跑，40B参数掀翻Opus-4.5和GPT-5.2

AI金矿上打盹的小红书，刚刚醒了一「点点」

字节Seed：大概念模型来了，推理的何必是下一个token

海信CES发布全新一代RGB-Mini LED，全球首创玲珑4芯真彩背光

英特尔CES奇袭老黄大本营！英伟达显卡刚涨价，最强酷睿量产出货

陈天桥代季峰打响2026大模型第一枪：30B参数跑出1T性能

OpenAI推理第一人离职，7年打造了o3/o1/GPT-4/Codex

文心AIGC