清华首次提出数据驱动控制新形式,算法效率直翻三倍

399次阅读
没有评论

清华首次提出数据驱动控制新形式,算法效率直翻三倍

从模型标准型到数据标准型

iDLab团队 投稿

量子位 | 公众号 QbitAI

当大数据席卷各行各业,控制理论也迎来新的拐点:从依赖模型到依赖数据。

但是,在数据驱动控制领域,却缺乏一种标准化的数据表示形式

针对这一问题,清华大学李升波教授课题组(iDLab)首次将现代控制理论中的标准型概念引入数据驱动控制(datatic control)范式,提出了一种基于数据的系统描述新形式。

每个标准形式的样本由必要的转移和可插拔的属性组成,分别用于描述系统变化规律和人为定义特征。

清华首次提出数据驱动控制新形式,算法效率直翻三倍

不仅如此,该数据标准型还可根据算法需求定制属性,显著加速控制器设计,为提高数据驱动算法效率提供了新的思路。

目前,该成果已发表于ACC2025。

从模型标准型到数据标准型

人工智能的蓬勃发展,离不开数据这一核心支柱。

近年来,随着人工智能技术的广泛应用,以数据为核心的系统表征方法迅速渗透到控制领域。

控制系统的设计方法正迎来一场从模型驱动向数据驱动的范式变革,即从传统的模型驱动控制(modelic control,即model-driven control)到数据驱动控制(datatic control,即data-driven control)。

清华首次提出数据驱动控制新形式,算法效率直翻三倍

图1:两种控制范式对比

模型驱动控制(上方路径)首先利用系统辨识来拟合一个模型,然后用这个模型来合成控制器。

数据驱动控制(下方路径)则直接利用数据来求解控制器。

在模型驱动控制(modelic control)的范式下,模型的标准型是一个有力工具。

例如,现代控制理论的奠基人鲁道夫·卡尔曼(Rudolf E. Kálmán)指出:将状态空间模型表示为可控标准型或可观标准型,无需额外的判断步骤即可直接确保系统的可控性或可观性。

此外,现代群论的奠基人之一卡米耶·若尔当(Camille Jordan)指出:任何状态空间模型都可以转换为约旦标准型,系统矩阵会变为对角方阵,其对角线元素代表系统的特征值。

因此,只需检查所有特征值是否为负,即可轻松验证系统的稳定性。更进一步,不同的特征值对应着系统不同的模态,这使得控制器设计更具针对性。

数据驱动控制(datatic control)范式下的标准型是一个新问题。

近年来,随着机器人、自动驾驶等具身智能系统的蓬勃发展,海量、复杂的交互数据正以前所未有的速度被生成。这不仅为传统控制算法带来了巨大挑战,也引出了一个全新的议题:

在数据驱动控制范式下,如何构建一个有效利用大规模数据的标准描述方式?即是否存在数据驱动版本的标准型?

数据的描述形式直接决定了后续控制器设计算法的运行效率和可扩展性。

以强化学习为例,训练算法通常涉及大量的迭代计算和高维数据处理。

在这一过程中,算法很容易陷入重复计算的泥潭,例如在每一步训练迭代中,都重新计算样本间的范数距离、特征相似度等信息。

这种重复性的计算不仅耗时,而且对计算资源造成了显著的浪费,严重制约了算法在现实世界中的部署和应用。

因此,如何高效、标准地组织和描述数据,以减少冗余计算、加速算法运行,是数据驱动控制范式面临的一项核心挑战。

类比于模型标准型,该研究首次提出,适用于数据驱动控制系统的标准描述形式:每条样本数据包含两个部分(如图2所示):

清华首次提出数据驱动控制新形式,算法效率直翻三倍

图2:数据标准型示意图

(1)必要的转移部分

,即<当前状态

清华首次提出数据驱动控制新形式,算法效率直翻三倍

,当前动作

清华首次提出数据驱动控制新形式,算法效率直翻三倍

,下一状态

清华首次提出数据驱动控制新形式,算法效率直翻三倍

>;

(2)可插拔的属性部分,例如奖励信号或其他人工设计特征。

前者蕴含了控制器设计必要的系统的动力学信息,后者可以根据控制器设计算法的需求来灵活定制与取用,降低存储压力,加速算法运行,即提高控制器设计效率。

仿真实例

该研究给出了一个典型的数据标准型应用实例。对于给定数据集,为了使得设计出的控制器效果可靠,许多强化学习算法存在近邻搜索的需求。

例如给定回放的样本状态

清华首次提出数据驱动控制新形式,算法效率直翻三倍

,算法需要在线计算当前策略

清华首次提出数据驱动控制新形式,算法效率直翻三倍

的行为与数据集行为之间的距离:

清华首次提出数据驱动控制新形式,算法效率直翻三倍

由于需要遍历数据集中每个样本来寻找最近邻,计算负担非常沉重。

在数据标准型的视角下,对于每个样本,可以通过提前定制一种特殊的空间属性,显著加速近邻搜索这一过程。

具体地,如图3所示,提前在样本空间中约定n个锚点

清华首次提出数据驱动控制新形式,算法效率直翻三倍

,对于每个样本,计算其与各锚点的距离保存为空间属性。

清华首次提出数据驱动控制新形式,算法效率直翻三倍

图3:标准型的空间属性示意图 图3:标准型的空间属性示意图

当每个样本都具备空间属性后,该研究给出如下空间筛选条件定理来加速近邻搜索。

定理1(空间筛选条件)

考虑一个包含

清华首次提出数据驱动控制新形式,算法效率直翻三倍

个锚点的数据集。记C为一个选定的样本,而S为任意其他样本。若S位于C的R-邻域范围内,则一个需要满足的

必要条件为:

清华首次提出数据驱动控制新形式,算法效率直翻三倍

其中

清华首次提出数据驱动控制新形式,算法效率直翻三倍

表示表示逻辑与运算符。

清华首次提出数据驱动控制新形式,算法效率直翻三倍

图4:空间标准型的空间筛选机制示意图

应用这一空间筛选条件,只需要一行判断指令,就可以快速缩小候选范围(如图4所示),显著加速最近邻搜索的过程,从而提高算法的整体运行效率。

该研究在D4RL数据集的Hopper环境下进行了实验,对引入空间标准型前后的训练时间进行了比较。

图5清晰地展示了这一改进:基础版本(蓝色曲线)的训练耗时约20小时,而应用了空间标准型筛选机制(橙色曲线)后,训练时间缩短至仅7小时,实现了三倍的效率提升

清华首次提出数据驱动控制新形式,算法效率直翻三倍

图5:应用空间标准型前后的训练时间对比

总的来说,数据标准型可以极小的存储空间开销,换取显著的时间效率优势。

除此之外,它还可以根据算法需求灵活插拔属性部分来降低存储需求,具备扩展性,为提高数据驱动控制算法效率提供了新的方向。

论文链接:https://ieeexplore.ieee.org/document/11107988

版权所有,未经授权不得以任何形式转载及使用,违者必究。

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 0
评论(没有评论)

文心AIGC

2025 年 9 月
1234567
891011121314
15161718192021
22232425262728
2930  
文心AIGC
文心AIGC
人工智能ChatGPT,AIGC指利用人工智能技术来生成内容,其中包括文字、语音、代码、图像、视频、机器人动作等等。被认为是继PGC、UGC之后的新型内容创作方式。AIGC作为元宇宙的新方向,近几年迭代速度呈现指数级爆发,谷歌、Meta、百度等平台型巨头持续布局
文章搜索
热门文章
清库存!DeepSeek突然补全R1技术报告,训练路径首次详细公开

清库存!DeepSeek突然补全R1技术报告,训练路径首次详细公开

清库存!DeepSeek突然补全R1技术报告,训练路径首次详细公开 Jay 2026-01-08 20:18:...
训具身模型遇到的很多问题,在数据采集时就已经注定了丨鹿明联席CTO丁琰分享

训具身模型遇到的很多问题,在数据采集时就已经注定了丨鹿明联席CTO丁琰分享

训具身模型遇到的很多问题,在数据采集时就已经注定了丨鹿明联席CTO丁琰分享 衡宇 2026-01-08 20:...
「北京版幻方」冷不丁开源SOTA代码大模型!一张3090就能跑,40B参数掀翻Opus-4.5和GPT-5.2

「北京版幻方」冷不丁开源SOTA代码大模型!一张3090就能跑,40B参数掀翻Opus-4.5和GPT-5.2

「北京版幻方」冷不丁开源SOTA代码大模型!一张3090就能跑,40B参数掀翻Opus-4.5和GPT-5.2...
AI金矿上打盹的小红书,刚刚醒了一「点点」

AI金矿上打盹的小红书,刚刚醒了一「点点」

AI金矿上打盹的小红书,刚刚醒了一「点点」 鱼羊 2025-12-26 17:04:08 来源:量子位 一个积...
最新评论
ufabet ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง
tornado crypto mixer tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.
ดูบอลสด ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
Obrazy Sztuka Nowoczesna Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.
ufabet ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
ufabet ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!
ufabet ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
热评文章
海信CES发布全新一代RGB-Mini LED,全球首创玲珑4芯真彩背光

海信CES发布全新一代RGB-Mini LED,全球首创玲珑4芯真彩背光

海信CES发布全新一代RGB-Mini LED,全球首创玲珑4芯真彩背光 量子位的朋友们 2026-01-06...
英特尔CES奇袭老黄大本营!英伟达显卡刚涨价,最强酷睿量产出货

英特尔CES奇袭老黄大本营!英伟达显卡刚涨价,最强酷睿量产出货

英特尔CES奇袭老黄大本营!英伟达显卡刚涨价,最强酷睿量产出货 十三 2026-01-06 13:54:54 ...
陈天桥代季峰打响2026大模型第一枪:30B参数跑出1T性能

陈天桥代季峰打响2026大模型第一枪:30B参数跑出1T性能

陈天桥代季峰打响2026大模型第一枪:30B参数跑出1T性能 鹭羽 2026-01-06 14:28:58 来...
OpenAI推理第一人离职,7年打造了o3/o1/GPT-4/Codex

OpenAI推理第一人离职,7年打造了o3/o1/GPT-4/Codex

OpenAI推理第一人离职,7年打造了o3/o1/GPT-4/Codex 衡宇 2026-01-06 13:0...