MIT｜语言模型的空间和时间表示

Language Models Represent Space and Time

W Gurnee, M Tegmark
[MIT]

语言模型的空间和时间表示

研究了大型语言模型(LLM)是否通过分析Llama-2系列模型中的命名实体的内部激活来学习一致的空间和时间表示。
作者构建了6个数据集，其中包含不同空间/时间尺度下的地点/事件名称及其实际坐标(世界、美国、纽约市、历史人物、娱乐、新闻标题)。
探测实验表明，LLM在早期至中期层中构建了空间/时间表示，之后达到平台期，更大的模型优于更小的模型。
空间/时间表示是线性的、对提示变化比较鲁棒的，并且在不同实体类型之间是统一的。
探测器可能学习将模型的内部坐标映射到人类坐标，但模型确实具有实体的相对定位。
识别了个别“空间神经元”和“时间神经元”，可靠地对坐标进行编码，表明模型使用了这些特征。
结果表明，LLM获得了对空间/时间维度的结构化知识，支持仅通过下一个Token的预测就可以学习字面上的世界模型的观点。

动机：研究人员想要确定大型语言模型(LLM)是否能学习到空间和时间的结构化知识，即是否能构建一个真实的世界模型。
方法：研究人员使用Llama-2系列模型，构建了六个包含空间和时间坐标的数据集，通过线性回归探测器来分析LLM在不同层次上的表示，并预测实际世界的位置或时间。
优势：研究发现，LLM能在多个尺度上学习到空间和时间的线性表示，并且这些表示对提示变化具有鲁棒性，且在不同类型的实体(如城市和地标)之间保持统一。这表明LLM不仅学习表面统计信息，而且学习了字面上的世界模型。

通过分析LLM在空间和时间数据集上的表示，发现LLM能学习到结构化的空间和时间知识，支持其不仅仅是学习表面统计信息，而是学习了字面上的世界模型。

https://arxiv.org/abs/2310.02207

MIT｜语言模型的空间和时间表示

ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง

tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.

ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.

ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.

ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.

Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.

ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.

ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!

ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.

MIT｜语言模型的空间和时间表示

Language Models Represent Space and Time

超越DeepSeek-R1，数学形式化准确率飙升至84% | 字节&南大开源

TRAE推出SOLO模式，业内首个「Context Engineer」来了

这个5亿播放的AI视频，邪乎得平平无奇

B站亮相2025世界人工智能大会，发布最受年轻人关注的TOP30 AI应用

开源Qwen一周连刷三冠，暴击闭源模型！基础模型推理编程均SOTA

刘强东连投3家具身智能！京东美团「战火」烧到外卖之外

3亿美元薪酬被10人拒绝！OpenAI首席研究官一句话引发硅谷史上最疯狂抢人大战

蚂蚁ACL活动全览！论文串讲、人才专项答疑与闭门晚宴等你报名

手术刀式去噪突破LLM能力上限，从头预训练模型下游任务平均提高7.2% | 中科院＆阿里

IMO怒斥OpenAI自封夺金，“91位评委均未参与评分”