21岁大学生揭开2000年前古卷之谜:用AI重现“消失的”文字,赢得4万美元奖金

1,431次阅读
没有评论

2000 多年前“消失的”古卷文字,如今被 AI 重现了。

 

近日,一名 21 岁计算机科学专业的学生利用人工智能(AI)技术在未打开的赫库兰尼姆古卷中发现了第一个单词。

21岁大学生揭开2000年前古卷之谜:用AI重现“消失的”文字,赢得4万美元奖金

他就是内布拉斯加大学林肯分校的 Luke Farritor,他开发了一种机器学习算法,可以检测卷起的纸莎草纸上的希腊字母,其中包括 πορphiυρας(porphyras),意思是“紫色”。

 

Luke 通过利用表面纹理的微妙、小范围差异来训练神经网络并突出墨水,成功破译并读取 4 平方厘米区域内的 10 多个字符,赢得了 4 万美元的 First Letters 大奖。

21岁大学生揭开2000年前古卷之谜:用AI重现“消失的”文字,赢得4万美元奖金

图|Luke Farritor 的第一份提交材料


意大利那不勒斯大学的纸莎草学家、审查 Farritor 研究成果的学术委员会成员 Federica Nicolardi 表示:“当我看到第一张图像时,我感到震惊,我实际上可以从卷轴的内部看到一些东西。”

 

赫库兰尼姆古卷是庞贝古城附近一座私人图书馆中收藏的古代卷轴,因公元 79 年维苏威火山喷发而被掩埋并碳化。近 2000 年来,这座唯一幸存的古代图书馆一直被埋在地下 20 米厚的火山泥下。18 世纪,它们被挖掘出来,虽然在某种程度上得到了保存,但非常脆弱,如果处理不当就会变成灰尘

 

21岁大学生揭开2000年前古卷之谜:用AI重现“消失的”文字,赢得4万美元奖金

如何阅读无法打开的卷轴?数百年来,这个问题一直没有答案。

 

2019 年,肯塔基大学 EduceLab 的 Brent Seales 教授在粒子加速器中对赫库兰尼姆古卷进行了成像,生成分辨率高达 4 µm 的 3D CT 扫描。他的团队还扫描并拍摄了带有可见墨水的分离卷轴碎片,从而提供了地面真实数据集。Seales 教授的研究生 Stephen Parsons 致力于使用机器学习模型从 CT 扫描中检测墨水,并在分离的碎片上取得了成功。

 

21岁大学生揭开2000年前古卷之谜:用AI重现“消失的”文字,赢得4万美元奖金

图|根据分离片段的真实数据训练机器学习模型(来源:Stephen Parsons 的博士论文)


这一成功引起了科技企业家 Nat Friedman 和 Daniel Gross 的注意,他们发起了维苏威火山挑战赛以加速这一进展。他们于 2023 年 3 月发起了一场公开竞赛,除了 70 万美元的大奖外,还为开源工具和技术的开发颁发了几个较小的奖项。

 

后来,一小群研究团队开始使用最初由 EduceLab 构建并由社区改进的工具来绘制卷轴的 3D 结构。到今年七月,数百平方厘米的古卷被分割并被“几乎压平”。

 

八月初,前 JPL 初创公司创始人 Casey Handmer 写了一篇博客文章,讲述自己发现了一种看起来像墨水的“裂纹图案”。Casey 是 2000 年来第一个在未打开的卷轴中发现墨水和一封信的人。

 

21岁大学生揭开2000年前古卷之谜:用AI重现“消失的”文字,赢得4万美元奖金

图|显示墨水位置的注释(来源:Casey 的博客文章)

Luke Farritor 是一名大学生,同时也是 SpaceX 暑期实习生,他从 Dwarkesh Patel 接受 Nat 的播客采访中听说了维苏威火山挑战赛。

 

他看到的 Casey 裂纹模式在 Discord 中被讨论,并开始在深夜训练关于裂纹模式的机器学习模型。随着每一个新裂纹的发现,模型都会得到改进,在卷轴上就可以显示出更多的裂纹。

 

Luke 发现了几十个墨迹笔画以及一些完整的字母,可以将其标记并用作训练数据。不久之后,卷轴就露出了肉眼看不见的裂纹痕迹。很快,这些痕迹开始形成字母和实际单词的暗示。

 

与此同时,另一位参赛者、柏林的埃及生物机器人研究生 Youssef Nader 则采取了不同的方法。受到 Casey 和 Luke 发现的激励,他筛选了 Kaggle 上墨水检测奖的获奖作品,该奖的重点是改进 Stephen Parsons 在分离片段中的机器学习方法。他使用域转移技术使这些模型适应卷轴:对卷轴数据进行无监督预训练,然后对片段标签进行微调。

 

他提交了“墨水检测后续奖(Ink Detection Followup Prize)”的想法并获得了一个小奖。几周后,Youssef 向第一封信奖提交了自己的作品。他看到了 Luke 在 Twitter 和 Discord上分享的早期结果,并决定关注卷轴中的同一区域。

 

21岁大学生揭开2000年前古卷之谜:用AI重现“消失的”文字,赢得4万美元奖金

图|Youssef Nader 最终提交的材料


尽管完全没有依赖 Casey 手动寻找裂纹的方法,但是通过 Kaggle 竞赛的修改模型,他成功地找到了一些字母。然后,他在标签数据中注释了看起来像字母形状的内容。

 

分割团队和参赛者不断取得进展,几天前 Youssef 的模型生成了一张清晰度和尺寸令人震惊的新图像(如下图所示)。

21岁大学生揭开2000年前古卷之谜:用AI重现“消失的”文字,赢得4万美元奖金

威尼斯卡福斯卡里大学的古希腊和罗马历史学家 Thea Sommerschield 向《自然》杂志解释说,这一发现可能“彻底改变我们对古代历史和文学的认识”。

参考链接:

https://www.nature.com/articles/d41586-023-03212-1

https://scrollprize.org/firstletters

https://people.com/21-year-old-wins-usd40k-after-using-ai-to-read-first-word-on-2-000-year-old-papyrus-scroll-8358107

作者:闫一米 编辑:学术君


|点击关注我 👇 记得标星|


 

Read More 

正文完
可以使用微信扫码关注公众号(ID:xzluomor)
post-qrcode
 0
评论(没有评论)

文心AIGC

2023 年 10 月
 1
2345678
9101112131415
16171819202122
23242526272829
3031  
文心AIGC
文心AIGC
人工智能ChatGPT,AIGC指利用人工智能技术来生成内容,其中包括文字、语音、代码、图像、视频、机器人动作等等。被认为是继PGC、UGC之后的新型内容创作方式。AIGC作为元宇宙的新方向,近几年迭代速度呈现指数级爆发,谷歌、Meta、百度等平台型巨头持续布局
文章搜索
热门文章
潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026

潞晨尤洋:日常办公没必要上私有模型,这三类企业才需要 | MEET2026 Jay 2025-12-22 09...
面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25

面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25

面向「空天具身智能」,北航团队提出星座规划新基准丨NeurIPS’25 鹭羽 2025-12-13 22:37...
钉钉又发新版本!把 AI 搬进每一次对话和会议

钉钉又发新版本!把 AI 搬进每一次对话和会议

钉钉又发新版本!把 AI 搬进每一次对话和会议 梦晨 2025-12-11 15:33:51 来源:量子位 A...
商汤Seko2.0重磅发布,合作短剧登顶抖音AI短剧榜No.1

商汤Seko2.0重磅发布,合作短剧登顶抖音AI短剧榜No.1

商汤Seko2.0重磅发布,合作短剧登顶抖音AI短剧榜No.1 十三 2025-12-15 14:13:14 ...
MEET2026挤爆了,AI圈今年最该听的20+场演讲&对谈都在这

MEET2026挤爆了,AI圈今年最该听的20+场演讲&对谈都在这

MEET2026挤爆了,AI圈今年最该听的20+场演讲&对谈都在这 西风 2025-12-11 15:...
最新评论
ufabet ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง
tornado crypto mixer tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.
ดูบอลสด ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.
ดูบอลสด ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
Obrazy Sztuka Nowoczesna Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.
ufabet ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.
ufabet ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!
ufabet ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.
热评文章
预见未来:96位前沿先锋超万字核心观点总结,抢抓未来产业新高地

预见未来:96位前沿先锋超万字核心观点总结,抢抓未来产业新高地

预见未来:96位前沿先锋超万字核心观点总结,抢抓未来产业新高地 henry 2025-12-11 10:27:...
Meta公开抄阿里Qwen作业,还闭源了…

Meta公开抄阿里Qwen作业,还闭源了…

Meta公开抄阿里Qwen作业,还闭源了… Jay 2025-12-11 11:48:25 来源:量子位 Ja...
MEET2026挤爆了,AI圈今年最该听的20+场演讲&对谈都在这

MEET2026挤爆了,AI圈今年最该听的20+场演讲&对谈都在这

MEET2026挤爆了,AI圈今年最该听的20+场演讲&对谈都在这 西风 2025-12-11 15:...
钉钉又发新版本!把 AI 搬进每一次对话和会议

钉钉又发新版本!把 AI 搬进每一次对话和会议

钉钉又发新版本!把 AI 搬进每一次对话和会议 梦晨 2025-12-11 15:33:51 来源:量子位 A...