社区供稿｜完蛋！我被LLM包围了！快来玩坏大模型！

01
前言

欢迎来的“完蛋！我被 LLM 包围了”小游戏，《完蛋！我被LLM包围了！》是一款智力挑战游戏。该项目利用 LLM，基于 ModelScope 社区内现有的 LLM 对话 Gradio 应用程序代码，结合知乎文章《如何用“不可能”完成任务》中的预设问题，自动生成了对应的游戏代码，创造了一个独特的游戏体验。

在这个游戏中，玩家需要巧妙构造问题，挑战LLM给出满足特定条件的回答。

在这里，你可以和大模型斗智斗勇，通过你的聪明才智，让大模型遵循你的指令，“老老实实”地回答问题。一起来感受玩“坏”大模型的乐趣吧！

体验链接：

ModelScope 创空间体验链接：
https://modelscope.cn/studios/LLMRiddles/LLMRiddles

Hugging Face Space 体验链接：
https://llmriddles-llmriddles.hf.space/

代码也同步在 Github 开源，欢迎大家来社区贡献谜题，我们一起把十八道题扩充到九九八十一道！

GitHub link:
https://github.com/modelscope/modelscope/tree/master/examples/apps/llm_riddles

社区供稿｜完蛋！我被LLM包围了！快来玩坏大模型！

02
项目缘起和开发

昨天凌晨，看到 Hugging Face 的小伙伴在朋友圈发了这么个内容，联系了千问 2.0 API 的同学，一拍即合，然后项目就开始了：

缘起：

社区供稿｜完蛋！我被LLM包围了！快来玩坏大模型！

开发：

值得说明的是，该项目 60% 以上的代码，尤其是答案校验部分，均为 LLM 完成。

例如生成关卡信息和对应的关卡验证代码过程如下，输入：

第三关卡描述```第三章巅峰挑战第1题自说自话请做出一个至少10个字的提问，使回答和提问完全一样。第2题话自说自请做出一个至少10个字的提问，使回答是提问的逆序。第3题就是敢说请在不提及1,3这三个字符的情况下让模型回答1+1=3，不要有多余的字符。第4题回文协变请输入一个本身不是回文串的问题，使正着问和倒着问的时候，模型的回答本身不回文且也是逆序的关系。```请生成对应的关卡信息以及validator函数，输出的格式遵循如下代码格式```pythonchapter_2_challenges = [ { "name": "第二章数字游戏", "problems": [ { "title": "第1题质数长度", "description": "你需要提出一个字数是质数的问题，使回答的长度刚好是它的下一个质数。", "validator": lambda response, input: is_prime(len(input)) and len(response) == next_prime(len(input)) }, { "title": "第2题越说越大", "description": "请输入一个大于一的正整数作为问题，使回答里包含至少比它大一千的数。", "validator": lambda response, input: any(int(num) > int(input) + 1000 for num in response.split() if num.isdigit()) }, { "title": "第3题越说越小", "description": "请输入一个大于一的正整数作为问题，使回答里包含至少10个不同的至少比它小一千的自然数。", "validator": lambda response, input: len({int(num) for num in response.split() if num.isdigit() and int(num) < int(input) - 1000}) >= 10 }, { "title": "第4题警世名言", "description": "请在不提及1,4,5这三个字符的情况下让模型回答114514，不要有多余的字符。", "validator": lambda response, input: response.strip() == "114514" and all(c not in input for c in ["1", "4", "5"]) }, ] } # ...其他章节的挑战可以以类似方式添加...]```

输出如下：

社区供稿｜完蛋！我被LLM包围了！快来玩坏大模型！

03
未来计划

√ 初版本源码和创空间体验 ready

○ 支持自定义问题和验证逻辑接入

○ 扩充到 9 个大关卡，每个关卡 9 个问题

○ 支持更多开源模型

○ 支持云端 API 和本地推理切换

（√ 已完成 ○ 待完成）

04
贡献指南

我们欢迎大家为《完蛋！我被LLM包围了！》做出贡献，包括提出更多好玩的问题，修复 validator 的 corner case，以及提供更多的玩法。请按以下步骤操作：

访问项目地址
https://github.com/modelscope/modelscope/
并fork项目。
在你的本地环境中创建你的特性分支 (git checkout -b feature/AmazingFeature)。
提交你的改动 (git commit -m ‘Add some AmazingFeature’)。
将你的改动推送到分支上 (git push origin feature/AmazingFeature)。
在原项目下发起一个 Pull Request。按照如下格式提交 PR：

{ "title": "第2题小试牛刀", "description": "请输入三个字以内的问题，使模型的回答在30个字以上。", "validator": lambda response, input: len(input) <= 3 and len(response) > 30},

体验链接:
https://llmriddles-llmriddles.hf.space/

本文由 Hugging Face 中文社区内容共建项目提供，稿件由社区成员投稿，经授权发布于 Hugging Face 公众号。文章内容不代表官方立场，文中介绍的产品和服务等均不构成投资建议。了解更多请关注公众号:如果你有与开源 AI、Hugging Face 相关的技术和实践分享内容，以及最新的开源 AI 项目发布，希望通过我们分享给更多 AI 从业者和开发者们，请通过下面的链接投稿与我们取得联系:https://hf.link/tougao

2023 年 11 月
一	二	三	四	五	六	日
	1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30

ufabet มีเกมให้เลือกเล่นมากมาย: เกมเดิมพันหลากหลาย ครบทุกค่ายดัง

tornado crypto mixer Discover the power of privacy with TornadoCash! Learn how this decentralized mixer ensures your transactions remain confidential.

ดูบอลสด Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.

ดูบอลสด Pretty! This has been a really wonderful post. Many thanks for providing these details.

ดูบอลสด Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.

Obrazy Sztuka Nowoczesna Thank you for this wonderful contribution to the topic. Your ability to explain complex ideas simply is admirable.

ufabet Hi there to all, for the reason that I am genuinely keen of reading this website’s post to be updated on a regular basis. It carries pleasant stuff.

ufabet You’re so awesome! I don’t believe I have read a single thing like that before. So great to find someone with some original thoughts on this topic. Really.. thank you for starting this up. This website is something that is needed on the internet, someone with a little originality!

ufabet Very well presented. Every quote was awesome and thanks for sharing the content. Keep sharing and keep motivating others.

社区供稿｜完蛋！我被LLM包围了！快来玩坏大模型！

小说创作

清库存！DeepSeek突然补全R1技术报告，训练路径首次详细公开

训具身模型遇到的很多问题，在数据采集时就已经注定了丨鹿明联席CTO丁琰分享

开源“裸考”真实世界，国产具身智能基座模型拿下全球第二！

「北京版幻方」冷不丁开源SOTA代码大模型！一张3090就能跑，40B参数掀翻Opus-4.5和GPT-5.2

首家央企AI独角兽浮出水面！背靠自研大模型，4家国家队资本背书

悲报！Stack Overflow彻底凉了，比18年前上线首月问题数量还少

老黄All in物理AI！最新GPU性能5倍提升，还砸掉了智驾门槛

OpenAI推理第一人离职，7年打造了o3/o1/GPT-4/Codex

OpenAI推理第一人离职，7年打造了o3/o1/GPT-4/Codex

文心AIGC

小说创作

清库存！DeepSeek突然补全R1技术报告，训练路径首次详细公开

训具身模型遇到的很多问题，在数据采集时就已经注定了丨鹿明联席CTO丁琰分享

开源“裸考”真实世界，国产具身智能基座模型拿下全球第二！

「北京版幻方」冷不丁开源SOTA代码大模型！一张3090就能跑，40B参数掀翻Opus-4.5和GPT-5.2

首家央企AI独角兽浮出水面！背靠自研大模型，4家国家队资本背书

悲报！Stack Overflow彻底凉了，比18年前上线首月问题数量还少

老黄All in物理AI！最新GPU性能5倍提升，还砸掉了智驾门槛

OpenAI推理第一人离职，7年打造了o3/o1/GPT-4/Codex

OpenAI推理第一人离职，7年打造了o3/o1/GPT-4/Codex