用数据玩透《花砖物语》

《花砖物语》看上去像个手工活——挑几片漂亮瓷砖、排好队、把墙装饰起来。可这层陶瓷底下藏着一道冷冰冰的优化谜题，而它在牌桌上挑起的那些争论（“我是不是刚拿了一堆放不下的砖？”、“那个色集大奖到底值不值得追？“）其实都有答案。

于是我们就去把答案挖了出来。我们搭了一支电脑玩家的队伍——从瞎走一气的，到手工调校的策略家，再到能往后算好几步的 AI——让它们彼此对杀了好几千局。我们始终轮换谁先手，这样排名里就没人能白占座位的便宜。下面每一个数字，都是从这些对局里跑出来的，而不是从规则书里抄来的。

开挖之前，先把要点给你摆出来：

被袋子偷走的对局

当双方实力有真实差距时

69%

后手一方的胜率

先手是要交税的（双人）

真正值得追的奖励

那个抢眼的 +10 是诱饵

85%

前瞻能赢下最强手工 AI

在这儿，往后多想真的有用

《花砖物语》到底拼运气还是拼技术？

拼技术——压倒性地。在我们研究的三款游戏里，《花砖物语》是那个”更强的人最稳赢”的游戏。

《花砖物语》里唯一的随机来源就是袋子：每轮从袋里倒进工厂的是哪些砖。所以我们跑了那个最干净的测试——把完全相同的袋子发给一个强 AI 和一个弱 AI，然后交换座位再发一遍。要是袋子真说了算，运气好的牌总该偶尔救一救弱者。可它一次都没救成。

把同一批袋子发给一个明显更强的玩家和一个更弱的玩家。这些袋子里，强者到底赢下了多少？

每一个袋子、两种座位，都是更强的人赢。当实力存在真实差距时，袋子什么都决定不了。只有当两个玩家几乎是彼此的镜像时，洗牌才开始有点分量——而即便那时，还有个意外：在势均力敌的对局里，你坐在哪个座位比你抽到哪个袋子更能左右胜负。《花砖物语》的运气其实不在瓷砖上，而在手序上。

底线 —— 《花砖物语》是一款披着手工活外衣的技术游戏。你怪不了袋子——要是你输给了一个明显更强的对手，瓷砖本来就救不了你。多打、变强、多赢。就这么直接。

那先手到底重不重要——哪个座位最好？

重要，而且这里有个把所有人都绕进去的反转：在《花砖物语》里，你想要的是后手。

拿一个强 AI，复制一份，让两个一模一样的副本配上相同的袋子对坐。现在实力完全相同，那任何差距就是纯粹的座位优势。后动手的那一方大约能赢下 69%。

两个完全相同的玩家，同一批袋子。唯一的区别是谁先动手——而后手才是你想要的那个座位。

为什么？先手意味着你得在对这一轮如何收场了解更少的情况下做决定——而且谁抢了首位标记，谁就得为这份”特权”在地板线上吃一片砖，等于白送一点小罚分。下一轮先动的那点好处，根本补不回这笔账。

人一多，这事还更明显。四人桌上，公平的胜率份额是 25%——可座位之间天差地别：第二个座位是风水宝地，而握着首位标记的那个座位是全场最差：

第1位（握首位标记）

15.7 %

第2位

33.7 %

第3位

24.6 %

第4位

26.8 %

四人桌上各座位的胜率。公平份额是 25%——第二座一柱擎天，第一座深陷谷底。

底线 —— 能选的话，挑第二个座位，别挑第一个。首位标记看着像权力（“下一轮我先走！”），可它其实是一笔用地板分支付的小税。要拿就晚点拿——在你真的需要去引导下一轮时拿，而不是出于习惯。

地板线对贪心的惩罚有多狠？

狠到能凭一己之力让你输掉整局。地板线——每一片你放不下的砖都堆在那儿烂掉——是《花砖物语》里最大的一项技术，而它几乎纯粹是纪律。

我们用”搞破坏”的方式证明了它。我们拿一个顶尖 AI，只关掉它的避地板能力——它打法的其余一切原封不动。对上一个随机对手，它照样几乎局局都赢；纯得分是容易的。可一旦让它坐到会敬畏地板的同等强度 AI 对面，它的胜率就崩了：

对随机玩家

100 %

对懂避地板的同档

36 %

同一个 AI，关掉了地板纪律。它照样碾压随机玩家——可一对上同等水平、却懂避地板的对手，就垮了。

从一半一半的胜率，跌到差不多三局输两局——而我们唯一改动的，就是它管不管地板。机制也正如你所担心的：麻烦从你留下一条半开的长行（四格行、五格行）开始。长行填得慢，所以你为它继续拿的那些砖一时无处安放，就溢到了地板上。挂着半开长行的 AI，最终地板上的杂物明显比保持行干净的 AI 要多：

留了一条长行半开

0.44

把行保持干净

0.35

地板线平均有多杂乱，取决于是否留了一条长行半开着。

底线 —— 永远别拿你没地方安放的砖。在你没把握填满之前，别开四格或五格的长行；拿不准时，少拿点。“地板纪律”听着无聊，但在其他方面打平的玩家之间，它就是赢家和输家的分水岭。

行、列，还是色集——我该追哪个？

追列。终局奖励是一手漂亮的小障眼法，而棋盘上最大的那个数字，恰恰是最差的赌注。

规则书吊着三种完成奖励：凑满一行 +2，一列 +7，或者集齐某一种颜色的全部五片 +10。+10 是压轴大戏——所以大家自然都去够它。可看看一个会赢的 AI 实际入账了多少：

行（每个 +2）

3.4

列（每个 +7）

5.7

色集（每个 +10）

0.6

一个赢家实际从每种终局奖励里拿到的分数（顶级对弈）。那个抢眼的 +10 几乎没露面。

+10 的色集是个诱饵。它名义上是最大的奖，可它太慢、又太容易被袋子（或对手）卡掉，赢家几乎从不完成一套——平均每局只贡献勉强半分。其貌不扬的 +7 列才是真正的引擎：赢家从列上拿到的分，差不多是色集的十倍。（这里出现的行，大多只是你冲向终局触发时顺手凑满的那几行——不是该围着它做规划的东西。）

底线 —— 往竖里建。列值七分，而且真做得成；+10 的色集是个多半永远合不拢的坑。除非它几乎是白送的、你又明显能完成，否则别去碰——不然那就是一种慢性自杀。

我到底该不该去封堵对手？

多半不该——这条也让我们吃了一惊。掐掉对手急需的砖感觉像是高招，可你花一个回合干这个，就没法把这个回合花在自己的墙上。

我们让一个会主动封堵的 AI，去打一个除此之外一模一样、从不费心封堵的 AI，别的什么都没改：

一个会主动封堵的 AI 对上一个从不封堵的同款 AI。50% 就是打平。

不分上下。而更妙的是：当我们让会封堵的 AI 往后算几步，它确实更会真正落实自己的封堵了——掐掉对手的次数更多了——可它的胜率还是死死钉在 50%。封堵奏效了，只是没换成胜利。你为铺设封堵烧掉的节奏，正好抵消了你造成的伤害。

底线 —— 打你自己的牌。照看你的墙、留意你的地板、追你的列——这比盯着对手的板子更管用。（对一个能往未来算得极深的玩家来说，封堵也许划算；对我们其余人，它只是个分心的事。）

那么，一个《花砖物语》AI 到底能强到哪儿？

就在这里，《花砖物语》把它那些更安静的表亲们的剧本给反转了。我们把所有玩家排到了同一根实力天梯上（一种类似国际象棋的评分——越高越强），而这个故事是一道利落的阶梯：

随机乱走

720

最强手工策略

1549

稍微往后算

1667

往后算更多

1761

算得最深

1783

整支队伍的实力评分。一个玩家只要开始往后算，就甩开了整片手工调校的人群。

看看那道沟。手工调校的策略家们——那些谨慎的、有地板纪律的、会建列的规则遵循者——全挤在窄窄的一带里。然后一个真正会往后算的 AI 登场，**连我们最浅的那个前瞻 AI 都甩开了整片人群。**算得最深的那个，赢下最强手工策略大约 85% 的对局。在《花砖物语》里，前瞻不只是跟得上——它是直接赢。

这是最爽的地方，因为这并非总是成立。在某些游戏里，算力只能追平最好的简单规则，然后就卡在那儿。《花砖物语》不一样：它的奖励是长线的（你一直在悄悄拼的那个 +7 列、三回合后那场地板灾难），而看见未来，正是把这些兑现的办法。往后多想，就是那把捅破天花板的锤子。

这就是顶了吗？多半不是。我们还在训练一个从零开始学《花砖物语》的玩家，没人喂给它任何人类策略——而它现在还在上启蒙课，一边摸索这游戏一边垫在连手工 AI 都不如的位置。一个完全练成的自学玩家，能不能爬过我们算得最深的那个，是个开放问题——这主要是训练时间的问题，而这场比赛还没结束。等我们那个自学成才的玩家有话要说了，我们会回来更新这份报告。

本文每一张图，都测自 Trace Studio 自研《花砖物语》引擎上的 AI 对 AI 对局，并轮换座位、配对袋子，以确保手序和走运的洗牌都不会扭曲排名。我们是有意把背后的机器藏在幕后；如果你想看那些硬核细节——玩家是怎么造的、强度是怎么评的、对局是怎么采样的——它们都躺在项目的技术笔记里。