EN /
· azul

用数据玩透《花砖物语》

作者 Trace Studio

#桌游#花砖物语

《花砖物语》看上去像个手工活——挑几片漂亮瓷砖、排好队、把墙装饰起来。可这层陶瓷底下藏着一道冷冰冰的优化谜题,而它在牌桌上挑起的那些争论(“我是不是刚拿了一堆放不下的砖?”、“那个色集大奖到底值不值得追?“)其实都有答案。

于是我们就去把答案挖了出来。我们搭了一支电脑玩家的队伍——从瞎走一气的,到手工调校的策略家,再到能往后算好几步的 AI——让它们彼此对杀了好几千局。我们始终轮换谁先手,这样排名里就没人能白占座位的便宜。下面每一个数字,都是从这些对局里跑出来的,而不是从规则书里抄来的。

开挖之前,先把要点给你摆出来:

0%
被袋子偷走的对局
当双方实力有真实差距时
69%
后手一方的胜率
先手是要交税的(双人)
+7
真正值得追的奖励
那个抢眼的 +10 是诱饵
85%
前瞻能赢下最强手工 AI
在这儿,往后多想真的有用

《花砖物语》到底拼运气还是拼技术?

拼技术——压倒性地。在我们研究的三款游戏里,《花砖物语》是那个”更强的人最稳赢”的游戏。

《花砖物语》里唯一的随机来源就是袋子:每轮从袋里倒进工厂的是哪些砖。所以我们跑了那个最干净的测试——把完全相同的袋子发给一个强 AI 和一个弱 AI,然后交换座位再发一遍。要是袋子真说了算,运气好的牌总该偶尔救一救弱者。可它一次都没救成。

把同一批袋子发给一个明显更强的玩家和一个更弱的玩家。这些袋子里,强者到底赢下了多少?

每一个袋子、两种座位,都是更强的人赢。当实力存在真实差距时,袋子什么都决定不了。只有当两个玩家几乎是彼此的镜像时,洗牌才开始有点分量——而即便那时,还有个意外:在势均力敌的对局里,你坐在哪个座位你抽到哪个袋子更能左右胜负。《花砖物语》的运气其实不在瓷砖上,而在手序上。

底线 —— 《花砖物语》是一款披着手工活外衣的技术游戏。你怪不了袋子——要是你输给了一个明显更强的对手,瓷砖本来就救不了你。多打、变强、多赢。就这么直接。

那先手到底重不重要——哪个座位最好?

重要,而且这里有个把所有人都绕进去的反转:在《花砖物语》里,你想要的是后手

拿一个强 AI,复制一份,让两个一模一样的副本配上相同的袋子对坐。现在实力完全相同,那任何差距就是纯粹的座位优势动手的那一方大约能赢下 69%

两个完全相同的玩家,同一批袋子。唯一的区别是谁先动手——而后手才是你想要的那个座位。

为什么?先手意味着你得在对这一轮如何收场了解更少的情况下做决定——而且谁抢了首位标记,谁就得为这份”特权”在地板线上吃一片砖,等于白送一点小罚分。下一轮先动的那点好处,根本补不回这笔账。

人一多,这事还更明显。四人桌上,公平的胜率份额是 25%——可座位之间天差地别:第二个座位是风水宝地,而握着首位标记的那个座位是全场最差:

四人桌上各座位的胜率。公平份额是 25%——第二座一柱擎天,第一座深陷谷底。

底线 —— 能选的话,挑第二个座位,别挑第一个。首位标记看着像权力(“下一轮我先走!”),可它其实是一笔用地板分支付的小税。要拿就晚点拿——在你真的需要去引导下一轮时拿,而不是出于习惯。

地板线对贪心的惩罚有多狠?

狠到能凭一己之力让你输掉整局。地板线——每一片你放不下的砖都堆在那儿烂掉——是《花砖物语》里最大的一项技术,而它几乎纯粹是纪律。

我们用”搞破坏”的方式证明了它。我们拿一个顶尖 AI,关掉它的避地板能力——它打法的其余一切原封不动。对上一个随机对手,它照样几乎局局都赢;纯得分是容易的。可一旦让它坐到敬畏地板的同等强度 AI 对面,它的胜率就崩了:

同一个 AI,关掉了地板纪律。它照样碾压随机玩家——可一对上同等水平、却懂避地板的对手,就垮了。

从一半一半的胜率,跌到差不多三局输两局——而我们唯一改动的,就是它管不管地板。机制也正如你所担心的:麻烦从你留下一条半开的长行(四格行、五格行)开始。长行填得慢,所以你为它继续拿的那些砖一时无处安放,就溢到了地板上。挂着半开长行的 AI,最终地板上的杂物明显比保持行干净的 AI 要多:

地板线平均有多杂乱,取决于是否留了一条长行半开着。

底线 —— 永远别拿你没地方安放的砖。在你没把握填满之前,别开四格或五格的长行;拿不准时,少拿点。“地板纪律”听着无聊,但在其他方面打平的玩家之间,它就是赢家和输家的分水岭。

行、列,还是色集——我该追哪个?

。终局奖励是一手漂亮的小障眼法,而棋盘上最大的那个数字,恰恰是最差的赌注。

规则书吊着三种完成奖励:凑满一行 +2,一列 +7,或者集齐某一种颜色的全部五片 +10。+10 是压轴大戏——所以大家自然都去够它。可看看一个会赢的 AI 实际入账了多少:

一个赢家实际从每种终局奖励里拿到的分数(顶级对弈)。那个抢眼的 +10 几乎没露面。

+10 的色集是个诱饵。它名义上是最大的奖,可它太慢、又太容易被袋子(或对手)卡掉,赢家几乎从不完成一套——平均每局只贡献勉强半分。其貌不扬的 +7 列才是真正的引擎:赢家从列上拿到的分,差不多是色集的十倍。(这里出现的行,大多只是你冲向终局触发时顺手凑满的那几行——不是该围着它做规划的东西。)

底线 —— 往竖里建。列值七分,而且真做得成;+10 的色集是个多半永远合不拢的坑。除非它几乎是白送的、你又明显能完成,否则别去碰——不然那就是一种慢性自杀。

我到底该不该去封堵对手?

多半不该——这条也让我们吃了一惊。掐掉对手急需的砖感觉像是高招,可你花一个回合干这个,就没法把这个回合花在自己的墙上。

我们让一个会主动封堵的 AI,去打一个除此之外一模一样、从不费心封堵的 AI,别的什么都没改:

一个会主动封堵的 AI 对上一个从不封堵的同款 AI。50% 就是打平。

不分上下。而更妙的是:当我们让会封堵的 AI 往后算几步,它确实更会真正落实自己的封堵了——掐掉对手的次数更多了——可它的胜率还是死死钉在 50%。封堵奏效了,只是没换成胜利。你为铺设封堵烧掉的节奏,正好抵消了你造成的伤害。

底线 —— 打你自己的牌。照看你的墙、留意你的地板、追你的列——这比盯着对手的板子更管用。(对一个能往未来算得极深的玩家来说,封堵也许划算;对我们其余人,它只是个分心的事。)

那么,一个《花砖物语》AI 到底能强到哪儿?

就在这里,《花砖物语》把它那些更安静的表亲们的剧本给反转了。我们把所有玩家排到了同一根实力天梯上(一种类似国际象棋的评分——越高越强),而这个故事是一道利落的阶梯:

整支队伍的实力评分。一个玩家只要开始往后算,就甩开了整片手工调校的人群。

看看那道沟。手工调校的策略家们——那些谨慎的、有地板纪律的、会建列的规则遵循者——全挤在窄窄的一带里。然后一个真正会往后算的 AI 登场,**连我们最浅的那个前瞻 AI 都甩开了整片人群。**算得最深的那个,赢下最强手工策略大约 85% 的对局。在《花砖物语》里,前瞻不只是跟得上——它是直接赢。

这是最爽的地方,因为这并非总是成立。在某些游戏里,算力只能追平最好的简单规则,然后就卡在那儿。《花砖物语》不一样:它的奖励是长线的(你一直在悄悄拼的那个 +7 列、三回合后那场地板灾难),而看见未来,正是把这些兑现的办法。往后多想,就是那把捅破天花板的锤子。

这就是顶了吗?多半不是。我们还在训练一个从零开始学《花砖物语》的玩家,没人喂给它任何人类策略——而它现在还在上启蒙课,一边摸索这游戏一边垫在连手工 AI 都不如的位置。一个完全练成的自学玩家,能不能爬过我们算得最深的那个,是个开放问题——这主要是训练时间的问题,而这场比赛还没结束。等我们那个自学成才的玩家有话要说了,我们会回来更新这份报告。


本文每一张图,都测自 Trace Studio 自研《花砖物语》引擎上的 AI 对 AI 对局,并轮换座位、配对袋子,以确保手序和走运的洗牌都不会扭曲排名。我们是有意把背后的机器藏在幕后;如果你想看那些硬核细节——玩家是怎么造的、强度是怎么评的、对局是怎么采样的——它们都躺在项目的技术笔记里。