这两天在网上看到一张让人涨姿势的图片,图片中展示的是贪吃蛇游戏,估计大部分人都玩过。但如果仅仅是贪吃蛇游戏,那么它就没有什么让人涨姿势的地方了。问题的关键在于,图片中的贪吃蛇真的很贪吃XD,它把矩形中出现的食物吃了个遍,然后华丽丽地把整个矩形填满,真心是看得赏心悦目。作为一个CSer,第一个想到的是,这东西是写程序实现的(因为,一般人干不出这事。果断是要让程序来干的)第二个想到的是,写程序该如何实现,该用什么算法?既然开始想了,就开始做。Talk is cheap,show me the code。
开始之前,让我们再欣赏一下那只让人涨姿势的贪吃蛇吧:(如果下面的动态图片浏览效果不佳的话,可以右键保存下来查看)
语言选择Life is short, use python! 所以,根本就没多想,直接上python。
最初版本先让你的程序跑起来
首先,我们第一件要做的就是先不要去分析这个问题。你好歹先写个能运行起来的贪吃蛇游戏,然后再去想AI部分。这个应该很简单,c\c++也就百来行代码(如果我没记错的话。不弄复杂界面,直接在控制台下跑),python就更简单了,去掉注释和空行,5、60行代码就搞定了。而且,最最关键的,这个东西网上肯定写滥了,你没有必要重复造轮子,去弄一份来按照你的意愿改造一下就行了。
简单版本
我觉得直接写perfect版本不是什么好路子。因为perfect版本往往要考虑很多东西,直接上来就写这个一般是bug百出的。所以,一开始我的目标仅仅是让程序去控制贪吃蛇运动,让它去吃食物,仅此而已。现在让我们来陈述一下最初的问题:
12在一个矩形中,每一时刻有一个食物,贪吃蛇要在不撞到自己的条件下,找到一条路(未必要最优),然后沿着这条路运行,去享用它的美食我们先不去想蛇会越来越长这个事实,问题基本就是,给你一个起点(蛇头)和一个终点(食物),要避开障碍物(蛇身),从起点找到一条可行路到达终点。我们可以用的方法有:
BFS DFS A*只要有选择,就先选择最简单的方案,我们现在的目标是要让程序先跑起来,优化是后话。so,从BFS开始。我们最初将蛇头位置放入队列,然后只要队列非空,就将队头位置出队,然后把它四领域内的4个点放入队列,不断地循环操作,直到到达食物的位置。这个过程中,我们需要注意几点:1.访问过的点不再访问。2.保存每个点的父结点(即每个位置是从哪个位置走到它的,这样我们才能把可行路径找出来)。3.蛇身所在位置和四面墙不可访问。
通过BFS找到食物后,只需要让蛇沿着可行路径运动即可。这个简单版本写完后,贪吃蛇就可以很欢快地运行一段时间了。看图吧:(不流畅的感觉来自录屏软件@_@)
为了尽量保持简单,我用的是curses模块,直接在终端进行绘图。从上面的动态图片可以看出,每次都单纯地使用BFS,最终有一天,贪吃蛇会因为这种不顾后果的短视行为而陷入困境。而且,即使到了那个时候,它也只会BFS一种策略,导致因为当前看不到目标(食物),认为自己这辈子就这样了,破罐子破摔,最终停在它人生中的某一个点,不再前进。(我好爱讲哲理XD)
BFS+Wander上一节的简单版本跑起来后,我们认识到,只教贪吃蛇一种策略是不行的。它这么笨一条蛇,你不多教它一点,它分分钟就会挂掉的。所以,我写了个Wander函数,顾名思义,当贪吃蛇陷入困境后,就别让它再BFS了,而是让它随便四处走走,散散心,思考一下人生什么的。这个就好比你困惑迷茫的时候还去工作,效率不佳不说,还可能阻碍你走出困境;相反,这时候你如果放下手中的工作,停下来,出去旅个游什么的。回来时,说不定就豁然开朗,土地平旷,屋舍俨然了。
Wander函数怎么写都行,但是肯定有优劣之分。我写了两个版本,一个是在可行的范围内,朝随机方向走随机步。也就是说,蛇每次运动的方向是随机出来的,总共运动的步数也是随机的。Wander完之后,再去BFS一下,看能否吃到食物,如果可以那就皆大欢喜了。如果不行,说明思考人生的时间还不够,再Wander一下。这样过程不断地循环进行。可是就像“随机过程随机过”一样,你“随机Wander就随机挂”。会Wander的蛇确实能多走好多步。可是有一天,它就会把自己给随机到一条死路上了。陷入困境还可以Wander,进入死胡同,那可没有回滚机制。所以,第二个版本的Wander函数,我就让贪吃蛇贪到底。在BFS无解后,告诉蛇一个步数step(随机产生step),让它在空白区域以S形运动step步。这回运动方向就不随机了,而是有组织有纪律地运动。先看图,然后再说说它的问题:
没错,最终还是挂掉了。S形运动也是无法让贪吃蛇避免死亡的命运。贪吃蛇可以靠S形运动多存活一段时间,可是由于它的策略是:
12345while 没有按下ESC键:if 蛇与食物间有路径:走起,吃食物去else:Wander一段时间问题就出在蛇发现它自己和食物间有路径,就二话不说跑去吃食物了。它没有考虑到,你这一去把食物给吃了后形成的局势(蛇身布局),完全就可能让你挂掉。(比如进入了一个自己蛇身围起来的封闭小空间)
so,为了能让蛇活得久一些,它还要更高瞻远瞩才行。
高瞻远瞩版本我们现在已经有了一个比较低端的版本,而且对问题的认识也稍微深入了一些。现在可以进行一些比较慎密和严谨的分析了。首先,让我们罗列一些问题:(像头脑风暴那样,想到什么就写下来即可)
蛇和食物间有路径直接就去吃,不可取。那该怎么办? 如果蛇去吃食物后,布局是安全的,是否就直接去吃?(这样最优吗?) 怎样定义布局是否安全? 蛇和食物之间如果没有路径,怎么办? 最短路径是否最优?(这个明显不是了) 那么,如果布局安全的情况下,最短路径是否最优? 除了最短路径,我们还可以怎么走?S形?最长? 怎么应对蛇身越来越长这个问题? 食物是随机出现的,有没可能出现无解的布局? 暴力法(brute force)能否得到最优序列?(让贪吃蛇尽可能地多吃食物)只要去想,问题还挺多的。这时让我们以面向过程的思想,带着上面的问题,把思路理一理。一开始,蛇很短(初始化长度为1),它看到了一个食物,使用BFS得到矩形中每个位置到达食物的最短路径长度。在没有蛇身阻挡下,就是曼哈顿距离。然后,我要先判断一下,贪吃蛇这一去是否安全。所以我需要一条虚拟的蛇,它每次负责去探路。如果安全,才让真正的蛇去跑。当然,虚拟的蛇是不会绘制出来的,它只负责模拟探路。那么,怎么定义一个布局是安全的呢?如果你把文章开头那张动态图片中蛇的销魂走位好好的看一下,会发现即使到最后蛇身已经很长了,它仍然没事一般地走出了一条路。而且,是跟着蛇尾走的!嗯,这个其实不难解释,蛇在运动的过程中,消耗蛇身,蛇尾后面总是不断地出现新的空间。蛇短的时候还无所谓,当蛇一长,就会发现,要想活下来,基本就只能追着蛇尾跑了。在追着蛇尾跑的过程中,再去考虑能否安全地吃到食物。(下图是某次BFS后,得到的一个布局,0代表食物,数字代表该位置到达食物的距离,+号代表蛇头,*号代表蛇身, -号代表蛇尾,#号代表空格,外面的一圈#号代表围墙)
1234567# # # # # # # # 0 1 2 3 4 # # 1 2 3 # 5 # # 2 3 4 - 6 # # 3 + * * 7 # # 4 5 6 7 8 # # # # # # # #经过上面的分析,我们可以将布局是否安全定义为蛇是否可以跟着蛇尾运动,也就是蛇吃完食物后,蛇头和蛇尾间是否存在路径,如果存在,我就认为是安全的。
OK,继续。真蛇派出虚拟蛇去探路后,发现吃完食物后的布局是安全的。那么,真蛇就直奔食物了。等等,这样的策略好吗?未必。因为蛇每运动一步,布局就变化一次。布局一变就意味着可能存在更优解。比如因为蛇尾的消耗,原本需要绕路才能吃到的食物,突然就出现在蛇眼前了。所以,真蛇走一步后,更好的做法是,重新做BFS。然后和上面一样进行安全判断,然后再走。
接下来我们来考虑一下,如果蛇和食物之间不存在路径怎么办?上文其实已经提到了做法了,跟着蛇尾走。只要蛇和食物间不存在路径,蛇就一直跟着蛇尾走。同样的,由于每走一步布局就会改变,所以每走一步就重新做BFS得到最新布局。
好了,问题又来了。如果蛇和食物间不存在路径且蛇和蛇尾间也不存在路径,怎么办?这个我是没办法了,选一步可行的路径来走就是了。还是一个道理,每次只走一步,更新布局,然后再判断蛇和食物间是否有安全路径;没有的话,蛇头和蛇尾间是否存在路径;还没有,再挑一步可行的来走。
上面列的好几个问题里都涉及到蛇的行走策略,一般而言,我们会让蛇每次都走最短路径。这是针对蛇去吃食物的时候,可是蛇在追自己的尾巴的时候就不能这么考虑了。我们希望的是蛇头在追蛇尾的过程中,尽可能地慢。这样蛇头和蛇尾间才能腾出