手机浏览器扫描二维码访问
ai的蒙特卡罗算法,用童话故事讲解。
我们用一个童话故事的方式来解释ai中的蒙特卡罗算法(nte
carlo
algorithm),特别是它在博弈论、游戏ai、决策模拟等场景中的应用。
?
童话故事:小狐狸奇奇的果子冒险
很久很久以前,在一个叫做“决策森林”的神奇世界里,住着一只聪明又调皮的小狐狸,名字叫奇奇。
每天清晨,森林里都会出现很多果子树,不同的路径会通向不同的果子。奇奇最喜欢吃红果子,但问题是:有些红果子很甜,有些很苦,而且你不走近去尝一尝,是无法知道的!
而且,森林的路径像迷宫一样复杂,一次只能走一步,一共只能走
10
步。奇奇每天都要做一个决定:要走哪条路,去哪里找果子吃,怎样才能吃到最多好吃的果子?
这对奇奇来说太难了!
?
这时,ai之神悄悄给奇奇一个神奇的法宝:
这法宝名字叫做:
蒙特卡罗模拟法(nte
carlo
simulation)
这个法宝可以让奇奇提前“幻想”几千次自己的走法和吃果子的结果,然后选择最可能成功的那一条。
?
奇奇使用蒙特卡罗模拟的方法如下:
第一步:随便乱走1000次!
奇奇在脑海里幻想自己从现在出发,一直走10步,每次都随机选一个方向。每一条幻想路线都叫做一次模拟。
就像在现实生活中掷骰子做决策那样,蒙特卡罗方法通过“随机”走法来覆盖各种可能。
每次模拟结束后,奇奇会记录下:
?
自己最后吃到了哪些果子?
?
是甜的还是苦的?
?
总共吃了多少好吃的?
第二步:把所有模拟的结果记录下来!
奇奇发现,有一些起始方向,比如往左边走,虽然开始没果子,但最终常常会碰到一大堆红果子树。
而往右走,虽然开始就有果子,但走到第6步就没什么了。
第三步:统计谁最好!
奇奇统计所有模拟中,“哪个第一步方向”最终吃到了最多的甜果子,于是决定——
“我这次就往那个方向走吧!”
这就是蒙特卡罗算法的核心逻辑:
?
用随机采样的方式探索未来的可能性;
哭包竹马爱哭还难哄 仙集 军人军医,办公室恋情? 我在乡下当村医 他的Freesia 引凰归帝凰临:炼丹契兽倾世女帝 快穿:拯救反派,本系统亲自下场 温婉沧海 梦幻西游:大唐弃徒,成就史一法 带着猴哥游异界 隔壁那个帝少 重生1990,带着全村人发家致 意外得到空间后金手指带我闯末日 末世,给异类收编 武夫李青舟,要问剑仙李太白 导演我要举报!她跑龙套还开挂! 他如焰藏匿我心 爱丽丝综合征 和校花解散后,契约灵兵皆S级 你和我的苏打水情缘
藏锋简介emspemsp太子弑父,天降灾祸饿殍遍野。乞儿命苦,数九寒冬家破人亡。是谁说生死有命富贵在天?是谁说善恶有报因果轮回?尽是荒唐!弱肉强食,何来道义!物竞天择,何来公平!倒不如杀他个天昏地暗!倒不如杀他个天下太平!更多小说请收藏xyuzhaiwu8com...
唐庭若是温澜见过最不知羞的姑娘,当街亲嘴,隔空示爱,夜半爬床,甚至在满朝文武面前向他求亲温澜是唐庭若见过最表里不一的公子,白天一套,晚上一套,没羞没臊,甚至在满城百姓面前向她下跪求娶。人世间,有百媚千红唯独你,我情之所钟...
无CP快穿文丁云的兼职金手指试用员之旅。(一个世界一个金手指)如果您喜欢快穿之金手指试用员,别忘记分享给朋友...
死于瘟疫,生于瘟疫,一生与瘟疫为伴。原本,以为凭借后世记忆,赚取功德,想要摆脱封神大劫,并不是什么难事,却发现功德对于其他人来说是无上至宝,可对于他来说,却是剧毒之物,碰之非死即伤。既如此,只能在洪荒上传播瘟疫。我有一瘟,可绝凡。我有一瘟,可杀仙。我有一瘟,可诛圣。如果您喜欢洪荒之瘟疫漫天,别忘记分享给朋友...
影后有堵墙GL完结番外简介emspemsp两届金星球奖影后于念冰在结束拍摄后,回家凳子没坐热,瓜刚吃两口,卧室的墙就被砸穿了隔壁是浓烟,是烧炭,是半年前为了蹭热搜与自己假表白的人记者请问于老师当时怎么想?于念冰呵,不敢想。一个末...
岛国,东京都区,丰之崎私立高中二年组B班的教室内,如同往常一样迎来了学生们的嬉闹声。神官大人,神官大人,我们一起去探索校园怪谈吧!鬼啊!!!如果您喜欢重生日本当神官,别忘记分享给朋友...