小主,这个章节后面还有哦,请点击下一页继续阅读,后面更精彩!
其一是,将历史比赛数据转化为知识,投喂给它。让它基于“规则”和“知识”,通过 MCTS算法和神经网络组合自我训练。
其二是不断给他找对手,它的深度卷积网络会在对局中基于胜率,自动捕捉高阶模式。
听着很美好,但也导致参数空间扩张和外部数据资产的不断积累。
简单的说,数据量越来越大。
而计算机的算力、总线、内存、外部存储器和磁盘阵列控制器的吞吐、读写速度都是有限的。数据量越来越大,就意味着调用、比对、决策的时间越来越慢。
而国际象棋的时间规则又那么严苛,这几乎是无解的矛盾……
谁也没想到,这个问题在曲卓上次来时,所有人都没留意的情况下,就被初步解决了。
虽然他只待了大半天,其中很大一部分时间还用在了开会和闲聊上。
闲聊过程中,得知参数量越来越大,不但占用了大量宝贵的硬盘空间,甚至为了保证读取速度,不得不将数据分配到不同磁盘阵列里。
确定了问题后,曲卓只用了两个小时左右,就编辑了一个知识库蒸馏程序。随后用蒸馏程序对现有数据进行清洗、去重,还修改了标注规则。
“蒸馏”的过程非常慢,分布在四个磁盘阵列下,已经累积到接近3G的专项知识库,用了二十多个小时才完成。
等蒸馏结束后,实验室的人惊讶的发现,新的智能体数据包,居然只有两百三十多兆,参数量从亿级骤降到了百万级。
没有人知道如此夸张的脱水比,在提升知识密度的同时,会损失多少有效知识。但毫无疑问,运算速度重新回到了丝滑流畅的水平。
呃~~
只能说,不同的时代,对“丝滑流畅”这一评价的阈值,是不同的。
然后,就是不断的惊喜。
大概从去年年底诺贝尔颁奖前后开始,参数进行过深度优化的“悟空”,进入了连胜状态。
消息传开后,之前那些体验后便失去了兴致的国际象棋高手们,有人起了再次体验的兴趣。
今年一月中,“悟空”在所有人都毫无准备的情况下,突兀的赢了一位继去年夏天后,第二次至牛津体验与“悟空”对弈的国际象棋大师大卫?古德曼。
大卫?古德曼国际棋联认证,Elo 2380-2400,世界排名290至300的IM级职业选手。
“悟空”连赢了他三盘,一盘比一盘轻松。
越来越轻松,不是“悟空”短时间内“棋力暴涨”,是大卫?古德曼在输掉第一盘后,被旁观者的惊讶和惊呼影响了心态,后面两盘水准连续下滑。
虽然“悟空”只是赢了个国际排位三百名左右的大师,但三百名也是大师呀。
很快,“WoKong”战胜国际象棋IM级选手David Goodman这一消息,被戴英Electronics Weekly(一份电子专业报)的81年一月上半月刊报道了出来,并很快在小圈子里引发了热议。
(国际特级大师 GM、国际大师 IM、棋联大师 CM)
后面的一个多月,陆续有十余位得到消息的大师级选手,慕名前往剑桥和牛津……“悟空”的战绩是57胜,31负。
在戴英各路媒体的重点关注和推波助澜下,消息瞬间“吹”遍了欧洲各国,甚至北美的媒体也跟着开始报道。
尤其是计算机和电子类报纸、杂志,几乎全都做了报道,差异只在于篇幅、激动、乐观与质疑。
四月初,“悟空”迎来了一位重量级对手,81年一月FIDE官方最新排名全球第五,毛子裔高卢GM级国际特级大师斯帕斯基。
结局是两胜一和两负。
“悟空”首局输了,但斯帕斯基赢的并不轻松,第二局斯帕斯基依旧赢了,同样不轻松。第三局和棋,四、五局悟空连胜。
很明显,只要一直下下去,“悟空”的连胜数几乎一定会不断累加下去。
因为,只要不断电、不卡机,网络不出故障,“悟空”就能一直保稳定的状态。
但43岁的斯帕斯基不行。半天完成五局,已经是他体力和脑力的极限了,继续下去状态只会不断下滑。
“战平世界排名第五”这一消息惊爆后,“悟空”真的出名了。
“WoKong”这个单词刚与人工智能领域出现时,在戴英媒体的吹捧下,靠着Q-learning、GBDT等一系列新算法和卷积神经网络等全新的概念,成为了一时间热议的话题。
但也只是一时热议……