第1997章 硬件条件受限的情况下,“蒸馏”的重要性(2 / 2)

小主,这个章节后面还有哦,请点击下一页继续阅读,后面更精彩!

其一是,将历史比赛数据转化为知识,投喂给它。让它基于“规则”和“知识”,通过 MCTS算法和神经网络组合自我训练。

其二是不断给他找对手,它的深度卷积网络会在对局中基于胜率,自动捕捉高阶模式。

听着很美好,但也导致参数空间扩张和外部数据资产的不断积累。

简单的说,数据量越来越大。

而计算机的算力、总线、内存、外部存储器和磁盘阵列控制器的吞吐、读写速度都是有限的。数据量越来越大,就意味着调用、比对、决策的时间越来越慢。

而国际象棋的时间规则又那么严苛,这几乎是无解的矛盾……

谁也没想到,这个问题在曲卓上次来时,所有人都没留意的情况下,就被初步解决了。

虽然他只待了大半天,其中很大一部分时间还用在了开会和闲聊上。

闲聊过程中,得知参数量越来越大,不但占用了大量宝贵的硬盘空间,甚至为了保证读取速度,不得不将数据分配到不同磁盘阵列里。

确定了问题后,曲卓只用了两个小时左右,就编辑了一个知识库蒸馏程序。随后用蒸馏程序对现有数据进行清洗、去重,还修改了标注规则。

“蒸馏”的过程非常慢,分布在四个磁盘阵列下,已经累积到接近3G的专项知识库,用了二十多个小时才完成。

等蒸馏结束后,实验室的人惊讶的发现,新的智能体数据包,居然只有两百三十多兆,参数量从亿级骤降到了百万级。

没有人知道如此夸张的脱水比,在提升知识密度的同时,会损失多少有效知识。但毫无疑问,运算速度重新回到了丝滑流畅的水平。

呃~~

只能说,不同的时代,对“丝滑流畅”这一评价的阈值,是不同的。

然后,就是不断的惊喜。

大概从去年年底诺贝尔颁奖前后开始,参数进行过深度优化的“悟空”,进入了连胜状态。

消息传开后,之前那些体验后便失去了兴致的国际象棋高手们,有人起了再次体验的兴趣。

今年一月中,“悟空”在所有人都毫无准备的情况下,突兀的赢了一位继去年夏天后,第二次至牛津体验与“悟空”对弈的国际象棋大师大卫?古德曼。

大卫?古德曼国际棋联认证,Elo 2380-2400,世界排名290至300的IM级职业选手。

“悟空”连赢了他三盘,一盘比一盘轻松。

越来越轻松,不是“悟空”短时间内“棋力暴涨”,是大卫?古德曼在输掉第一盘后,被旁观者的惊讶和惊呼影响了心态,后面两盘水准连续下滑。

虽然“悟空”只是赢了个国际排位三百名左右的大师,但三百名也是大师呀。

很快,“WoKong”战胜国际象棋IM级选手David Goodman这一消息,被戴英Electronics Weekly(一份电子专业报)的81年一月上半月刊报道了出来,并很快在小圈子里引发了热议。

(国际特级大师 GM、国际大师 IM、棋联大师 CM)

后面的一个多月,陆续有十余位得到消息的大师级选手,慕名前往剑桥和牛津……“悟空”的战绩是57胜,31负。

在戴英各路媒体的重点关注和推波助澜下,消息瞬间“吹”遍了欧洲各国,甚至北美的媒体也跟着开始报道。

尤其是计算机和电子类报纸、杂志,几乎全都做了报道,差异只在于篇幅、激动、乐观与质疑。

四月初,“悟空”迎来了一位重量级对手,81年一月FIDE官方最新排名全球第五,毛子裔高卢GM级国际特级大师斯帕斯基。

结局是两胜一和两负。

“悟空”首局输了,但斯帕斯基赢的并不轻松,第二局斯帕斯基依旧赢了,同样不轻松。第三局和棋,四、五局悟空连胜。

很明显,只要一直下下去,“悟空”的连胜数几乎一定会不断累加下去。

因为,只要不断电、不卡机,网络不出故障,“悟空”就能一直保稳定的状态。

但43岁的斯帕斯基不行。半天完成五局,已经是他体力和脑力的极限了,继续下去状态只会不断下滑。

“战平世界排名第五”这一消息惊爆后,“悟空”真的出名了。

“WoKong”这个单词刚与人工智能领域出现时,在戴英媒体的吹捧下,靠着Q-learning、GBDT等一系列新算法和卷积神经网络等全新的概念,成为了一时间热议的话题。

但也只是一时热议……