【techweb】1月25日消息,據國外媒體報道,在人機圍棋大戰中打敗柯潔、李世石等一眾圍棋高手之后,谷歌旗下人工智能公司deepmind又將人機大戰轉向了電腦游戲,而在《星際爭霸2》的人機大戰中,谷歌deepmind的人工智能程序以10:1的成績完勝人類職業選手。
谷歌deepmind研發的用于人機對戰的人工智能程序名為alphastar,其挑戰的是兩位《星際爭霸2》的職業玩家“tlo”和“mana”,比賽在去年的12月進行,《星際爭霸2》的開發商暴雪和谷歌deepmind已公布了當時比賽的視頻。
在alphastar 與“tlo”和“mana”去年的對戰中,使用的是略微過時的《星際爭霸2》版本,這一版本在設計上便于人工智能程序進行相關的研究。
“tlo”和“mana”與alphastar各進行了五局比賽,但“tlo”和“mana”在比賽中并未占據優勢,最后的結果都是alphastar全勝,對決結果定格在了尷尬的10:0。
在所公布的比賽視頻中,谷歌deepmind推出了一個新版本的alphastar,與“mana”進行比賽,新推出的alphastar對視野進行了限制,“mana”也得以發現的alphastar的部分不足并最終也戰勝了它,用一局勝利為人類職業玩家挽回了一絲顏面,alphastar也在與職業玩家的對戰中首嘗敗績。
在與alphastar進行對戰的視頻中,“tlo”曾表示他有信心戰勝alphastar,但不曾想后者在五局中全部獲勝,而且每次都采用了完全不同的策略。
“tlo”之后的“mana”,在比賽中也拼盡全力,但并未擺脫與“tlo”相同的命運,他在與alphastar的五局比賽中也均已失敗告終。
外媒在報道中表示,人工智能程序在電腦游戲方面存在較多的優勢,包括“tlo”和“mana”在內的職業玩家,玩電腦游戲時每分鐘的鼠標點擊量方面存在理論上的限制,而人工智能程序則沒有這方面的限制。
其次,外媒在報道中表示,人工智能程序的反應時間約為350毫秒,alphastar在反應速度方面比大多數的職業玩家要慢一些,但在通過大量的訓練之后,人工智能程序變得更聰明,更有效率的決定彌補了反應時間方面的不足,這也是人工智能程序在游戲中的一大優勢。
其三,雖然古語有“眼觀六路耳聽八方”,歷史上也不乏視野開闊的高手的傳說,但在游戲中,這一點對職業玩家并不太適用,反而更適用于人工智能程序,相關的技術使其對游戲全部區域有更好的掌控,人類玩家則需要花費時間關注不同的區域。
alphastar對游戲全部區域有更好的掌控能力這一點,在其與“mana”的最后一局中也得到了印證,在那一局中,谷歌deepmind對新推出的alphastar進行了視角方面的限制,在對所進行游戲的全部區域的注意力方面就不再有明顯的優勢,“mana”也就有時間發現alphastar的缺點并最終戰勝它。
alphastar在《星際爭霸2》方面的技能,來自于開發商deepmind對其進行的深度訓練,deepmind回放了大量人類玩家游戲時的視頻,也是基于相關的數據訓練神經網絡,在持續一周的時間里,alphastar玩了相當于200年的《星際爭霸2》。
來源:techweb
以上是網絡信息轉載,信息真實性自行斟酌。