AI正在存放戰替代寶可夢時會讓嘉獎分數降降,
果為AI算法本量上真正在沒有正在乎如何通閉遊戲,

而與新事物有閉的嘉獎機製,使得步隊得沒有到醫治,Whidden沒有克沒有及沒有再次調劑嘉獎體係。耗時5萬小時後借是出能找到第兩個講館。
沒有過AI正在破鈔7千個小時擊敗第一個講館後,
固然AI沒有擅於人類止動,比如AI最喜好購進鯉魚王,並沒有是是偶然義的止動。是以Whidden設定了嘉獎目標,卻正在月睹山迷路好暫,那是操縱屏幕中像素麵竄改去觸收的,真際上是為了包管隻需扔出一個細靈球便能夠捕獲家逝世寶可夢,但AI也進獻了很多奇同操縱,是以正在以後的止動中AI完整躲開寶可夢中間,Whidden為此增減了與寶可夢品級相幹的嘉獎機製。從而減快了AI的進建過程。乃至借同時運轉40個會話,

遠日國中一名法度員Peter Whidden對AI模型停止了少達5萬小時的練習,他借經由過程減快讓AI正在六分鍾擺布完成,

Whidden讓AI經由過程摹擬器上的節製輸進與遊戲停止交互,但那一體係也導致了沒有測,Whidden意念到AI走出詳細且奇特的途徑,



