【互動體驗觀察】 電玩遊戲的有機性,AI是關鍵嗎?(2)
上一篇我們介紹到將原本在電玩遊戲中只具功能性的AI配角,賦予了更多的能動性,當AI成了玩家自身後,基於研究人員定義的遊戲生存機制,AI們形成了有如自然界生物般的行為模式。
基於對AI偌大可能性的探索,OpenAI於2018年舉辦的 AI 強化學習競賽Retro Contest,亦推進人工智能在遊戲環境上的可塑性,其中最有趣的就是發現AI竟然也會作弊!這場競賽進行的方式相當好玩,就是讓AI去玩二十幾年前相當火紅的單機遊戲《音速小子》,參賽的團隊在短時間內訓練AI,讓其掌握遊戲的規則和操作方式,一一從不同關卡破解、學習,最後演算出最有效率的闖關策略。
AI的最高目標是優先獲得最高分數,並在盡可能短的時間內闖關完成,一般來說,我們在玩《音速小子》的時候,以打擊敵人和吃金幣來獲得分數,然而AI卻出乎意料的繞過正常玩法,透過遊戲的Bug來完成任務。
像是下列展示的遊戲畫面,按照遊戲設計師的想法,玩家需要等待上下移動的電梯之間出現空隙,耐心的一層一層往下移動通關,不過呢,參賽團隊除了原本的最高目標之外,另外增加對遊戲環境探索的鼓勵以及其進一步迭代的策略效果,結果激發了AI不合遊戲常規的玩法。
如果僅僅給予原始的目標條件,AI容易因為過於簡化的目標導向困在關卡障礙中。
而如果加以鼓勵探索行為,AI逐漸學會了複雜的上下樓動作,最後甚至發現了得以穿越牆面、超前闖關的Bug,轉眼間直接進階到下一個關卡環境。
逼近的石牆關卡,AI也是一樣利用「捷徑」Bug成功脫逃。
從AI找Bug能力,而至打開有如遊戲宇宙裂口的AI遊戲研究案例,還有來自弗萊堡大學(University of Freiburg)研究團隊的發現。他們計畫訓練AI在街機遊戲Q*bert裡找到最高效的遊戲策略,Q*bert是一款1982年的經典遊戲,玩家在總共6層共21個方格之間跳躍,每次可跳到鄰近一格,一但踏上格子會使其變色,而玩家需要將每格變成特定顏色才可過關,如果玩家遭遇到敵人,或是在邊緣跳出格子便結束遊戲。
訓練過程中演算法開始出現了非常人邏輯的遊戲策略,譬如AI會故意站在邊緣,引誘敵人前來再縱身跳下方格,透過自殺來殺死敵人,這種逆反生存邏輯的玩法,來自其學習到透過殺死敵人可以獲得足夠的分數重獲生命,週而復始的集體自殺戰術,則可讓分數不斷的升高。
另一種更難以設想得到的得分策略,則來自AI發現了遊戲設計的漏洞,我們只看到AI看似隨機的在格子間快速的跳躍,然而突然之間,所有格子開始同時閃爍不同顏色,這個時候只要玩家不斷移動跳躍,就可以輕鬆的獲得高分。這樣的實驗結果甚至已經超乎遊戲設計者戴維斯(Warren Davis)的預期。
直至現今,我們對於機器學習仍無法完全掌握和理解,但或許也因為這個難以企及的未知,AI得以提出人類邏輯之外的答案。從上述的例子來看,AI玩家為求分數、不擇手段的玩法,似乎喪失了最初遊戲「玩」的意義,陷入了機械式的輪迴中,然而若我們保持開放態度,看待和AI交互互動產生的創造性,人工智能找Bug的能力,也許能幫忙點出人類的盲點,進而顛覆人類世界既有機制中不完善處,探勘出新的裂口也不一定?
參考資料/圖片來源:
https://buzzorange.com/techorange/2019/07/01/ai-cheat-list/
https://buzzorange.com/techorange/2019/01/04/google-ai-cheat/
https://www.techbang.com/posts/62714-cheating-to-play-games-ai-also-learn-bad
https://openai.com/blog/retro-contest/https://zhuanlan.zhihu.com/p/39638134