レギュラーセッション

Efficient creation of player bots using Deep Reinforcement Learning/深層強化学習を用いたプレイヤーボットの効率的な作成

講演形式
レギュラーセッション
講演時間
08月23日(水) 13:30 〜 14:30
講演ルーム
第4会場外国語配信
受講スキル

Previous machine learning / reinforcement learning knowledge is a plus, but not required.

機械学習や強化学習の予備知識があることが望ましいですが、必須ではありません。

得られる知見

They will leave with an understanding of some of the main difficulties with creating realistic player bots using Deep RL in different situations like combat and navigation. Most importantly, the main takeaway is that training Deep RL algorithms to accomplish complex tasks in AAA video games is not only achievable – but can be done efficiently. They will also leave with a basic understanding of RL, constrained RL, and competitive self-play.

受講者は、戦闘やナビゲーションなどさまざまな状況で深層強化学習を使用したリアルなプレイヤーボットを作成する際の主な課題について理解することができるでしょう。最も重要なことは、AAAビデオゲームにおいて複雑なタスクを達成するために深層強化学習アルゴリズムをトレーニングすることは、達成可能であるだけでなく、効率的に実行できるということです。また、強化学習、制約付き強化学習、対戦型セルフプレイの基本についても理解を深めることができます。

セッションの内容

In this presentation, we will explore applications of Deep Reinforcement Learning (Deep RL) to create player bots capable of enhancing the gaming experience. Notably, Deep RL bots can do things that would be difficult (or even impossible) to script. Most importantly, these bots are trained under “reasonable” time and budget constraints – making them feasible for video game productions. We will take a deep dive into three recent research papers that we have published that tackle the following problems: realistic player-like navigation, behaviour specification, and complex combat. Our methods have been used in Assassin’s Creed, Far Cry, R6, and For Honor, for testing and player facing purposes. We will be showing several videos highlighting these results in-game.

この講演では、ゲーム体験を向上させるプレイヤーボットを作成するための深層強化学習(Deep RL)のアプリケーションを探ります。注目すべきは、深層強化学習のボットは、スクリプトでは難しい(あるいは不可能な)ことができることです。また、最も重要なことは、これらのボットは「合理的な」時間と予算の制約のもとで訓練できるため、ビデオゲーム制作の実現可能性を高めていることです。リアルなプレイヤー体験が得られるナビゲーション、行動指定、複雑な戦闘といった課題への取り組みについて、最近発表した3つの研究論文を基に掘り下げていきます。私たちの手法は『アサシン・クリード』『ファークライ』『R7』『フォーオナー』において、テストやゲームのプレイにおいて使用されています。これらの成果をゲーム内で活用した事例を動画でいくつかご紹介します。

ジョシュア・ロモフ

Ubisoft

La Forge

Research and Development Scientist

講演者詳細を開く >

<講演者プロフィール>

Joshua Romoff is an R&D Scientist at Ubisoft La Forge, where he works on pushing the state of the art of Deep Reinforcement Learning for video game development. He completed his PhD at McGill university where he focused on methods for decomposing the Reinforcement Learning problem into simple components.

ジョシュア・ロモフはUbisoft La Forgeの研究開発サイエンティストで、ビデオゲーム開発のために深層強化学習の最先端技術の推進に取り組んでいる。マギル大学で強化学習問題を単純な構成要素に分解する方法に焦点を当て、博士号を取得した。
閉じる