Gym 強化学習入門

難易度:★★★★★

  • 業種
  • 全業種共通
  • コーディング有
  • シミュレーション
  • 強化学習

本講座では、強化学習で良く扱われる問題に触れつつ強化学習の基本的な仕組みを理解し、アルゴリズムを実装して、どのような問題を解くことができるかを実感していただきます。未知の問題に対しても最低限のアルゴリズムを実装できるようになることが目標です。

修了証明書

  • 9 時間
  • 1,750 Exp
  • 0 Videos
  • 4 Slides
  • 3 Missions
  • 7 Tasks
  • 31 Operations

はじめに 50 Exp

本講座の概要とカリキュラムを紹介します。

Slideを見る

Mission 1

強化学習の仕組み

ここでは強化学習の基本的な問題設定や仕組みを説明します。そもそも強化学習とは何か、どのような問題設定で、どのようなアルゴリズムによって問題にアプローチをするかを理解してもらうことが目的です。

Task 1
強化学習とは
250 Exp
  • 25 分
  • 250 Exp
  • 0 Videos
  • 0 Slides
  • 5 Operations

このタスクでは強化学習の基本的な仕組みを理解しているかどうか確認します。

Task 2
迷路で理解する
150 Exp
  • 20 分
  • 150 Exp
  • 0 Videos
  • 0 Slides
  • 3 Operations

ここでは強化学習で扱う問題設定であるマルコフ決定過程(MDP)を迷路のゲームを通して理解していただきます。

Mission 2

強化学習アルゴリズム(1)

ここでは単純な迷路を題材として、実際に強化学習アルゴリズムを実装してその結果をみます。まずは環境の情報(遷移確率や報酬関数)が分かっている場合に適用できるアルゴリズムを扱い、次に分かっていない状態におけるアプローチとしてモデルフリーのアルゴリズムを扱います。強化学習アルゴリズムの考え方や基本的な仕組みを理解してそれぞれのアルゴリズムを実装できるようになることが目的です。

Task 1
環境が既知の場合
250 Exp
  • 150 分
  • 250 Exp
  • 0 Videos
  • 0 Slides
  • 5 Operations

ここでは環境が既知の場合に適用できるアルゴリズムを説明します。前回扱った迷路ゲームなどに適用して理解を深めていただきます。

Task 2
モデルフリー
250 Exp
  • 150 分
  • 250 Exp
  • 0 Videos
  • 0 Slides
  • 5 Operations

ここでは環境が未知の場合に適用できるアルゴリズムを説明します。前回扱った迷路ゲームなどに適用して理解を深めていただきます。

Task 3
まとめ
300 Exp

Mission 3

強化学習アルゴリズム(2)

ここでは、大きく分けて2つのテーマについて学びます。1つは、本格的に強化学習の問題に取り組む際にはアルゴリズム全体をどのように実装するべきかという点について、もう一つは、観測される状態が連続値である場合の問題への取り組み方についてです。これらについて理解することは、近年注目を集めている深層強化学習への足がかりにもなります。本ミッションを通して、あらゆる種類の強化学習問題に取り組むことができるという自信を身につけましょう。

Task 1
基本モジュールの実装
150 Exp
  • 45 分
  • 150 Exp
  • 0 Videos
  • 0 Slides
  • 3 Operations

ここでは、強化学習アルゴリズムを含んだ全体の実装方法を学びます。

Task 2
倒立振子の問題の攻略
200 Exp
  • 20 分
  • 200 Exp
  • 0 Videos
  • 0 Slides
  • 4 Operations

ここでは、実装した基本モジュールを駆使して倒立振子の問題を攻略します。

まとめ 50 Exp

本講座のまとめです。

Slideを見る
PAGE
TOP