教育プラットフォーム

バーチャルコース：Coursera

期間限定割引

このコースの主なカテゴリ

データサイエンス

このコースについて

バーチャルコース「サンプルベースの学習方法 - バーチャルコース - Coursera」は、さまざまなコンテンツのコースであり、約 22 時間のビデオ授業を提供しています。完了までXNUMX時間。その重要な機能を確認し、オレンジ色のボタンをクリックして、Coursera e-Learning プラットフォームの詳細情報を確認してください。

DESCRIPTION

このコースでは、エージェント自身の経験から学び、環境との試行錯誤の相互作用に基づいて最適に近いポリシーを学習できるさまざまなアルゴリズムについて学習します。実際の経験から学ぶことは、環境のダイナミクスに関する予備知識を必要とせず、最適な行動を実現できるため、驚くべきことです。直感的にシンプルで強力なモンテカルロ法と、Q 学習を含む時差学習法について説明します。モデルベースのスケジューリング (動的計画法に似ています) と一時的な差分更新を組み合わせて学習を大幅にスピードアップできるアルゴリズムという、両方の世界を最大限に活用する方法を調査して、このコースを終了します。このコースを修了すると、次のことができるようになります: - サンプリングされた経験から価値関数を推定するための XNUMX つの戦略として、時間差とモンテカルロ学習を理解する - モデル内で動的計画法スイープの代わりにサンプリングされた経験が使用される場合の探索の重要性を理解する- モンテカルロと動的計画法と TD の関係を理解する。 - TD アルゴリズムを実装して適用し、価値関数を推定する - 期待される Sarsa と Q 学習 (制御のための XNUMX つの TD 手法) を実装して適用する - ポリシー内の制御とポリシー外の制御の違いを理解する - 経験に基づいて計画を理解するシミュレーション (従来の計画戦略とは対照的に) - シミュレートされた経験を使用する Dyna と呼ばれる RL へのモデルベースのアプローチを実装する - 動的プログラミングスイープではなくサンプルエクスペリエンスを使用する場合、Dyna を使用した場合のサンプル効率の改善を確認するために実証研究を実施するモデル内: モンテカルロと動的計画法および TD の間の接続を理解する。 - TD アルゴリズムを実装して適用し、価値関数を推定する - 期待される Sarsa と Q 学習 (制御のための XNUMX つの TD 手法) を実装して適用する - ポリシー内の制御とポリシー外の制御の違いを理解する - 経験に基づいて計画を理解するシミュレーション (従来の計画戦略とは対照的に) - シミュレートされた経験を使用する Dyna と呼ばれる RL へのモデルベースのアプローチを実装する - 動的プログラミングスイープではなくサンプルエクスペリエンスを使用する場合、Dyna を使用した場合のサンプル効率の改善を確認するために実証研究を実施するモデル内: モンテカルロと動的計画法および TD の間の接続を理解する。

ここで完全なプログラムを知ってください

利点

Courseraコースの主な利点

Courseraは、世界中のオンライン学習を提供するために、200を超える主要な大学や企業からのコースを提供しています。 CourseraPlusサブスクリプション付き, すべてのコースの 90% 以上に無制限にアクセスでき、Coursera で最も人気のある専門資格と専門分野にアクセスできます。

データサイエンス、ビジネス、自己啓発。一度に複数のコースに登録し、無制限の証明書を取得し、キャリアを開始、成長、さらには変更するための需要の高い仕事のスキルを学ぶことができます。

COURSERA PLUS の年間サブスクリプションで、最大限に活用し、500 米ドル以上節約する方法を発見してください*

*500 米ドルの月額サブスクリプションから、プロモーションを利用した年間サブスクリプションに移行すると、12 か月で最大 59 米ドル節約できます。通常の年間サブスクリプションは 399 米ドルです。このプロモーションでは、299 米ドルしかお支払いいただけません。黄色いボタンをクリックして、すべてを調べてください。

方法を見つけます：

時間）

最小

Sec（s）

[INSERT_ELEMENTOR id = "21192"]

よくある質問

方法論

バーチャル

研究のレベル

あなたが学ぶ特定のスキル

詳細ルート

配達スケジュール：自分のペースと空き状況で勉強する
ビデオ時間：約。完了するまでに22時間
アクセス時間コース修了後のコンテンツへのアクセス
配達証明書？はい

今すぐコースに行く

NEW

この研究についてもっと知る

こちらのコースページにアクセスしてください

興味のあるトピックに関するコースを探す

注目のプログラム

知識分野ごとにプログラムを探索する

AulaProの最新情報

プロモーション中のUdemy

サンプルベースの学習方法 - バーチャル コース - Coursera 確認済みのリスティング

このコースは、専門プログラムの一部です: 強化学習

教育プラットフォーム

期間限定割引

このコースの主なカテゴリ

このコースについて

DESCRIPTION

利点

Courseraコースの主な利点

一流大学

博士号を持つ教師

成長

+45万

方法を見つけます：

広告

よくある質問

方法論

研究のレベル

あなたが学ぶ特定のスキル

広告

詳細ルート

NEW

レビューを追加

返信を残す・ 返信をキャンセル

この研究についてもっと知る

広告

あなたも興味があるかもしれません

時系列処理と自然言語のシーケンス モデル - バーチャル コース - Coursera

IBM Watson による AI の紹介 - オンライン コース - Coursera

ビッグデータによる機械学習 - 仮想コース - Coursera

私たちについて

興味を持っている

プラットフォーム

形式別研究

ClassroomProについて

最新の記事

Artículosdestacados

最も人気のあるアイテム

テーマ別コース

知識分野別プログラム

寄付で私たちをサポートしてください

サンプルベースの学習方法 - バーチャルコース - Coursera 確認済みのリスティング

返信を残す・返信をキャンセル

時系列処理と自然言語のシーケンスモデル - バーチャルコース - Coursera

IBM Watson による AI の紹介 - オンラインコース - Coursera