バーチャルコース「関数近似による予測と制御 - バーチャルコース - Coursera」は、 の動画授業を提供する、さまざまなコンテンツのコースです。 その重要な機能を確認し、オレンジ色のボタンをクリックして、Coursera e-Learning プラットフォームの詳細情報を確認してください。
このコースでは、大規模で高次元の潜在的に無限の状態空間の問題を解決する方法を学習します。 価値関数推定を教師あり学習問題 (関数近似) に変換できることがわかります。これにより、一般化と識別のバランスを慎重に調整して利益を最大化するエージェントを作成できます。 この旅は、ポリシーの評価またはモンテカルロや TD などの予測方法を関数の近似構成に拡張する方法を調査することから始めます。 RL の特徴構築手法と、ニューラル ネットワークとバックプロップによる表現学習について学習します。 このコースの締めくくりとして、ポリシー勾配法について深く掘り下げます。 価値関数を学習せずにポリシーを直接学習する方法。 このコースでは、1 つの継続的な状態制御タスクを解決し、継続的なアクション環境におけるポリシー勾配法の利点を調査します。 前提条件: このコースは、コース 2 と 3.0 の基礎の上に大きく構築されており、学生はこのコースを開始する前にそれらを完了している必要があります。 また、学生は、確率と期待値、基本的な線形代数、基本的な微積分、Python 1 (少なくとも XNUMX 年)、および疑似コードからのアルゴリズムの実装に慣れている必要があります。 このコースを修了すると、次のことができるようになります: -教師あり学習アプローチを使用して値関数を近似する方法を理解する -関数近似での予測 (値推定) の目的を理解する -関数近似 (状態集約) を使用して TD を実装する
世界で最も権威のある大学で自宅から準備してください。
Courseraのコースの質は、多くの場合学部長で博士号を取得しているインストラクターによってサポートされています。
Courseraの学生の85%以上が、昇進や昇給などのキャリア上のメリットを報告しています。
世界中の何百万人もの学生が、Courseraで個人的および専門的な目標を達成しています。
Courseraは、世界中のオンライン学習を提供するために、200を超える主要な大学や企業からのコースを提供しています。 CourseraPlusサブスクリプション付き, すべてのコースの 90% 以上に無制限にアクセスでき、Coursera で最も人気のある専門資格と専門分野にアクセスできます。
データサイエンス、ビジネス、自己啓発。 一度に複数のコースに登録し、無制限の証明書を取得し、キャリアを開始、成長、さらには変更するための需要の高い仕事のスキルを学ぶことができます。
COURSERA PLUS の年間サブスクリプションで、最大限に活用し、500 米ドル以上節約する方法を発見してください*
*500 米ドルの月額サブスクリプションから、プロモーションを利用した年間サブスクリプションに移行すると、12 か月で最大 59 米ドル節約できます。 通常の年間サブスクリプションは 399 米ドルです。 このプロモーションでは、299 米ドルしかお支払いいただけません。 黄色いボタンをクリックして、すべてを調べてください。
こんにちは。どうすればお手伝いできますか? コースに興味がありますか? 何の主題についてですか?
レビューを追加