レイチェルは胡蝶の夢を見るのか

強化学習の応用を中心に、コーディングに挑戦する趣味人のブログ

PPO

マルチエージェント強化学習を使って、複数群 vs 複数群のための協調戦闘戦術を生成してみる(その5):少〜多数群で訓練する

GitHub Code 実施内容 実行環境 PPOハイパーパラメータ シミュレーション条件 トレーニング履歴 トレーニング時の評価結果 性能評価 生成された戦術 Red team = 1 swarm vs Blue team = 1 swarm Red team = 2 swarms vs Blue team = 2 swarms Red team = 3 s…

マルチエージェント強化学習を使って、複数群 vs 複数群のための協調戦闘戦術を生成してみる(その4):多数群 vs 多数群で訓練する

GitHub Code 実施内容 実行環境 シミュレーション条件 トレーニング履歴 トレーニング時の評価結果 性能評価 生成された戦術 Red team = 8 swarms vs Blue team = 7 swarms ロバスト性(汎化能力) 生成された戦術例 Red team = 1 swarm vs Blue team = 1swa…

マルチエージェント強化学習を使って、複数群 vs 複数群のための協調戦闘戦術を生成してみる(その3):少数群 vs 少数群で訓練する

GitHub Code 実施内容 実行環境 シミュレーション条件 トレーニング履歴 トレーニング時の評価結果 性能評価 生成された戦術 1 swarm vs 1 swarm 2 swarm vs 1 swarm 3 swarm vs 1 swarm 1 swarm vs 2 swarms 2 swarms vs 2 swarms 3 swarms vs 2 swarms ロ…

マルチエージェント強化学習を使って、複数群 vs 複数群のための協調戦闘戦術を生成してみる(その2):まずはシンプルな問題を設定する

手始めに解いてみて感触を得るのに手ごろな問題を設定し、報酬やエージェント・アーキテクチャを設計しました。

マルチエージェント強化学習を使って、複数群 vs 複数群のための協調戦闘戦術を生成してみる(その1):はじめに

追記@2021.10.08を書いた時に、なぜかフォーマットが乱れていました。修正しました。ゴメンナサイ はじめに (マルチエージェント)強化学習の研究例 研究の目的 群 vs 群の戦闘モデル(ランチェスター・戦闘モデル) 使用するマルチエージェント強化学習 ま…