レイチェルは胡蝶の夢を見るのか

強化学習の応用を中心に、コーディングに挑戦する趣味人のブログ

2021-10-01から1ヶ月間の記事一覧

マルチエージェント強化学習を使って、複数群 vs 複数群のための協調戦闘戦術を生成してみる(その5):少〜多数群で訓練する

GitHub Code 実施内容 実行環境 PPOハイパーパラメータ シミュレーション条件 トレーニング履歴 トレーニング時の評価結果 性能評価 生成された戦術 Red team = 1 swarm vs Blue team = 1 swarm Red team = 2 swarms vs Blue team = 2 swarms Red team = 3 s…

マルチエージェント強化学習を使って、複数群 vs 複数群のための協調戦闘戦術を生成してみる(その4):多数群 vs 多数群で訓練する

GitHub Code 実施内容 実行環境 シミュレーション条件 トレーニング履歴 トレーニング時の評価結果 性能評価 生成された戦術 Red team = 8 swarms vs Blue team = 7 swarms ロバスト性(汎化能力) 生成された戦術例 Red team = 1 swarm vs Blue team = 1swa…

マルチエージェント強化学習を使って、複数群 vs 複数群のための協調戦闘戦術を生成してみる(その3):少数群 vs 少数群で訓練する

GitHub Code 実施内容 実行環境 シミュレーション条件 トレーニング履歴 トレーニング時の評価結果 性能評価 生成された戦術 1 swarm vs 1 swarm 2 swarm vs 1 swarm 3 swarm vs 1 swarm 1 swarm vs 2 swarms 2 swarms vs 2 swarms 3 swarms vs 2 swarms ロ…

マルチエージェント強化学習を使って、複数群 vs 複数群のための協調戦闘戦術を生成してみる(その2):まずはシンプルな問題を設定する

手始めに解いてみて感触を得るのに手ごろな問題を設定し、報酬やエージェント・アーキテクチャを設計しました。