マルチエージェント
GitHub Code 実施内容 実行環境 PPOハイパーパラメータ シミュレーション条件 トレーニング履歴 トレーニング時の評価結果 性能評価 生成された戦術 Red team = 1 swarm vs Blue team = 1 swarm Red team = 2 swarms vs Blue team = 2 swarms Red team = 3 s…
GitHub Code 実施内容 実行環境 シミュレーション条件 トレーニング履歴 トレーニング時の評価結果 性能評価 生成された戦術 Red team = 8 swarms vs Blue team = 7 swarms ロバスト性(汎化能力) 生成された戦術例 Red team = 1 swarm vs Blue team = 1swa…
GitHub Code 実施内容 実行環境 シミュレーション条件 トレーニング履歴 トレーニング時の評価結果 性能評価 生成された戦術 1 swarm vs 1 swarm 2 swarm vs 1 swarm 3 swarm vs 1 swarm 1 swarm vs 2 swarms 2 swarms vs 2 swarms 3 swarms vs 2 swarms ロ…
手始めに解いてみて感触を得るのに手ごろな問題を設定し、報酬やエージェント・アーキテクチャを設計しました。
追記@2021.10.08を書いた時に、なぜかフォーマットが乱れていました。修正しました。ゴメンナサイ はじめに (マルチエージェント)強化学習の研究例 研究の目的 群 vs 群の戦闘モデル(ランチェスター・戦闘モデル) 使用するマルチエージェント強化学習 ま…