メンバー
博士3年
岸川 大航 | 深層逆強化学習による意図推定 |
周 丹 | Evolutionary Computation for Multi-objective Reinforcement Learning |
杜 吉慶 | Adaptive Control System via Deep Reinforcement Learning |
博士2年
齋木 匠 | 多目的強化学習による信号制御 |
博士1年
茂木 渉 | メカニズムデザイン:逆強化学習による交通量均衡配分実現 |
修士2年
田村 秋考 | 非凸パレートフロント推定のための多目的強化学習 |
鳥海 良太 | 鉄道自動運行に向けた強化学習と制御理論の統合的制御 |
森 友輝 | マルチエージェント系深層強化学習のscalabilityの改善 |
森 裕太 | マルチエージェント深層強化学習における協調測度 |
修士1年
國枝 武史 | 最適な危険回避制御に向けた良構造/悪構造状況の識別 |
斉藤 雅治 | 異種マルチエージェント軌跡に潜在する複数意図の同定 |
境 健太郎 | 頑健な制御方策獲得に向けたオフライン強化学習 |
田澤 慧樹 | 行動変容に向けた選好順序の推定 |
学部4年
大野 優太 | Decision Transformerを用いた行動履歴に基づく効用推定 |
徳弘 雄太 | 自動応答システム実現に向けたFAQのChatGPTと人のタグ付け特性の考察 |
中条 隼人 | イベント駆動型制御導入による環境保全と快適性の実現 |
間庭 卓也 | 複数の準最適方策に基づく最適方策の生成 |
篠原 彰太 | 強化学習による鉄道自動制御の頑健性検証 |
箕島 康太 | スモールデータからの模倣学習 |
小林 弥聖 | 自動運転車の隊列走行:Attentionを用いたフォーメーション維持の実現 |
永田 健斗 | モデルフリー強化学習導入によるシステム同定と設計法:~制御理論の相補的活用~ |
熊瀧 征哲 | Human FeedbackによるDRRL(PID制御+深層強化学習)安定性改善 |
安井 祐介 | モデル予測制御のホライズン決定における強化学習の導入:~制御理論の相補的活用~ |