MENU

競争と協調 ~ マルチエージェントシステム ~ 最適性と合理性

当研究室では,機械学習(Machine Learning),数理最適化から,都市の交通減災地盤分類鉄道(運転整理,停止制御),電力融通最適化といった問題にアプローチします.

建築・デザイン系でも,進化計算などの人工生命(ALife)による創発デザインや、マルチエージェント技術による施設配置自律分散システムによるアプローチアフォーダンスなど,人間の意思決定に興味のある方であれば歓迎します.

read more...

研究紹介動画

お知らせ

受賞等

  • 2023.09.
    JAWS奨励賞 @ 合同エージェントワークショップ&シンポジウム2023 (JAWS2023)

    中条隼人. セミマルコフモデルを導入したイベント駆動型強化学習による空調制御の安定性実現.
  • 2022.09.
    優秀論文賞 @ 第30回インテリジェント・システム・シンポジウム FAN2022

    高野誠也. スパースな報酬・エキスパート不在の環境下での深層強化学習に関する一考察.
  • 2022.06.
    学生奨励賞 @ 第36回人工知能学会全国大会(JSAI2022)

    森友輝. マルチエージェント強化学習による障害物回避を伴うUAV編隊の経路計画.
  • 2021.07.
    Competitive Paper Award @ 9th International Conference on Smart Computing and Artificial Intelligence (SCAI 2021)

    Daiko Kishikawa. Multi-Objective Inverse Reinforcement Learning via Non-Negative Matrix Factorization.
  • 2019.11.
    SSI 優秀発表賞 @ 計測自動制御学会 システム・情報部門学術講演会2019 (SSI2019)

    千邑峻明. 準最適な軌跡群を用いた逆強化学習における軌跡の定量的評価 ~軌跡比較法の提案と実験的考察~.
  • 2019.11.
    SSI 優秀発表賞 @ 計測自動制御学会 システム・情報部門学術講演会2019 (SSI2019)

    岸川大航. 搭乗者の快適性を考慮した自動走行の実現 ~ 深層逆強化学習によるアプローチ ~.
  • 2019.10.
    Best Student Paper Award @ The 4th IEEE International Conference on Agents (ICA'19)

    Daiko Kishikawa. Comfortable Driving by using Deep Inverse Reinforcement Learning.
  • 2019.09.
    IEEE Computer Society Japan Chapter Young Researcher Award @ Joint Agent Workshops & Symposium 2019

    池永晶子. 部分観測下の多目的逐次意思決定問題における各目的の重み推定.
  • 2019.09.
    最優秀ポスター発表賞 @ Joint Agent Workshops & Symposium 2019

    浪越圭一. MASモデル構築のためのHeterogeneous swarm逆強化学習の検討.>
  • 2019.09.
    優秀ポスター発表賞 @ Joint Agent Workshops & Symposium 2019

    北村清也. 単純なシーンの学習勾配に着目した運転方策の切替え法 ~ 市街地の複雑なシーンでの自動運転実現に向けて ~.
  • 2019.09.
    研究奨励賞 @ Joint Agent Workshops & Symposium 2019

    中田勇介. 複数環境におけるエキスパート軌跡を用いたミニバッチベイジアン逆強化学習.
  • 2019.09.
    研究奨励賞 @ Joint Agent Workshops & Symposium 2019

    吉田賢央. 深層強化学習による鉄道システムの回生電力活用.
  • 2019.09.
    研究奨励賞 @ Joint Agent Workshops & Symposium 2019

    池永晶子. 部分観測下の多目的逐次意思決定問題における各目的の重み推定.
  • 2019.03.
    (学内)優秀論文賞 @ 卒業研究

    釜谷統哉. ワンウェイ型カーシェアリングサービスの稼働率最大化を実現する動的料金設定法.
  • 2019.03.
    (学内)優秀論文賞 @ 卒業研究

    岸川大航. 深層逆強化学習による自動運転の安心走行実現.
  • 2019.03.
    (学内)奨励賞 @ 修士論文

    本木雄斗. 多主体行動空間における干渉のオンライン検出による学習性能の向上.
  • 2019.03.
    (学内)優秀発表賞 @ 修士論文

    竹木祥太. 多目的強化学習における目的優先度の逐次変化を考慮したパレート方策の網羅的探索.

  • 2018.03.
    (学内)優秀論文賞 @ 卒業研究

    吉田賢央. 鉄道システムにおける回生電力の充放電制御による省エネルギーの実現.
  • 2018.03.
    (学内)奨励賞 @ 卒業研究

    千邑峻明. 非対称情報下におけるシグナリング行動の強化学習モデル.
  • 2018.03.
    (学内)奨励賞 @ 修士論文

    浪越圭一. 群衆の行動ログを用いた行動戦略の推定 ~ 進化計算によるアプローチ ~.

  • 2017.09.
    優秀論文賞 @ Joint Agent Workshops & Symposium 2017

    齋竹良介, 竹木祥太, 荒井幸代. 期待報酬ベクトルの非線形スカラー化による多目的強化学習アルゴリズム.
  • 2017.09.
    優秀ポスター発表賞 @ Joint Agent Workshops & Symposium 2017

    浪越圭一, 荒井幸代. 追従エージェントを考慮した人流データからの戦略抽出.
  • 2017.09.
    優秀ポスター発表賞 @ Joint Agent Workshops & Symposium 2017

    石川翔太, 荒井幸代. 熟練ドライバの運転を学習するための報酬と特徴ベクトルの同時推定法.
  • 2017.09.
    優秀発表賞 @ Joint Agent Workshops & Symposium 2016

    中田勇介, 荒井幸代. 深層学習の中間層の解析に基づくアフォーダンスの設計に有用な特徴の抽出.
  • 2017.03.
    (学内)プレゼンテーション賞 @ 修士論文

    山本悠介. スマートメータネットワークにおける最適電力融通 - 逆強化学習による各需要家の融通インセンティブ推定 -.
  • 2017.03.
    (学内)奨励賞 @ 修士論文

    中田勇介. CNN の解析によるアフォーダンスを誘発する特徴の識別.

  • 2016.03.
    (学内)優秀論文賞 @ 修士論文

    石川翔太. 渋滞緩和・抑制に向けた車車間通信による適応型速度制御モデル.
  • 2016.03.
    (学内)プレゼンテーション賞 @ 修士論文

    樋野葉子. 災害時鉄道復旧過程における運転再開と運転整理の最適化による人災回避.
  • 2016.03.
    (学内)優秀賞 @ 卒業論文

    浪越圭一. 群衆の振舞データに基いた個々の行動規範の抽出 - 災害発生時の避難モデルの生成 -.
  • 2016.03.
    (学内)奨励賞 @ 卒業論文

    吉永和史. 最適行動の学習効率化に向けた報酬と環境認識の相互改善法.
  • 2016.03.
    優秀賞 @ 第16回MAS(Multi Agent System) コンペティション

    樋野葉子. 首都圏主要路線網における災害時鉄道復旧過程の人災回避.

  • 2015.10.
    優秀ポスター発表賞 @ Joint Agent Workshops & Symposium 2015

    浪越圭一, 荒井幸代. 歩行軌跡に基づく歩行者の行動規範の同定.
  • 2015.03.
    (学内)奨励賞 @ 修士論文

    梅沢貴大. 社会システムにおける協調構造の抽出法 - グラフマイニング法に基づく重要な初期配置関係の発見 -.

  • 2014.03.
    (学内)奨励賞 @ 卒業論文

    石川翔太. 混雑時利用者均衡をシステム最適へと促す誘因の定量化法.
  • 2014.03.
    (学内)優秀論文賞 @ 修士論文

    加賀谷駿. デマンドレスポンスによる電力需給バランス.
  • 2014.03.
    (学内)発表賞 @ 修士論文

    野村一平. 世帯間の電力融通問題における個人情報守秘を考慮した制御方式.

  • 2013.03.
    (学内)優秀論文賞 @ 修士論文

    許海遅. マルチエージェント・多目的最適化問題における競合問題の定式化と解法.
  • 2013.03.
    (学内)優秀賞 @ 卒業論文

    大嶋真理絵. マルチエージェントモデルによる混合医療解禁の影響の定量的評価.
  • 2013.03.
    (学内)優秀賞 @ 卒業論文

    洞山智佳. 自転車の交差点事故における視界の影響 - 強化学習モデルによる実験的考察 -.
  • 2013.03.
    (学内)優秀論文賞 @ 修士論文

    許海遅. マルチエージェント・多目的最適化問題における競合問題の定式化と解法.

  • 2012.10
    企業賞 @ Joint Agent Workshops & Symposium 2012

    加賀谷駿, 荒井 幸代. 強化学習エージェントによる地域間電力融通.
  • 2012.06.
    優秀賞 @ 2012年度人工知能学会全国大会(第26回)

    鈴木 香名子, 大喜多 周, 荒井 幸代. 逆強化学習による複数均衡下での均衡収束の実現.

  • 2011.03.
    (学内)奨励賞 @ 卒業論文

    谷直彦. ボーリングデータのパターン分類に基づく任意地点の地盤特性推定.
  • 2011.03.
    (学内)優秀論文賞 @ 修士論文

    角井勇哉. 場の潜在的ニーズの定量化による野球チームの攻撃支援.
  • 2011.03.
    (学内)奨励賞 @ 修士論文

    間渕雄太. 交通流最適化を実現するドライバーのインセンティブ設計 - マルチエージェント系への逆強化学習導入法の提案 - .

  • 2010.06.18
    招待講演 @ 2010年度人工知能学会全国大会(第24回)

    「郷にいれば郷に従えのテーマ設定」
  • 2010.10.
    優秀論文賞 @ Joint Agent Workshops & Symposium 2010

    鈴木 香名子, 荒井 幸代. 社会規範学習における空間ゲームの局所性の影響.
  • 2010.03.
    (学内)優秀論文賞 @ 卒業論文

    内田英明. 情報提供戦略の学習による交通流制御.
  • 2010.03.10
    学生奨励賞 @ 2010年度 情報処理学会創立50周年記念 第72回全国大会

    内田 英明, 荒井幸代. 交通流制御のための情報提供戦略の学習.
  • 2010.02.
    講演 @ 東京工業大学(大岡山)

    文部科学省:理工系女性研究者PM.
  • 2010.01.27
    第4回日仏先端科学シンポジウム @ フランス・ポワチエ

    日仏8分野トップ研究者交流会.

  • 2009.03.
    (学内)奨励賞 @ 卒業論文

    角井勇哉. 打順の要求機能分析と選手の能力分析に基づく最適打順構成法.
  • 2009.03.
    (学内)優秀論文賞 @ 卒業研究

    檜山達矢. ネットワーク構造と意思決定規範が系の挙動に与える影響.

  • 2008.
    ベストティーチャー賞

  • 2008.10.
    優秀論文賞 @ Joint Agent Workshops & Symposium 2008

    増渕達也, 荒井幸代. 渋滞発生過程におけるメタ安定相の特徴の分析.

  • 2007.10.
    優秀論文賞 @ Joint Agent Workshops & Symposium 2007

    石垣圭久, 荒井幸代, 平田廣則 . 情報量によるマルチエージェント系強化学習過程の解析.
  • 2007.03.
    (学内)優秀論文賞 @ 卒業研究

    高橋篤. グラフ構造に基づくコミュニティ抽出手法.

English