Publication List

 updated 7/9/2001

雑誌

国内

·         鮫島 和行,片桐 憲一,銅谷 賢治,川人 光男: モジュール競合による運動パターンのシンボル化と見まね学習, 電子情報通信学会誌,D-II, 印刷中.

·         鮫島 和行, 片桐 憲一, 銅谷 賢治, 川人 光男: 複数予測モデルを用いた強化学習による非線形制御, 電子情報通信学会誌, D-II, 印刷中.

·         鮫島 和行, 銅谷 賢治, 川人 光男: 強化学習MOSAIC:予測性によるシンボル化と見まね学習, 日本ロボット学会誌, Vol.19, No.5, pp.551-556, 2001.

·         銅谷 賢治, 森本 , 鮫島 和行: 強化学習と最適制御, システム/制御/情報, Vol.45, No.4 pp.186-196,2001.

·         鮫島 和行,大森 隆司: 強化学習における適応的状態空間構成法、日本神経回路学会誌, Vol.6, No.3, p.144--154, 1999.

 

国際

·         Samejima, K., Doya, K. and Kawato, M., Intra-module credit assignment in multiple model-based reinforcement learning, Neural Networks (submitted)

 

·         Samejima, K. and Omori, T.,: Adaptive internal state space construction method for reinforcement learning., Neural Networks, Vol. 12, 1143-1155, 1999.

 

学会発表

国内

·         鮫島 和行, 銅谷 賢治, 川人 光男: モジュール強化学習におけるモジュール間の責任割り付け, 日本神経回路学会,11回全国大会9,奈良, 2001

·         鮫島 和行, 銅谷 賢治, 川人 光男: 複数モデルベース強化学習におけるモジュール間の評価割り付け, 電子情報通信学会,NC研究会6月香川, 信学技法NC-00, p.51-58, 2000.

·         鮫島 和行, 銅谷 賢治, 川人 光男: 局所線形モデルに基づく状態分割を用いた階層強化学習, 電子情報通信学会, NC研究会3月, 東京, 信学技法NC-00, p.173-180, 2000.

·         鮫島 和行, 大森 隆司: 強化学習における適応的状態空間構成法 -ロボットデータベースによる検討-, 16回日本ロボット学会,学術講演会予稿集, p.417-418, 1998

·         鮫島 和行, 大森 隆司: 強化学習における分割による自律的状態空間構成法, 日本神経回路学会, 第8回全国大会予稿集, p.73-74, 1997.

·         鮫島 和行, 大森 隆司: --長期記憶形成モデルにおける海馬周辺領野のDynamicsについて, 電子情報通信学会NC研究会(12), 信学技法NC-96, p.95-102, 1996.

·         鮫島 和行, 大森 隆司: 皮質-海馬記憶転移モデルと神経回路の周波数特性, 第8回生体生理シンポジウム, p359-364, 1993.

·         鮫島 和行, 大森 隆司: 皮質-海馬記憶モデルでの長期記憶の形成について, 日本神経回路学会全国大会p.35-36,1993.

国際

·         Samejima, K., Doya, K. and Kawato, M., Intra-module credit assignment in multiple model-based  reinforcement learning, NIPS*2001 ( submitted )

·         Samejima, K. and Omori, T., Adaptive state space formation method for reinforcement learning, Proc. of the Fifth International Conference on Neural Information Processing (ICONIP'98), pp.251-255, 1998.

·         Samejima, K., Ueda, Y., Kimura, M., Doya, K., Schweighofer, Information coding of the striatal neurons during sequential movement, Annual meeting of Society for Neuroscience, Abstract part I, No 254.4, p.681, 2000.

 

Technical Report

 

·         Doya, K., Samejima, K., Katagiri, K. and Kawato, M.: Multiple model-based reinforcement learning, KDB Technical Report, KDB-TR-08, 2000.