研究リスト

マルコフ決定過程(Markov Decision Processes)

  
 マルコフ集合連鎖(Markov set-chain)
・“Controlled Markov set-chains under average criteria.”(共著, with Hosaka and Kurano), Appl. Math. Comp. Vol. 120(2001), pp. 195-209
・“Controlled Markov Set-Chains with Set-Valued Rewards”(共著, with Kurano,Nakagami), In: Proc. of the Int. Conf. of Nonlinear Analysis and Convex Analysis(NACA98). W. Takahashi and T. Tanaka(eds.),World Scientific, 1999, pp. 205-212.

 制約条件付き停止マルコフ決定過程(Stopped MDPs with constraints):
・“Stopped Semi-Markov Decision Processes with Multiple Constraints”(共著, with Kurano)In: The Proc. of the Third Int. Conf. on Nonlinear Analysis and Convex Analysis (NACA2003), W. Takahashi and T. Tanaka(eds.),Yokohama Pub.., 2004.12, pp 81-96
・“Countable State MDPs with a stopping time constraint.” In: The Proc.of the Second Int. Conf.on Nonlinear Analysis and Convex Analysis(NACA2001), W. Takahashi and T. Tanaka(eds.), Yokohama Pub., 2003.2,pp.107-118.
・“停止マルコフ決定過程における制約条件付き最適化問題”、RIMS講究録1263 「動的システム最適化理論の展開とその応用」pp.83-102. 2002.5.
・“Stopped Markov decision processes with multiple constraints”, Math. Meth. Oper. Res. (2001), Vol. 54, pp. 455-469

・“Markov Decision Processes with a Stopping Time Constraint”, Math. Meth. Oper. Res. (2001), Vol.53, pp. 279-295.

 適応型マルコフ決定過程(Adaptive MDPs, uncertain transition probabilities)、Neuro-Dynamic Programming:
・“A pattern-matrix learning algorithm for adaptive MDPs:The regularly communicatingcase”(共著, with Iki, Yasuda and Kurano)、 RIMS講究録1589「不確実な状況における意思決定の理論と応用」pp110-119,2008.04
・“Temporal Difference-Based Adaptive Policies in Neuro Dynamic Programming.”(共著, with Iki, Yasuda and Kurano). In: Proc. of 4th Int. conf. on Modeling Decisions for Artificial Intelligence (MDAI) 2007 (CD-ROM Proceedings), Vicenç Torra, Yasuo Narukawa, Yuji Yoshida (Eds.), 2007.8, pp.112--122.
・“マルコフ決定過程におけるTD法による学習アルゴリズムについて(A learning algorithm of TD method for Markov decision processes)”(共著, with Yasuda and Kurano)、RIMS講究録1559「最適化問題における確率モデルの展開と応用」pp.34—49. 2007.6.

・“A structured pattern matrix algorithm for multichain Markov decision processes”(共著, with Iki and Kurano) Math. Meth. of Oper. Res.(2007), Vol. 66. pp. 545—555.
・“A learning algorithm for communicating Markov decision processes with unknown transition matrices”(共著, with Iki, Yasuda and Kurano), Bull. Inform. Cybern. (2007), Vol. 39, pp. 11-24
・”A modified pattern matrix algorithm for multichain MDPs”(共著, with Iki)、 RIMS講究録1504「情報決定過程論の展開」pp.73—86. 2006.7.

 
推移法則未知のマルコフ決定過程(Uncertain MDPs)
「不確実性の下でのマルコフ決定過程に対する区間ベイズ手法」実験例 (with Iki,Yasuda,Kurano, プレプリント)

理論の応用(Application)
 品質管理
・“区間ベイズ推定による適応型品質管理”(共著, with Sasaki and Kurano)、RIMS講究録1589「不確実な状況における意思決定の理論と応用」pp.120-129, 2008.04

 ファジィ距離によるクラスタリング
・ダイナミックプログラミングを用いたファジイメトリッククラスタリング(共著, with Iwamura and Horiike) RIMS講究録1630「非加法性の数理と情報:非加法性と凸解析」pp.77-88, 2009.02,
数値例の表





研究集会世話役
RIMS2017