2008-09-05から1日間の記事一覧

強化学習

3目並べについての強化学習(Q学習)の例。 http://plaza.harmonix.ne.jp/~fakira/turedure/Q-Learning.zip 更新は e-greedy。Q学習が先手で後手は以下のルールのAI。 自分のリーチならそこに置いて勝つ。 上記以外で、相手のリーチならそこに置いて邪魔をする…