2013年06月
2013年06月26日
機械学習中
現在序盤評価関数パラメーター81通り中27通りを白に適用して対戦中です。
事前の検討では1時間ほどで答えが出るハズだったのですが。。。
1.5倍は掛かってますね、まあ時間が長くなる様な変更はしているので寝るまではじっくり待つことにします。
寝る前に終了しなかったら、このまま朝まで動かすか中断するか決断します。
ファイルにも出力しているのでその容量が判断材料になると思います。
統合環境で実行を止めて残り対戦数を見てもいいかな。。。。
パラメーター設定は結局シコシコ手入力しました。
もちろん、エクセル上で計算して、置換を使って配列風に成型してからMSC++統合環境にコピペしましたけど。。。
バグ入りかも知れませんが、自動対戦の結果は確認したいです。
±10%のパラメーター変更が結果に影響するのか?ちょっと興味があります。
iPhoneアプリの構造と若干変更した部分もあるので、
この検討パラメーターがそのまま使えるか?なんですけど。。。
パラメーター変更しない状態の対戦結果をテキスト出力しているので、
iPhoneアプリと対戦させて、同じ結果になる様ならパラメーター成果物はアプライと考えています。
ひさしぶりにマックブックプロに火を入れていますか(^^ゞ
アメリカで色々な指標発表されいましたが、ドルの変化は穏やかですね。
これ位落ち着いた相場ならランドを買い進めても良いのですが、
レバレッジ2倍前半までは我慢かな。。。
私の心配No.1は中国シャドーバンキングですね、大事になると世界経済に激震が走るでしょうね。。。
ギリシャでも結構な震度だったのでGDP第2位の国だもんね。。。
中国当局が上手く乗り切ってくれる事を祈るばかりです。
保有している米国債を売るような事態になったら、急激な円高は避けられない。
そのとき買い向かうほど資金があればよいのですが、ストップロスの餌食になる確率の方が遥かに高いな。
近い将来であれば、黒田日銀総裁と安部総理の度量と決断力が試される事になりそうです。
急騰する円を介入で安定させられるか?ドル安を止められるのは円しか無いような気がします。
中国投信は利益確定が正解なんでしょうが、貧乏人投資家は売れないんですよね(涙)
その時が何時来るのか?来ないのか?ドキドキしながら待つしかないですね。
何時まで学習してるんでしょう、このまま明日の朝まで放置だな。
時間計測を仕込んでおけばよかった(反省)。
パラメータ範囲を決めてexeを作り別フォルダーで並列実行出来るのに。。。
明日からまた頑張ります!
追伸:
バグってました。カウンターを途中でリセットしてたみたい。
修正後5回実行で確認OK。
ただ結果は全部同じでした(笑)。。。
81通に設定して一晩回してみます。
さらに追伸:
5回同じなのもバグでした、修正後81通りに挑戦!
2013年06月24日
3,1,30,5 / 3,1,30,5 = 34 / 30
序盤の評価関数初期パラメーター対戦をファイルにも書き出してみました。
出力を確認すると、パス局面も見事に乗り切ってます(^^♪
ここでは、フォント幅が不揃のため最終結果のみコピペします。
color:2 n:64
black:34 white:30
1 2 3 4 5 6 7 8
+----------------+
a |○○●●●●●●|
b |○○○○●○●●|
c |○●○○○●●●|
d |○●●○●●●●|
e |○●●●○○●●|
f |○●●○○○●●|
g |○●●●●●○●|
h |○○○○○○○○|
+----------------+
序盤初期パラメーターは、v1,v2,v3,v4,v5 = 3,1,30,5
同士の対戦結果は、黒4目勝ちです(← これが今日のタイトルです)。
3,1,30,5の±10%のパラメーター全バリエーションをどうやって求めるか?
書き下しても良いけど81通りを間違いなく書ける自信がない。。。
これから寝るまでに解決できると良いのですが。
解決できれば81通りは約3時間、それの81通りだから・・・10日ですか、
それが、序盤・・・中盤・・・終盤と全5組なので50日だけど、
exeを局面毎に準備して5つのcoreで実行できれば良いのですが、
序盤パラメーター決めてから中盤学習なのでパラレル実行は意味無いですね。
しかも今の所パラメーター選択はテキストファイルを見ての手動設定、
これは時間掛かりそう。。。
今日も5万ランド買い足しました、もう懲りない人ねぇ~と聞こえてきますが(^^ゞ
スワップは1700円/日、100万円増資したのでレバレッジは3.26倍です。
それと楽天銀行でエクステ預金(フラット)に預けてみました。
年0.90%は魅力ですが、めんどくさい規約があるみたい。
ほとんど読んで無いので説明御免です。
5年以上使う当ての無い余裕資金向きらしいです。
ダウは180ドルほど下落、ここは我慢ですが、良いか悪いかは???
機械学習結構面倒ですね、マックブックに戻って何時もの手チューニングに戻ろうかと思案中です。
機械学習パラメーター検討
午後に岡崎に戻り夕方までは、ビールを片手にニチレイレディース観戦。
ビールを呑むと自動的に1時間ほどお昼寝タイムとなります。
気持ちの良い日曜の午後を過ごしました。
機械学習用コード確認とデバッグ。
それと並行して学習パラメータを検討始めました。
評価の変化点としては、何手目かと、4つの評価値かなと。。。
それを表にすると。。。
パラメーターを仮に±10%振って黒白対戦させて、黒と白で一番強い評価関数を求める。
と書くと簡単なんですが。。。薄っすらした記憶をたどるとこれは順列組合せですよね。。。
3*3*3*3*3*・・・・つまり、3の20乗=3,486,784,401
34億通り!パラメーターが0のの所もあるので多少少なくなると思いますが単位は億。
手計測ですが1対戦2-3分なので、1億分って。。。
6coreを使っても生きてる内に終わらないですね、しかも±10%振るってのも何の根拠もなし。。。
妥協案としては、30/50/52/54/60を独立として考える事かな。。。
30手目までのパラメータ81通りを試して最強を選んで、50手までの評価次パラメータ・・・
81×5=405通り→いかにも少ないですね。
何だかしょぼい機械学習ですが、まずはこれを試して強くなるかの検証をしてみます。
2013年06月22日
41+48=89
インスタートだったのですが、インで乱れました。
アウトで頑張ったのですが、89でした。
2013年平均値下げにちょっとだけ貢献しましたが、ちょっと不満なスコアでした。
ただ、雨も降らず、それほど暑くもないラウンドで快適にラウンドできました。
お昼休みには、サプライズなプレゼントを頂けました。
休憩後のスコッチキャメロンパター試打まで出来た高密度なゴルフでした。
追伸:
セントアンドリュースゴルフツアー調べてみました。
・交通費込みだと、70~100万円
・現地ツアーであれば40万円~
お金が有れば誰でも回れる様です。
4ラウンドにこお金額。。。宝くじを当てるか日経255が4万円になれば何とか(^^ゞ
帰りにホンダに道草、アコードハイブリッドに試乗しました。
2モーターのハイブリッドシステムに興味があったのですが、
スタイリングと静粛性が気になりました。
2年目のインスパイアからエクストラを払ってまで乗り換えはないですね。。。
帰宅後、オセロコードを手直しして機械学習のパラメーター作成をしています。
変更するパラメーターが多すぎてちょっと困ります。
もっとも、多すぎるから機械学習なんでしょうけど。