2017年11月26日日曜日

将棋ソフトを超える難しさと、将棋ソフトに追いつく可能性(2)

今年の竜王戦第四局で羽生棋聖が見せた88金という手が、ソフトを超えていたと言えるのかどうか。それについて考えてみる記事、第2回。

前回の記事は将棋ソフトを超える難しさと、将棋ソフトに追いつく可能性(1)にあるので、先にそちらを読んでみてほしい。

77歩から▲57玉までの技巧の評価


77歩から▲57玉までの2016年版技巧は次のように評価している。ただしこれは、最小思考時間一分での評価だ。検討開始から一分後に表示されている物ではなく、検討開始から一分を経過して、最初に更新された手を記録した。

よって、ものによっては5分くらい考えたものもあるし、11秒程度で表示されたものもある。そのあたりの条件設定が適切かどうかは深く考えていない。

7736 ○(Pona -1000)
同歩成 -3 ○
同桂 -36 ○
76-54 ○
65-5 ○
77-128 (技巧66)
同金寄 -300(技巧同金上)
同歩成 -256 ○
同金 -121 ○(pona -1000)
76-27 ○
同金 -223 ○
同飛 -120 ○
77-174 ○(Pona-1151)
66-196 ○(pona -300)
67-137 (技巧67)
88100 (技巧79)(pona -700) ←問題の一手
68137 ○
650 ○(pona -800)
34-440 ○
66-130 ○
56-390 ○
36-343 ○(Pona -2200)
38-1515(技巧18)
34-1559 ○
65-1576 ○
48-1669 ○
44-1686 ○
43-1660 ○
48-1718 ○
同桂 -1884 ○
57-2350(技巧61飛)

指し手の次の数字は、その手を指したあとの技巧の評価値。その右の○印は、技巧の予想手と一致していたかどうか。○なら一致していたし、一致していなければそこで技巧が何を予想していたかを書いた。また、その局面でPonanzaが評価値を出していたならば、それもメモした。

意外と互角だった


上記を見て貰えば分かるとおり、技巧は63手目の局面を互角と見ていた。Ponanza1000ものポイント差を付けているのに、だ。

技巧の方が評価値を大きく動かす癖があるように思っていたが、どうやらそうとは限らないらしい。結局、Ponanzaレベルなら勝負を付けられる状況だが、技巧では無理と言うことなのだろう。

さて、Ponanzaの評価値の動きは途切れ途切れにしか表示されないので追いきれないが、技巧の評価はこのように流れとして確認できる。

これを見る限り、やはり技巧も△88金はいい手と認識していない。237点ほどではあるが、先手のポイントと見ている。ただし、この手は重要なため、14分まで考えさせてみた。すると-85という評価値を付けたので、よくよく考えればまだ後手がいいと言いたいらしい。

だが、それでもこの手が勝着だとは言っていない。ところが、その後の展開を見ると、技巧の推奨手通りに先手が指しているにもかかわらず、3手後には-440まで評価を広げている。

将棋ソフトの評価値は、ソフトの推奨手通りに指していれば大きく変化しないというのが通説だ。とはいえ、ある局面での読み筋ではそういう評価をしていたが、実際に指されてみると違う手順を推奨することはある。

私が確認しているのは一手前の局面での次の指し手なので、もっと前に技巧が何を予想していたかまでは記録していない。その意味で、ある程度評価値が動くのは仕方がないところだろう。が、これはそれで許される範囲を超えているように思われる。

将棋ソフト同士の対戦では評価が300開いたら逆転は難しいとも言われる。実際にはそうとも限らず、お互いが自分が勝勢だと主張することもあるにはある。が、それでも500の変化は相当に大きい。勝ち負けが動くくらいに大きい。

さらに言えば、▲38飛はそれほど問題ではない。まるで技巧は▲18飛ならばまだ戦えたとでも言いたそうだが、△34銀以降、先手は本譜と同じように応じ、結局は▲48飛に合流してしまう。そのため、▲18飛に△34銀で評価が-1500程度を示すようになる。

どうやら△36桂のあと、飛車が逃げても△34銀があることを読んでいないらしい。どうも▲18飛に△75飛を読んでいる。どうして△34銀が技巧の盲点になってしまっているのかは分からない。

というわけで、おそらくは△88金から連なる一連の手順は、技巧でも指された時点では読み切れないような名手であったと考えられる。

一致率(笑)


さて、上述のおよそ30手ほどにおける、技巧の指し手との一致率が高いことは、ぱっと見で分かるだろう。

先手は16手中12手が一致。一致率75%
後手は15手中13手が一致。一致率86.666%

しかも、後手が一致させなかった一手はどうやら技巧を上回っていたらしい。こう見ると、このレベルの手順をいつも実現させられるなら、羽生棋聖は2016年版技巧に勝てる可能性は十分にあることになる。

それでもまだ実際に対等の条件で対局したら技巧が勝つだろうとは思っている。あくまでも今回の調査では、技巧は一分程度しか考えていない。持ち時間が十分にあれば、やはり88金の意味も理解できた可能性はある。

そもそもそれ以前に、もっと有利な局面を作り出しているだろう。

が、私が思ったよりも人間の成長は早いのかも知れない。50歳近い人間がこのペースで成長できるなら、若い棋士ならばもっと早く習得するだろう。将棋ソフトのトップに勝つ日は来なくとも、型遅れのソフトにくらいは勝てたりするかも知れない。

それすら無理だろうと思っていたが、名人を倒したPonanzaくらいには勝ってくれる日を期待してもよさそうだろうか。




0 件のコメント:

コメントを投稿