2017年11月25日土曜日

将棋ソフトを超える難しさと、将棋ソフトに追いつく可能性(1)

竜王戦第四局は、無事に羽生棋聖が勝利してくれた。これで3勝。あと1勝で永世竜王となる。

頭のおかしい、漫画のような業績を応援したい気持ちもあるし、昨年に謀略を尽くしたあげく、反省する様子すらない渡辺明が表舞台から降りてくれることを望む気持ちもある。今年については、俄然棋聖を応援したい。

さて、今回は将棋ソフトの話を続けよう。前回は将棋ソフトの発展と、人間の可能性についてで書いた。

私はソフトを軽んじたり、未だにプロ棋士の方が強いだとか言っている人間を見ると呆れかえってしまう。頭悪いんだなーと思ってしまうわけだが、だからといってプロ棋士の成長を軽んずるつもりもない。

プロ棋士を応援したいあまり、実力の違いから目を背ける姿は醜い、と言うだけのことだ。時に、ある手を見てソフトを超えたという主張がされたりもするが、的外れも甚だしいことがある。

だが、昨日の竜王戦第四局では、確かにソフトを上回ったかも知れないと思える一幕があった。今回はそれについて。

ソフトを超えたと言えるのはどんなときか


まず先に、人間がソフトを超えたと言えるのはどんなケースかについて解決しておこう。

将棋番組などを見ていると、評価値が逆転した時にソフトは当てにならないだとか、人間がソフトを超えたなどという人を見かける。これは、もっとも頭の悪い部類の主張だ。

ソフトの推奨手を指さなかったことで評価値が逆転するのは、なんの不思議もない。私が誰かに教わりながら指しているとして、教えてくれている人の言うことと違うことをして逆転された場合、私の対局者が私の助言者を超えたことにでもなるのだろうか?

そんな馬鹿な話はない。それはただ、私が間違っただけでしかない。

同じように、評価値の逆転も、問題はソフトではなくて指し手にある。これは、最終的にソフトと違うことをし続けながら、評価を取り戻し、勝利したとしても事情は変わらない。勝ち筋や負け筋は無数にあるのだから、「ソフトと違うことをしても勝てる」からと言って、ソフトが間違っていることにはならない。

重要なのは、ソフトと違うことをして評価が下がった時ではない。

1,ソフトの言うとおりにしているのに、評価が下がった時
2,ソフトと違うことをしたのに、評価が上がった時

ここに、ソフトを超えるための基準がある。ただしこれは、一手で確認できる現象ではないだろう。ソフトだって間違う。全てを解き明かしたわけではない。しかし反省はする。あとになって、「あ、やっぱりボク間違ってました」と言うことはある。

だが、このような反省を一手で確認するのは難しい。これから解説することも、一手だけで結論が出せるわけではない。

今回はケース2のソフトと違うことをしたのに評価が上がった話をしよう。

88金という不思議な手


昨日の竜王戦第四局で、78手目に△88金と打たれた。変換がめんどくさいのでアラビア数字と漢数字を使い分けないが、ご了承いただきたい。

だが、88金に触れる前に、そのちょっと前から振り返ってみよう。この対局の棋譜はこちらで閲覧できるので、確認しながら見てほしい。

http://live.shogi.or.jp/ryuou/kifu/30/ryuou201711230101.html

63手目に▲77歩を打った。このときの後手番でのPonanzaの評価値が-1000ほど(プラスの評価値は先手有利。マイナスは後手有利)。ここから10手で先手の金がなくなるわけだが、75手目に▲77歩と打ったときのPonanzaの評価はやっぱり-1000程度だった。

ところがこの次に、△66飛とすると、Ponanza-300程度の評価値を示した。つまり、Ponanza66飛が気に入らなかったのだろう。他の手を推奨していたのだろうと思う。それがなんなのかは表示されていなかったので分からないが。

問題はこの次に▲67銀、△88金としたとき、Ponanzaの評価値が-700ほどになった。つまり66飛の段階よりも、88金の段階で後手の有利を認めていることになる。これが、Ponanzaの反省なのか、67銀が疑問手だったのかは分からない。67銀と88金の間では評価値が表示されなかったからだ。

だからPonanzaの評価値だけで88金がソフトを超えたのかどうかを論じることができないので、技巧で調べてみた。前回の記事で書いたとおり、私の技巧は2016年版だ。新しいやつではない。

で、63手目▲77歩から始めて、29手先までの技巧の主張を確認してみた。




0 件のコメント:

コメントを投稿