【AIの答え】将棋で歴代最強は羽生善治

将棋にはその時代ごとに最強と呼ばれるプレイヤーがいました。

その中でも歴代最強は誰かとの問いに名前が挙がるのは、羽生善治、大山康晴、中原誠、初代大橋宗桂、六代大橋宗英、天野宗歩あたりでしょう。

しかし時代が違えば彼らが直接対局することはできませんし、例えば羽生善治氏と大山康晴氏のように同じ時代にいたとしてもピークがずれている場合には強さの比較は難しいです。

この難しい比較を一定の条件の元に可能にしたのがAIです。

そして比較の結果、AIは歴代棋士では羽生善治氏が最強であるとの結論を出したのです。



こちらの記事もオススメです

AIが出した歴代棋士の強さランキング

山下宏氏の論文「将棋名人のレーティングと棋譜分析」より2013年のGPS Fishを用いた換算Rの順に表を作成しました。

レート算出のために用いられた棋譜は、その棋士の最高の状態でのレートを求める目的という意味で、タイトル戦での棋譜のみが採用されています。

注:論文内でデータがある棋士のみ。女性では清水市代女流のみ。

レート 棋士名 称号など
3347 羽生善治 永世七冠王資格者
3214 渡辺明 永世竜王資格者
3151 森内俊之 十八世名人資格者
3139 谷川浩司 十七世名人資格者
3046 中原誠 永世五冠王
2998 加藤一二三
2979 大山康晴 永世五冠王
2979 木村義雄 十四世名人
2894 升田幸三 実力制第二代名人
2839 天野宗歩
2731 六代大橋宗英
2724 塚田正夫 実力制第四代名人
2687 初代大橋宗桂 一世名人
2592 清水市代 クイーン名人
2590 初代伊藤宗看 三世名人
2576 本因坊算砂
2548 坂田三吉
2488 八代伊藤宗印 十一世名人
2399 大橋柳雪
2343 関根金次郎 十三世名人

参考:3820 GPS Fish Xeon

上記の通りの結果となり、羽生善治氏がトップ、特に永世名人の中では断トツとなっています。

全盛期の羽生善治氏VS大山康晴氏の対局が実現したとした場合、レート差が300あるので羽生氏が8.5対1.5ぐらいの勝率になると予想されます。

レーティングの計算方法に関してはこちらの記事で解説しています。

関連ページ:世界一や日本一は誰?チェスのレーティングとランキング

ちなみに年代が進めば進むほど、研究が進み将棋全体が発展しているため、全体の実力が底上げされています。

そのため過去と現代の棋士を比較した場合に、現代の棋士の方が強い傾向があるのは当然の結果です。

また参考結果ですが、藤井聡太氏がデビューから29連勝した棋譜を同じ手法で解析した結果はレーティング3305となり、羽生善治氏に匹敵する強さとなっています。

藤井聡太氏が論文内に登場しないのは、これが2014年の論文だからです(当時はまだ奨励会員)。

AIが強さを測るのに用いた手法

「平均悪手」という指標がレートと密接な関係にあることを用いて、対局中の平均悪手を求め、そこからレートを計算しています。

対局の勝敗自体は関係ありません。

元々はチェスで行われた研究にヒントを得て、将棋でも同じようにして換算レートを求めたというのがこの研究です。

チェスの歴代世界チャンピオンの換算レートの記事はこちら↓。

関連ページ:【AI解析】歴代最強のチェスチャンピオン上位5人【カールセンは何位?】

平均悪手

ここではGPSFishが最善とした手と違う手を指して、最善手を指した場合より評価値が下の場合を悪手と定義します。

例えばGPSFishの最善手が+10、実際に指した手が+5の評価値の場合は悪手と判断されます。

そして平均悪手は以下の式で表されます。

B:平均悪手

S:悪手の評価値差分の絶対値の合計

M:手数

B = S / M

ただし以下の条件の元で平均悪手を求めています。

  • 40手目以降の手のみ考慮(定跡を除外するため)
  • 評価値は歩を0.89と評価する値を用いる(詰みのある状況で325.98とする)
  • 評価値の変動が10未満の手のみ考慮(形作りの悪手と、詰み発生時の急変動を除外)
  • 探索深さは11

ここで求められた平均悪手BとレーティングRが大きな関連性を持つ点に注目して、各棋士のレーティングを求めます。

平均悪手とレートの関連性

引用:将棋名人のレーティングと棋譜分析より引用

図13に見られるように、平均悪手Bとレーティングの間には強い相関関係があることが分かります。

プロットした点の一次関数式を最小二乗法で求めると-3148y + 4620となり、yに平均悪手の値を入れれば棋士のレーティングを求めることができるわけです。

ただし図13はBonanzaの出した値で、GPS Fishの場合は-2560y + 4743です。

これだとGPS Fishの方が大きな値が出そうな気がしますが、GPS Fishの方がBonanzaよりも強いソフトなため悪手判定が多く出ることと、評価値差分も大きくなるため、結果的にyに入る平均悪手の数値が大きくなって算出されるレーティングはBonanzaと同じぐらいに落ち着きます。

ちなみに悪手を全く指さない将棋の神様がいたとするとレーティングはBonanza判断だと4620、GPS判断だと4743になることがこれらの式から読み取れます。

関連ページ:チェス・将棋のランキング記事一覧