2019年11月4日月曜日

棋譜OCRプログラムの軌跡(1)仕様概要

かつて、OpenCVに興味を持ち、詰碁の問題をスマホで撮影してデジタル化しようと計画しましたが、自分の腕では精度を高められず、計画は頓挫していました。(ここを参照
画像の歪等に起因していたのではないかと思っています。

なんとかOpenCVを利用したアプリが作れないかと、今回は次のような計画を立てました。

  • 電子本から画像を取得し、画像解析の結果sgf形式の棋譜データを作成する。
    このとき 画像解析は、OpenCvSharpおよびTesseractを用いることにしました。
  • 実験で使う電子本は、以前入手していた 電子書店パピレスのNHK 囲碁講座 テキストとする。
  • 電子本を解析して作成した棋譜データは、電子碁盤で棋譜並べなどで利用可能とする。
  • プログラムはC#でUIはWPFで実装する。ただしコードビハインドゴリゴリでもOK
その結果、下のようなプログラムが作成できました。

・電子本から取り込んだ画像

・画像解析結果 読み取りできなかった石も見受けられます。

・作成したsgfを入力した電子碁盤

画像認識・文字認識は全くの素人のため、試行錯誤の軌跡を次回以降記述したいと思っています。



開発環境
 OS:Windows10
 言語:C#(WPF使用)
 IDE:VisualStudio2019
 仕様Tool:OpenCvSharp v4.0.0.20181129
      Tesseract v3.3.0.0
 使用電子本:電子書店パピレスのNHK 囲碁講座 テキスト


      

0 件のコメント:

コメントを投稿