2019年11月5日火曜日

棋譜OCRプログラムの軌跡(2)開発環境の準備と処理手順

今回作成したプログラムは、画像解析Windowと電子碁盤Windowのから構成し、C#で作成しました。画像解析Windowで、電子本から取得した画像を解析し、sgf形式の棋譜データを作成しています。

【処理手順】
  電子本の棋譜ページをブラウザで表示(*1)
        ↓
  Snipping Toolで棋譜部分を切り取り入力画像とする(*2)
        ↓
  OpenCvSharpで碁盤の線と黒石・白石の位置を取得
        ↓
  Tesseractで各石の手順番号を取得
        ↓
  入力画像と解析結果を比較し、データ修正(*3)
            ↓
  棋譜データ出力

 (*1) 電子書店パピレスのNHK 囲碁講座 テキスト
 (*2) 拡大ボタンを3回クリックして拡大後切り取る
 (*3) 解析ミス修正・コウの手順追加等を 右側のgridを使って修正
    書籍に記載された棋譜は、最終形を示しているので、コウは手入力で修正必須です。




開発環境
 OS:Windows10
 言語:C#(WPF使用)
 IDE:VisualStudio2019
 仕様Tool:OpenCvSharp v4.0.0.20181129
      Tesseract v3.3.0.0
 使用電子本:電子書店パピレスのNHK 囲碁講座 テキスト

0 件のコメント:

コメントを投稿