2019年11月22日金曜日

棋譜OCRプログラムの軌跡(6)中間まとめ

前回までで、 NHK 囲碁講座 テキスト2018年6月号の 第66回NHK杯1回戦 第1局の棋譜を 電子書店パピレスから入手し、読み取ることに一応 成功(!?)しました。その結果を次に示します。

元の画像検出結果誤検出等

1
誤りなし

2
誤りなし

3
( 3, 5) 白116を
 115と誤検出

(10,7) 白110を
 116と誤検出

4
( 2,15) 白26
   検出不能

5
(14,13)白50を
 1と誤検出
(17,16)黒47を
41と誤検出

誤検出または検出不能となった石の画像を拡大してみると、以下のようになります。
元の画像円削除後
(Tesseractの入力)
誤検出等
( 3, 5) 白116
115と誤検出
(10,7) 白110
116と誤検出
( 2,15) 白26
検出不能
(14,13)白50
1と誤検出
(17,16)黒47
41と誤検出

この結果では、白石の上2つは、円と文字がくっついていて、うまく円が消去できなかったためと思います。また26と50は、2文字が微妙に離れてはいるものの あまりに近すぎて正しく検出できなかったものと思います。特に最後の白50は、一度検出不能になり、次いで無理やり(??)一文字モードで検出を試みた結果1になってしまいました。
また黒石は、周囲の白を黒で埋める際、7の上の線が消えてしまい1と誤ってしまいました。

電子本から画像を切り取る際、ブラウザ(MEDUSA)の 拡大ボタンで拡大した画像を切り取って、直接使っているのですが プログラム上で拡大処理を加える とか 2値化処理の閾値を調整するなど改良の余地がありそうです。


開発環境
 OS:Windows10
 言語:C#(WPF使用)
 IDE:VisualStudio2019
 仕様Tool:OpenCvSharp v4.0.0.20181129
      Tesseract v3.3.0.0
 使用電子本:電子書店パピレスのNHK 囲碁講座 テキスト

0 件のコメント:

コメントを投稿