リタイアプログラマーのたわごと: 棋譜OCRプログラムの軌跡（6）中間まとめ

前回までで、 NHK 囲碁講座テキスト2018年6月号の第66回NHK杯1回戦第1局の棋譜を電子書店パピレスから入手し、読み取ることに一応成功（！？）しました。その結果を次に示します。

	元の画像	検出結果	誤検出等
第 1 図			誤りなし
第 2 図			誤りなし
第 3 図			( 3, 5) 白116を　115と誤検出 (10,7) 白110を　116と誤検出
第 4 図			( 2,15) 白26 　　　検出不能
第 5 図			(14,13)白50を　1と誤検出 (17,16)黒47を 41と誤検出

誤検出または検出不能となった石の画像を拡大してみると、以下のようになります。

	元の画像	円削除後（Tesseractの入力）	誤検出等
( 3, 5) 白116			115と誤検出
(10,7) 白110			116と誤検出
( 2,15) 白26			検出不能
(14,13)白50			1と誤検出
(17,16)黒47			41と誤検出

この結果では、白石の上２つは、円と文字がくっついていて、うまく円が消去できなかったためと思います。また26と50は、２文字が微妙に離れてはいるもののあまりに近すぎて正しく検出できなかったものと思います。特に最後の白50は、一度検出不能になり、次いで無理やり（？？）一文字モードで検出を試みた結果1になってしまいました。
また黒石は、周囲の白を黒で埋める際、７の上の線が消えてしまい1と誤ってしまいました。

電子本から画像を切り取る際、ブラウザ（MEDUSA）の拡大ボタンで拡大した画像を切り取って、直接使っているのですが　プログラム上で拡大処理を加える　とか　２値化処理の閾値を調整するなど改良の余地がありそうです。

開発環境
　OS：Windows10
　言語：C#(WPF使用)
　IDE：VisualStudio2019
　仕様Tool：OpenCvSharp　v4.0.0.20181129
　　　　　　Tesseract　ｖ3.3.0.0
　使用電子本：電子書店パピレスのNHK 囲碁講座テキスト

リタイアプログラマーのたわごと

2019年11月22日金曜日

棋譜OCRプログラムの軌跡（6）中間まとめ

0 件のコメント:

コメントを投稿