リタイアプログラマーのたわごと: 棋譜OCRプログラムの軌跡（14）第一章　電子本解読編　まとめ

当初計画した、電子書店パピレスのNHK 囲碁講座テキストをはじめとする　電子本に記載された棋譜の解読は、大方初期の目的は果たしたと思います。そこで今回の試行で　分かったこと・課題として残ったことを上げてみます。

分かったこと

１）今回作成したプログラムは、当然ながら NHK 囲碁講座テキスト用にチューニングされていて、試しに取り上げた日本棋院刊行物に対しては、さらにチューニングが必要なこと。

２）Tesseractで手順番号を取得するには、マス目の大きさでいくと少なくとも30px 最適なのは40pxだったこと。

３）２）の条件を満たすために、画像の拡大をおこなっても　元の画像の大きさが20px以下では、全く実用性がないこと。

４）取り組み始めたころは、電子本というか EPUBについて全く知りませんでした（苦笑）が、元画像を２）に示すように大きくするには、Fix型でないと無理。
電子書店により、Fix型・リフロー型が決まるため、Fix型を採用している電子書店を選ぶ必要があること。
課題として残ったこと

１）NHK 囲碁講座テキストでは、検討のため白△・黒▲の記号を使っていて、これを処理対象外としようとOpenCvのパターンマッチングを用いたが、当然のことながら画像の大きさが変わると、全く機能しない。

２）１の１）に述べたように、書籍の発行元ごとにチューニングすることは、手間がかかりすぎ、非現実的。

今回は、以前かじったOpenCVと新たに見つけたTesseractでなんとかかんとか動かした・・レベルで課題が残っています。課題を解決するには　今旬のAI的手法を取り入れる必要があるのかもしれません。

自分にはハードル高そう・・・ボケ防止ではすまないような（苦笑）　
これにて第一章終わり　続きは　果たして？？？？

開発環境
　OS：Windows10
　言語：C#(WPF使用)
　IDE：VisualStudio2019
　仕様Tool：OpenCvSharp　v4.0.0.20181129
　　　　　　Tesseract　ｖ3.3.0.0
　

リタイアプログラマーのたわごと

2020年1月4日土曜日

棋譜OCRプログラムの軌跡（14）第一章　電子本解読編　まとめ

0 件のコメント:

コメントを投稿

2020年1月4日土曜日

棋譜OCRプログラムの軌跡（14）第一章 電子本解読編 まとめ

0 件のコメント:

コメントを投稿

棋譜OCRプログラムの軌跡（14）第一章　電子本解読編　まとめ