2020年1月4日土曜日

棋譜OCRプログラムの軌跡(14)第一章 電子本解読編 まとめ

当初計画した、電子書店パピレスのNHK 囲碁講座 テキストをはじめとする 電子本に記載された棋譜の解読は、大方初期の目的は果たしたと思います。そこで今回の試行で 分かったこと・課題として残ったことを上げてみます。


  1. 分かったこと

    1) 今回作成したプログラムは、当然ながら NHK 囲碁講座 テキスト用にチューニングされていて、試しに取り上げた日本棋院刊行物に対しては、さらに チューニングが必要なこと。

    2)Tesseractで手順番号を取得するには、マス目の大きさでいくと 少なくとも30px 最適なのは40pxだったこと。

    3)2)の条件を満たすために、画像の拡大をおこなっても 元の画像の大きさが20px以下では、全く実用性がないこと。

    4)取り組み始めたころは、電子本というか EPUBについて全く知りませんでした(苦笑)が、元画像を2)に示すように大きくするには、Fix型でないと無理。
    電子書店により、Fix型・リフロー型が決まるため、Fix型を採用している電子書店を選ぶ必要があること。

  2. 課題として残ったこと

    1)NHK 囲碁講座 テキストでは、検討のため白△・黒▲の記号を使っていて、これを処理対象外としようとOpenCvのパターンマッチングを用いたが、当然のことながら 画像の大きさが変わると、全く機能しない。

    2)1の1)に述べたように、書籍の発行元ごとにチューニングすることは、手間がかかりすぎ、非現実的。


今回は、以前かじったOpenCVと 新たに見つけたTesseractでなんとかかんとか動かした・・レベルで課題が残っています。課題を解決するには 今旬のAI的手法を取り入れる必要があるのかもしれません。

自分にはハードル高そう・・・ボケ防止ではすまないような(苦笑) 
これにて第一章終わり 続きは 果たして????




開発環境
 OS:Windows10
 言語:C#(WPF使用)
 IDE:VisualStudio2019
 仕様Tool:OpenCvSharp v4.0.0.20181129
      Tesseract v3.3.0.0
 

0 件のコメント:

コメントを投稿