- 分かったこと
1) 今回作成したプログラムは、当然ながら NHK 囲碁講座 テキスト用にチューニングされていて、試しに取り上げた日本棋院刊行物に対しては、さらに チューニングが必要なこと。
2)Tesseractで手順番号を取得するには、マス目の大きさでいくと 少なくとも30px 最適なのは40pxだったこと。
3)2)の条件を満たすために、画像の拡大をおこなっても 元の画像の大きさが20px以下では、全く実用性がないこと。
4)取り組み始めたころは、電子本というか EPUBについて全く知りませんでした(苦笑)が、元画像を2)に示すように大きくするには、Fix型でないと無理。
電子書店により、Fix型・リフロー型が決まるため、Fix型を採用している電子書店を選ぶ必要があること。 - 課題として残ったこと
1)NHK 囲碁講座 テキストでは、検討のため白△・黒▲の記号を使っていて、これを処理対象外としようとOpenCvのパターンマッチングを用いたが、当然のことながら 画像の大きさが変わると、全く機能しない。
2)1の1)に述べたように、書籍の発行元ごとにチューニングすることは、手間がかかりすぎ、非現実的。
今回は、以前かじったOpenCVと 新たに見つけたTesseractでなんとかかんとか動かした・・レベルで課題が残っています。課題を解決するには 今旬のAI的手法を取り入れる必要があるのかもしれません。
自分にはハードル高そう・・・ボケ防止ではすまないような(苦笑)
これにて第一章終わり 続きは 果たして????
開発環境
OS:Windows10
言語:C#(WPF使用)
IDE:VisualStudio2019
仕様Tool:OpenCvSharp v4.0.0.20181129
Tesseract v3.3.0.0
OS:Windows10
言語:C#(WPF使用)
IDE:VisualStudio2019
仕様Tool:OpenCvSharp v4.0.0.20181129
Tesseract v3.3.0.0
0 件のコメント:
コメントを投稿