第一章では、電子本の棋譜図解読に成功したことを述べました。
しかし、解読できたのは Fix型で作成された、NHK 囲碁講座 テキストに限られ あまりにも狭い範囲 との印象はぬぐえません。
リタイアプログラマーのたわごと
2020年3月27日金曜日
2020年1月4日土曜日
棋譜OCRプログラムの軌跡(14)第一章 電子本解読編 まとめ
カテゴリ
OpenCvSharp,
Tesseract
当初計画した、電子書店パピレスのNHK 囲碁講座 テキストをはじめとする 電子本に記載された棋譜の解読は、大方初期の目的は果たしたと思います。そこで今回の試行で 分かったこと・課題として残ったことを上げてみます。
2020年1月1日水曜日
棋譜OCRプログラムの軌跡(13)日本棋院e碁BOOOKSでは?
カテゴリ
OpenCvSharp,
Tesseract
日本棋院が刊行している、電子書籍 『e碁BOOOKS』 には、週刊碁・囲碁未来・囲碁ワールドの3誌があります。週刊碁・囲碁ワールドの2誌は、棋譜再生機能をもっており、今回のプログラムは不要かもしれません。
ただし、予め備わった棋譜再生機能では、棋譜図を取り込んで検討することは出来ません。また全ての棋譜図に再生機能が付いているわけではないので、この2誌についても読み取りテストを試みました。
ただし、予め備わった棋譜再生機能では、棋譜図を取り込んで検討することは出来ません。また全ての棋譜図に再生機能が付いているわけではないので、この2誌についても読み取りテストを試みました。
2019年12月27日金曜日
棋譜OCRプログラムの軌跡(12)他の電子書店では?
カテゴリ
OpenCvSharp,
Tesseract
ここまで、電子書店パピレスのNHK 囲碁講座テキストを使って、棋譜読み取りをしてきました。専用のプログラムのインストールが不要なことから、パピレスの電子本を使って試行を始めましたが、パピレスでは、図形の拡大が可能で手順番号が十分な精度で取得できたことが、幸いしたようです。
他の電子書店は、どうでしょうか?
他の電子書店は、どうでしょうか?
2019年12月24日火曜日
棋譜OCRプログラムの軌跡(10)小さな画像では?
カテゴリ
OpenCvSharp,
Tesseract
いままで、電子書店パピレスのNHK 囲碁講座 テキストの棋譜を、Webブラウザの拡大ボタンを3回クリックして大きな画像にして、Snipping Toolで切り取っていましたが、もっと小さな画像でも処理できないか、試してみました。
2019年12月14日土曜日
棋譜OCRプログラムの軌跡(9)高DPIのPCでは?
カテゴリ
OpenCvSharp,
Tesseract
ここまで、Dell Inspiron5759を使って棋譜図読み取りを試みてきましたが、手元に HP ENVY 15 x360があったので、これを使って読み取ってみました。
Inspiron5759は、Windows標準の画面解像度(DPI=96)に対し、ENVYはDPI=120です。その結果は、信じられないほどの認識率!!
Inspiron5759は、Windows標準の画面解像度(DPI=96)に対し、ENVYはDPI=120です。その結果は、信じられないほどの認識率!!