第一章では、電子本の棋譜図解読に成功したことを述べました。
しかし、解読できたのは Fix型で作成された、NHK 囲碁講座 テキストに限られ あまりにも狭い範囲 との印象はぬぐえません。
2020年3月27日金曜日
2020年1月4日土曜日
棋譜OCRプログラムの軌跡(14)第一章 電子本解読編 まとめ
カテゴリ
OpenCvSharp,
Tesseract
当初計画した、電子書店パピレスのNHK 囲碁講座 テキストをはじめとする 電子本に記載された棋譜の解読は、大方初期の目的は果たしたと思います。そこで今回の試行で 分かったこと・課題として残ったことを上げてみます。
2020年1月1日水曜日
棋譜OCRプログラムの軌跡(13)日本棋院e碁BOOOKSでは?
カテゴリ
OpenCvSharp,
Tesseract
日本棋院が刊行している、電子書籍 『e碁BOOOKS』 には、週刊碁・囲碁未来・囲碁ワールドの3誌があります。週刊碁・囲碁ワールドの2誌は、棋譜再生機能をもっており、今回のプログラムは不要かもしれません。
ただし、予め備わった棋譜再生機能では、棋譜図を取り込んで検討することは出来ません。また全ての棋譜図に再生機能が付いているわけではないので、この2誌についても読み取りテストを試みました。
ただし、予め備わった棋譜再生機能では、棋譜図を取り込んで検討することは出来ません。また全ての棋譜図に再生機能が付いているわけではないので、この2誌についても読み取りテストを試みました。
2019年12月27日金曜日
棋譜OCRプログラムの軌跡(12)他の電子書店では?
カテゴリ
OpenCvSharp,
Tesseract
ここまで、電子書店パピレスのNHK 囲碁講座テキストを使って、棋譜読み取りをしてきました。専用のプログラムのインストールが不要なことから、パピレスの電子本を使って試行を始めましたが、パピレスでは、図形の拡大が可能で手順番号が十分な精度で取得できたことが、幸いしたようです。
他の電子書店は、どうでしょうか?
他の電子書店は、どうでしょうか?
2019年12月24日火曜日
棋譜OCRプログラムの軌跡(10)小さな画像では?
カテゴリ
OpenCvSharp,
Tesseract
いままで、電子書店パピレスのNHK 囲碁講座 テキストの棋譜を、Webブラウザの拡大ボタンを3回クリックして大きな画像にして、Snipping Toolで切り取っていましたが、もっと小さな画像でも処理できないか、試してみました。
2019年12月14日土曜日
棋譜OCRプログラムの軌跡(9)高DPIのPCでは?
カテゴリ
OpenCvSharp,
Tesseract
ここまで、Dell Inspiron5759を使って棋譜図読み取りを試みてきましたが、手元に HP ENVY 15 x360があったので、これを使って読み取ってみました。
Inspiron5759は、Windows標準の画面解像度(DPI=96)に対し、ENVYはDPI=120です。その結果は、信じられないほどの認識率!!
Inspiron5759は、Windows標準の画面解像度(DPI=96)に対し、ENVYはDPI=120です。その結果は、信じられないほどの認識率!!
2019年12月7日土曜日
2019年12月1日日曜日
棋譜OCRプログラムの軌跡(7)他の対局では?
カテゴリ
OpenCvSharp,
Tesseract
前回まで、NHK 囲碁講座 テキスト2018年6月号の 第66回NHK杯1回戦 第1局の棋譜図の読み取りを試行しましたが、他の対局も試してみました。その結果は散々!?
2019年11月22日金曜日
2019年11月21日木曜日
棋譜OCRプログラムの軌跡(5)特殊文字対策
カテゴリ
OpenCvSharp,
Tesseract
前回までで、棋譜作成に必要な手順番号の取得ができました。しかし、解説のため描かれている文字・記号が混じっていて、誤認識しています。
2019年11月19日火曜日
棋譜OCRプログラムの軌跡(4-4)手順番号検出(数字一桁対策)
カテゴリ
OpenCvSharp,
Tesseract
前回までで、一応黒石・白石の手順番号が取得できるようになりました。しかし、今までの方法では、一桁の数字は認識できませんでした。このことは、多くの方が述べておられます。
2019年11月18日月曜日
2019年11月16日土曜日
2019年11月13日水曜日
棋譜OCRプログラムの軌跡(4-1)手順番号検出(石の座標および色検出)
カテゴリ
OpenCvSharp,
Tesseract
前回の処理で、石の座標をピクセル単位で求めることができました。棋譜を作るには、ピクセル単位の石の座標を、縦横1~19に変換し、各石に記述されてい手順番号を読み取ることが必要です。手順番号の取得は、以下の手順で行いました。
2019年11月5日火曜日
棋譜OCRプログラムの軌跡(2)開発環境の準備と処理手順
カテゴリ
OpenCvSharp,
Tesseract
今回作成したプログラムは、画像解析Windowと電子碁盤Windowのから構成し、C#で作成しました。画像解析Windowで、電子本から取得した画像を解析し、sgf形式の棋譜データを作成しています。
【処理手順】
【処理手順】
2019年11月4日月曜日
棋譜OCRプログラムの軌跡(1)仕様概要
カテゴリ
OpenCvSharp,
Tesseract
かつて、OpenCVに興味を持ち、詰碁の問題をスマホで撮影してデジタル化しようと計画しましたが、自分の腕では精度を高められず、計画は頓挫していました。(ここを参照)
画像の歪等に起因していたのではないかと思っています。
なんとかOpenCVを利用したアプリが作れないかと、今回は次のような計画を立てました。
画像の歪等に起因していたのではないかと思っています。
なんとかOpenCVを利用したアプリが作れないかと、今回は次のような計画を立てました。

