ラベル Tesseract の投稿を表示しています。 すべての投稿を表示
ラベル Tesseract の投稿を表示しています。 すべての投稿を表示

2020年3月27日金曜日

棋譜OCRプログラムの軌跡(15)第二章 スキャナー取込

第一章では、電子本の棋譜図解読に成功したことを述べました。
しかし、解読できたのは Fix型で作成された、NHK 囲碁講座 テキストに限られ あまりにも狭い範囲 との印象はぬぐえません。

2020年1月4日土曜日

棋譜OCRプログラムの軌跡(14)第一章 電子本解読編 まとめ

当初計画した、電子書店パピレスのNHK 囲碁講座 テキストをはじめとする 電子本に記載された棋譜の解読は、大方初期の目的は果たしたと思います。そこで今回の試行で 分かったこと・課題として残ったことを上げてみます。

2020年1月1日水曜日

棋譜OCRプログラムの軌跡(13)日本棋院e碁BOOOKSでは?

日本棋院が刊行している、電子書籍 『e碁BOOOKS』 には、週刊碁・囲碁未来・囲碁ワールドの3誌があります。週刊碁・囲碁ワールドの2誌は、棋譜再生機能をもっており、今回のプログラムは不要かもしれません。
ただし、予め備わった棋譜再生機能では、棋譜図を取り込んで検討することは出来ません。また全ての棋譜図に再生機能が付いているわけではないので、この2誌についても読み取りテストを試みました。

2019年12月27日金曜日

棋譜OCRプログラムの軌跡(12)他の電子書店では?

ここまで、電子書店パピレスのNHK 囲碁講座テキストを使って、棋譜読み取りをしてきました。専用のプログラムのインストールが不要なことから、パピレスの電子本を使って試行を始めましたが、パピレスでは、図形の拡大が可能で手順番号が十分な精度で取得できたことが、幸いしたようです。
他の電子書店は、どうでしょうか?

2019年12月24日火曜日

棋譜OCRプログラムの軌跡(11)高DPIのPCで小さな画像を扱うと?

前回取り込んだ画像を拡大する処理を組み込みました。この状態で手元の高DPIのPC(hpのENVY)で取り込んだ画像を入力してみました。

その結果は驚くほどの好成績!!

棋譜OCRプログラムの軌跡(10)小さな画像では?

いままで、電子書店パピレスのNHK 囲碁講座 テキストの棋譜を、Webブラウザの拡大ボタンを3回クリックして大きな画像にして、Snipping Toolで切り取っていましたが、もっと小さな画像でも処理できないか、試してみました。

2019年12月14日土曜日

棋譜OCRプログラムの軌跡(9)高DPIのPCでは?

ここまで、Dell Inspiron5759を使って棋譜図読み取りを試みてきましたが、手元に HP ENVY 15 x360があったので、これを使って読み取ってみました。
Inspiron5759は、Windows標準の画面解像度(DPI=96)に対し、ENVYはDPI=120です。その結果は、信じられないほどの認識率!!

2019年12月7日土曜日

棋譜OCRプログラムの軌跡(8)(7)の結果を踏まえた対策

前回の結果を踏まえ、黒石・白石について以下の対策を施しました。
結果は??? 大幅改善です。

2019年12月1日日曜日

棋譜OCRプログラムの軌跡(7)他の対局では?

前回まで、NHK 囲碁講座 テキスト2018年6月号の 第66回NHK杯1回戦 第1局の棋譜図の読み取りを試行しましたが、他の対局も試してみました。その結果は散々!?

2019年11月22日金曜日

棋譜OCRプログラムの軌跡(6)中間まとめ

前回までで、 NHK 囲碁講座 テキスト2018年6月号の 第66回NHK杯1回戦 第1局の棋譜を 電子書店パピレスから入手し、読み取ることに一応 成功(!?)しました。その結果を次に示します。

2019年11月21日木曜日

棋譜OCRプログラムの軌跡(5)特殊文字対策

前回までで、棋譜作成に必要な手順番号の取得ができました。しかし、解説のため描かれている文字・記号が混じっていて、誤認識しています。

2019年11月19日火曜日

棋譜OCRプログラムの軌跡(4-4)手順番号検出(数字一桁対策)

前回までで、一応黒石・白石の手順番号が取得できるようになりました。しかし、今までの方法では、一桁の数字は認識できませんでした。このことは、多くの方が述べておられます。

2019年11月18日月曜日

棋譜OCRプログラムの軌跡(4-3)手順番号検出(白石処理)

前回の処理で、黒石の手順番号が取得できました。今回は白石の手順番号を検出します。切り取った白石の画像を見ると、手順番号が黒い円の中に描かれています。

2019年11月16日土曜日

棋譜OCRプログラムの軌跡(4-2)手順番号検出(黒石処理)

前回の処理で、石の位置と色が取得できました。今回は黒石の手順番号を検出します。切り取った黒石の画像を見ると、黒石の中に手順番号が白で描かれています。

2019年11月13日水曜日

棋譜OCRプログラムの軌跡(4-1)手順番号検出(石の座標および色検出)

前回の処理で、石の座標をピクセル単位で求めることができました。棋譜を作るには、ピクセル単位の石の座標を、縦横1~19に変換し、各石に記述されてい手順番号を読み取ることが必要です。手順番号の取得は、以下の手順で行いました。

2019年11月5日火曜日

棋譜OCRプログラムの軌跡(2)開発環境の準備と処理手順

今回作成したプログラムは、画像解析Windowと電子碁盤Windowのから構成し、C#で作成しました。画像解析Windowで、電子本から取得した画像を解析し、sgf形式の棋譜データを作成しています。

【処理手順】

2019年11月4日月曜日

棋譜OCRプログラムの軌跡(1)仕様概要

かつて、OpenCVに興味を持ち、詰碁の問題をスマホで撮影してデジタル化しようと計画しましたが、自分の腕では精度を高められず、計画は頓挫していました。(ここを参照
画像の歪等に起因していたのではないかと思っています。

なんとかOpenCVを利用したアプリが作れないかと、今回は次のような計画を立てました。