2019年12月1日日曜日

棋譜OCRプログラムの軌跡(7)他の対局では?

前回まで、NHK 囲碁講座 テキスト2018年6月号の 第66回NHK杯1回戦 第1局の棋譜図の読み取りを試行しましたが、他の対局も試してみました。その結果は散々!?

1
図1図2
エラーなしエラーなし
図3図4
(3,5)白116を115
(10,7)白110を116
(2,15)白26認識不能
図5
(14,13)白50を1
(17,16)黒47を41

2
図1図2
(11,3)白30を36
(11,4)Cを誤認識
(12,4)白32認識不能
(13,2)黒27を21
(16,9)白16認識不能
(5,2)白60を66
(5,3)白62認識不能
(11,8)黒47を4
(12,6)黒53認識不能
(12,9)黒45認識不能
図3図4
(3,8)黒95認識不能
(3,11)黒93認識不能
(4,12)黒97を9
(5,11)白96を98
(5,12)黒99認識不能
(7,5)黒83認識不能
(16,18)白70を3
(17,12)黒△を誤検出
(6,7)白12認識不能
(6,14)白20を2
(9,15)白32を39
(9,17)白36認識不能
図5図6
(4,17)黒59認識不能
(5,17)黒57を51
(5,19)黒67を61
(6,15)黒55認識不能
(7,17)黒47を41
(7,18)黒45を5
(11,5)白70を79
(11,17)白52認識不能
(12,16)白40を46
(14,18)Cを誤検出
(2,2)黒75認識不能
(2,5)黒93認識不能
(2,6)黒95認識不能
(2,7)黒105を10
(3,5)黒103を102
(4,5)黒107を10
(8,3)黒77を71
(13,11)白92認識不能

3
図1図2
(13,3)白42認識不能
(15,11)白26を5
(15,16)白30認識不能
(18,13)白20認識不能
(2,4)白72認識不能
(3,18)白100を10
(4,7)白70を7 3
       間に空白
(6,17)白92認識不能
(8,7)白60認識不能
(8,17)白104認識不能
(9,8)白86を55
(9,10)白64認識不能
(11,5)黒63認識不能
図3図4
(2,5)黒27を271
(2,9)黒35を3
(2,10)白34認識不能
(2,11)黒29を2
(2,18)黒15を6
(3,10)黒33認識不能
(3,11)白30認識不能
(8,3)黒17認識不能
エラーなし
図5図6
(5,10)白18認識不能
(9,11)白4認識不能
(1,15)黒65を55
(6,13)白52認識不能
(7,7)白78を3
(10,19)白72を3

4
図1図2
(6,3)白30を3 3
     間に空白
(8,3)黒17認識不能
(11,2)白26認識不能
(11,3)白20認識不能
(12,1)白38を33
(12,3)黒15
(3,10)白44認識不能
(4,2)黒63認識不能
(4,5)黒65認識不能
(4,10)黒43認識不能
(5,12)黒67を61
図3図4
(7,17)白72を3
(11,10)白96認識不能
(4,15)黒13認識不能
図5
エラーなし

エラー箇所だけを表にすると

マス目の大きさ 輪郭上の石 誤認識等
1 1 29.0555 28.9422



エラーなし
2 29.0277 29.0000


エラーなし
3 28.9722 29.0000

( 3, 5)白116を115 (10,7)白110を116
4 29.0277 29.0000

( 2,15)白26認識不能

5 28.9722 29.0000

(14,13)白50を1

2 1 30.9444 30.9166



(11,3)白30を36 (11,4)Cを誤検出 (12,4)白32認識不能
(13,2)黒27を21 (16,9)白16認識不能
2 30.9444 30.9166



(5,3)白60を66 (5,4)白62認識不能 (11,8)黒47を4
(12,6)黒53認識不能 (12,9)黒45認識不能
3 30.9444 30.9166



(3,8)黒95認識不能 (3,11)黒93認識不能 (4,12)黒97を9
(5,11)白96を98 (5,12)黒99認識不能 (7,5)黒83認識不能
(16,18)白70を3 (17,12)黒△を誤検出
4 30.9444 30.9166



(6,7)白12認識不能 (6,14)白20を2 (9,15)白32を39
(9,17)白36認識不能

5 30.9444 30.9166


(4,17)黒59認識不能 (5,17)黒57を51 (5,19)黒67を61
(6,15)黒55認識不能 (7,17)黒47を41 (7,18)黒45を5
(11,5)白70を79 (11,17)白52認識不能 (12,16)白40を46
(14,18)Cを誤検出

6 30.9444 31.0000
(2,2)黒75認識不能 (2,5)黒93認識不能 (2,6)黒95認識不能
(2,7)黒105を10 (3,5)黒103を102 (4,5)黒107を10
(8,3)黒77を71 (13,11)白92認識不能
3 1 30.9444 30.8611


(13,3)白42認識不能 (15,11)白26を5 (15,16)白30認識不能
(18,13)白20認識不能

2 30.9444 30.9166


(2,4)白72認識不能 (3,18)白100を10 (4,7)白70を7 3(間に空白
(6,17)白92認識不能 (8,7)白60認識不能 (8,17)白104認識不能
(9,8)白86を55 (9,10)白64認識不能 (11,5)黒63認識不能
3 30.9444 30.9166

(2,5)黒27を271 (2,9)黒35を3 (2,10)白34認識不能
(2,11)黒29を2 (2,18)黒15を6 (3,10)黒33認識不能
(3,11)白30認識不能 (8,3)黒17認識不能
4 30.9444 31.0000 エラーなし
5 30.8888 30.7777 (5,10)白18認識不能 (9,11)白4認識不能
6 30.8888 30.7777 (1,15)黒65を55 (6,13)白52認識不能 (7,7)白78を3
(10,19)白72を3

4 1 30.7500 30.7222


(6,3)白30を3 3(間に空白 (8,3)黒17認識不能 (11,2)白26認識不能
(11,3)白20認識不能 (12,1)白38を33 (12,3)黒15認識不能
2 30.7777 30.6666

(3,10)白44認識不能 (4,2)黒63認識不能 (4,5)黒65認識不能
(4,10)黒43認識不能 (5,12)黒67を61
3 30.7500 30.7777

(7,17)白72を3 (11,10)白96認識不能
4 30.7777 30.6666

(4,15)黒13認識不能

5 30.7222 30.7777
エラーなし

           
1桁の数字に誤認識

数字2桁で認識不能の場合、無理やり1桁で読み込もうとした結果とみられる。

黒石の1の位の7を1に または 全体が認識不能

周りの白い部分を黒く染める際、文字の白とくっついていて、誤って7の横線が消えてしまった結果と思う。

石以外を石と誤認識

Dおよび白△は、パターンマッチングで対象外としているが、さらに対象外とすべきと思われるが、実装の必要があるか疑問。

2桁の数字の間に空白 くっつき対策の弊害と思われる。

第一局 170手中  4手エラー
第二局 209手中40手エラー
第三局 182手中27手エラー
第四局 165手中14手エラー
合計  726手中95手エラー 誤認識率は13%(コウの手数は反映されていません)

この結果を基に、さらに認識率を高める可能性を探りたいと思います。

追)マス目の大きさが、第1局とそれ以外では 1ピクセル違っています。つまり上下左右が18ピクセルぐらい小さくなっていますが その原因はわかりません。




開発環境
 OS:Windows10
 言語:C#(WPF使用)
 IDE:VisualStudio2019
 仕様Tool:OpenCvSharp v4.0.0.20181129
      Tesseract v3.3.0.0
 使用電子本:電子書店パピレスのNHK 囲碁講座 テキスト

0 件のコメント:

コメントを投稿