まさおまっさお

思ったことを書き残す所だよ

     

3時間で目が覚めた

最近休日の朝は結構早く起きてしまうことが多い。
でもさすがに、3時間しか寝られていないと圧倒的寝不足感がある。

とはいえ目覚めてしまったのだから仕方なく、とりあえず布団から出て最近マイブームが落ち着きつつあるからだ巡茶を飲んだ後、この土日にやろうと思っていたことについて考え出した。

この前Tesseractを使ってIIDXのリザルト画面の画像から数字検出しようとしたけど失敗した(実用に足るほど精度が出なかった)ので、精度を上げる方法について考えたい。
具体的には、LSTMのFine Tuningを使って配布されているモデルに再学習を行わせて、実用化できる程度の認識率を出せないか試してみたい。
Tesseract 4.1にLSTMを使って日本語を再学習させる - Qiita

あとはこの記事でもあるように、オプションを調整することで認識率を改善できないか考える。
Python, Tesseractでゲーム画面から情報を読み取る

スマホカメラで撮影した画像だと難易度が高いけど、ライン撮りしたACの動画であればpx単位でどこが数値表示の範囲なのか指定できるので、条件を絞った上での認識ならチャンスはある気がする。

せっかく早起きしたので色々調べてみよう。