findtextCenterNetで公開している機械学習モデルを、
アプリとして使えるようにした bunkoOCRを少し試しているのですが、
https://lithium03.info/product/bunkoOCR.html
認識率もさることながら、GoogleDriveでのOCRで出来なかったルビ無しのOCRがいいですね。😍
※うちのPC(CPU AMD Ryzen 7 PRO 4750GE with Radeon Graphics 3.
10GHz 内臓GPU)
では、本
1冊、bunkoOCRでOCRするのに4時間程度かかりますが…😢
以前から愛用しているiOS用テキスト読み上げアプリ(Voice Dream Reader)で聴くと
GoogleDriveでOCR変換したテキストではルビが邪魔でいつもイラっとしていましたw。😖
そこで、bunkoOCRで生成したルビ無テキストファイル(noruby.txt)を結合。
改行ごとにテキスト読み上げアプリ(Voice Dream Reader)では間があるので改行を削除。
代わりに「。」の後に改行を追加。
UFT-8でOCRされるので書式を崩さないように日本語プログラミング言語「なでしこ」v
1とPowershellの合わせ技で作ってみました。
できたテキストファイルは、フォルダ名+.noruby.txtです。
Powershellもコマンドプロンプトもほとんど知識無しでしたが、
ChatGPT先生に尋ねながら試行錯誤したら意外とできるものですね。
(一度尋ねてそのまま動いたためしがないのでエラーを含めて何度も尋ねるを繰り返しましたw。)
なでしこv
1でプログラムを作るのに便利ですね。ChatGPTもPowershellも。
最近、動画ファイル用のストレージの空き容量がなくなってきたため
3年前に「ffmpeg h265変換」でH.265で変換した動画ファイルを
再度変換してみようと思い試行錯誤してみました。😖
以前試してみたAV
1のコーデック「libaom-av
1」は、
物凄く時間が掛かる代物で実用的ではないと感じてAV
1での変換を諦めていましたが、
「libsvtav
1」を試してみるとこれがlibaom-av
1より、
速いというかむしろH.265のコーデック「libx265」よりもかなり速い。(2.5倍くらいかな…)😄
ということで久しぶりに以前作った「ffmpeg h265変換」を改良してffmpegのフロントエンドを作ってみました。
※libsvtav
1のqp値の詳細について興味のある方は上の外部サイトで記事を確認してみてください。😄
更新履歴
2023年
11月
15日 Ver.3.
1
変換完了後Windowsシャットダウン選択追加、変換中のフォルダ選択ボタンの変更
2023年
11月
15日 Ver.3.0
1
フォルダ選択キャンセルの挙動修正
2023年
11月
13日 Ver.3.0