こんばんは。
事務所スタッフの矢沢です。
本日も本人(菅原)は県庁職員の方とのヒアリングが続いております。
そして自分は質問の資料整理。
この数年の間、とっておいた資料が相当溜まってしまったので、それを整理して使用できるよう、この度電子書籍化…いわゆる自炊始めました。
資料の枚数はざっと5000枚以上…データ化するにしても事務所のbrother複合機では到底無理…検討の結果、両面スキャン&ADF(自動紙送り機能)が付いている会派控室のスキャナをお借りする事に。
資料の量が膨大な為、容量&時間短縮に白黒2階調の200dpiのPDF形式でスキャン開始。。。。。
最終的に簡易検索したいので、同時進行でOCR(光学文字認識)処理。。。。。。。。。
相当な時間がかかり、何とかテキストが選択できるPDF(透明テキスト付PDF)に変換。
画質を落としたのと、日本語認識が弱いOCRソフトを使用した為、結構な文字化けがありましたが、簡易検索ぐらいなら問題無さそう♪
今回初めての自炊で、
スキャン時の画質や保存形式、OCRソフト等いくつか改良点はありそうですが、なんとか資料を電子化出来て一安心。。なにより、これまで眠っていた資料が復活した感じがとても嬉しいです(^^)