雑記  トップページ
ばっくなんばあ

2012/05/20(日)

1日自炊
 今日1日は自宅で籠り、同人誌を自炊。手元にある新しいのから処理して行って、大物だった2011年・2010年分の4回分を処理完了(PDF化・JPEG化いずれも完了)。残りも細々とあってコミケ1回分くらいはありそうだが、大半はPDF化完了し、JPEG化のため積んでおく。非常に古い2001年とか2003年とかの奴とか仕分けした時に漏れていた奴とかが手付かずで残っているが、平日の1時間程度の軽作業で終わる量だな。今週中には同人誌は完パケするだろう。そろそろ、真剣に古紙をどうするか考えねば。
 やはりScanSnapに比べると、トレイに置ける原稿の量が3倍くらい違うし、パッチコードシートで自動的に1冊1ファイルにしてくれるので、DRで流している間、他の作業を集中して出来て、非常にラク。個別ファイルを自動的に作ってくれた後、エクスプローラからファイルをリネームするのと、一度ScanSnap OrganizerからAcrobatでファイルを開いて作業するのとでは、作業効率が全然違いますな。まあ、ラクと言ってもScanSnapでの作業に比べればなので、全体的には地道な作業ではあるんですがね・・・。
 JPEGでの取り込みスピードは実に速く、同人誌の山が見る見る消えていく感じ。PDFだと色々処理をしている関係で、そこまでのスピードはないし、1回PDFでスキャンしていて糊が取れてなくて重送する奴はその時点で糊を外しているので全く重送しない。重送すると作業が中断してしまうので大幅にスピードダウンになってしまうがそれがない。PDFでもこのくらいのスピードならなあとは思うが、このくらいのスピードでないとPDF化してその上JPEG化というのはハードルが高い。
 DRの不満点は、斜行が目立つこと。斜行を修正するオプションもあるんだけど、効きが微妙で、その上時々とんでもない誤スキャン(原稿をざっくりとカットしてしまうとか)を招くので、特に写真や絵が多い同人誌は機能をオフにしている。そんなわけでPDFはガタガタだが、まあJPEGも取っているので、よほど気になるのであればJPEGから修正ツールで修正しようと思っている。
 同人誌みたいな薄い本は、結構慎重にチェックしないと糊が付いていることが多くて、重送になってしまうが、パッチコードシートを挟んだ後だとこのチェックがちょい手間がかかる。裁断する時にもっと注意深くチェックしないとダメか。
 コミケ1回分は、もし開催別の仕分けの作業が要らず、今のDR-6010CとPK-513LN-Aのタッグでパッチコードシートを使えば、PDFとJPEG化両方合わせても、4〜5時間程度で済んでしまうと思う。うまくやれば休日の半日だけの作業で済むのではないか。ScanSnapだとコミケ1回分で丸一日を覚悟する作業だったので(しかもScanSnapではJPEGを取る余裕はなかった)、かなり省力化効果が見込める。
 2010年・2011年でのPDF数は約300(容量1.46GB、DRのPDFは高圧縮にしており、ScanSnapより少ない容量で済んでいる)、JPEGはファイル数が12,000(容量約8GB)ってところ。二重に取っているので容量はムダに食っているんだけど、コミケの本の場所の取り方とアクセス・ハンドリングの向上を考えれば、この程度の容量は全然リーズナブルと判断。

2012/05/18(金)

早朝自炊
 早朝ライドしようと思ったが4時半に起きられず、5時半に起床。早朝ライドには時間が足りず中途半端に時間が余り、自炊を少し実施。B5同人誌(とごくわずかにあるA4同人誌)をDRで流してJPEG化。2011年冬は終わったので、次は2011年夏分に取り組む。2011年夏分の裁断とパッチコードシートの挟み込みも済ませた。
 同人誌はA5にせよB5にせよ文庫や新書といった書籍より面積の大きい用紙が相手であり、PDFとJPEGの2回スキャンする関係で、パッチコードシートを挟む作業とか、PDFスキャン後パッチコードシートを外してJPEG用に積んでおく作業とかの作業が発生し、その分作業場所が手狭になっており、スキャン中に裁断とかの作業ができなくなっている。作業レイアウトを考えないと・・・。

2012/05/17(木)

同人誌スキャン
 帰宅後、B5サイズの2011年冬コミの同人誌をPDF化。
 パッチシートを挟む手間はあるけど、1個1個PCでファイル名を付けて保存するよりラクな感じがする。速くはないと思うけど、負担感はそんなにない。PC作業と手でやるリアル作業とのバランスがいいのだろうか。実際、ScanSnapでは同人誌の自炊は平日夜にやろうなんて全く思えなかった作業だけど、DRでパッチコードを使うならまあやろうかという気になる。とはいえ70冊くらいリネームすると集中力が途切れるのが自覚でき、B5版のPDF化とリネームが終わったところで終了。JPEG化は明日以降にする。
 あと、Windows7のエクスプローラでは特大アイコンというのがあり、サムネイルがかなり大きくなり書名くらいならこのサムネイルを見るだけで確認できるので、リネームはエクスプローラでファイルを特大アイコンで一覧表示してリネームすれば済み、1個1個ファイルを開く必要がないのも作業の手間的には影響が大きい。
 集中して効率的にやれば、1日で2年分くらいの同人誌を一気に処理できそうな感じがする。

2012/05/16(水)

試す
 JPEGで画像微回転(eTilTiran)・余白削除(ChainLP)後、zipに書き出してみて、iPadに転送して見てみた。
 iPadで見る感じでは、加工後のデータは元のJPEGとはぱっと見ではそれほど差は感じないが、拡大するとノイズが増えてS/N比が悪化している印象で、やはり品質に影響はあるようだ。まあでも、この程度の劣化なら大きな問題はないと思われ、取りあえず同人誌は「PDFで個別ファイル/JPEGで通番」方式で行く。本当は新しいiPadの高解像度液晶でチェックしたほうがいいとは思うんだけど、iPadに限らずタブレットはIGZO液晶搭載品の登場待ちなので今は買えないわ・・・(低消費電力とあとタッチパネルの精度が劇的に改善するという話なので)。コミックもTIFFでなくJPEGで良いような気はするが、これはもうちょっと考える。
 iPadでは、これまでPDFビュワーとしてしかGoodReaderを使ってなかったけど、ZIP解凍機能もJPEG閲覧機能もあって手間いらずだった。ChainLPでzipに書き出そうとしたら別途DLLが必要とかちょっと手間だったのと対照的。あと、そもそも使っているPC用のモニタがちゃんとしたものならiPadに転送してクオリティ確認なんて手間はかけないで済む筈で、何も考えずにTN方式のPC用液晶モニタを買ってしまったのはつくづく失敗だったと思う。
 フリーソフトを入れたりサンプルをスキャンして使い方を試したりで、検証に時間がかかってしまった。そろそろ同人誌のスキャンに本格的に着手しよう。基本的にDRで流してリネームするだけなので、さほどバタバタせずに作業出来るとは思う。B5サイズのパッチシートを25枚ほど準備。

2012/05/15(火)

同人誌スキャン
 TIFF確認。PNGと違って速度はJPEGと変わらず実用上問題なし。ただ、容量が大きく、無圧縮では2011年冬のA5版のみで15.5GB。A5版より大きな版がこの3倍くらいあるので、ざっくりコミケ1回分60GBということに。年120GBか。TB時代とはいえ、さすがにちょっと占拠容量がでかすぎる。
 TIFFのLZW圧縮を試す。ちょっと時間がなくてサンプルから計測して試算してみたら、2011年冬のA5版で3.5GBほど。1回分15GB程度、年30GB程度。まあ許容範囲か。LZWなら可逆圧縮らしいのでクオリティにも問題はないはず。
 ただ、実際に作ってみると、JPEGの容量の少なさ(1GB未満)も魅力的ではある。一度、余白処理や斜め補正を実施した後のクオリティをiPadで確認し、許容出来るようならJPEGでもイイかと思いつつあり。コピー誌とかも多いコミケのはそんなに画質に神経質にならないでもという気がしないでもないこともあり。
 コミックはTIFF/PDFでやろうかと思うのだが、一気に流せる同人誌ならともかく普通の書籍を2回スキャンするのは大変なので、JPEGで取ってPDFにはそのJPEGからまとめることにしようかと。こうするとDRによるOCRが効かないけど、コミックスならまあOCRはそんなに要らんしね。あと、カバーはどうもDRではどうやっても取れないみたいで、ScanSnapとの併用が必要になりそう。

2012/05/14(月)

同人誌スキャン
 同人誌JPEG読み取り確認。画像品位を最高の100に上げると、薄い16ページくらいのA5同人誌1冊が40MB強。コミケ1回150冊あるとして、コミケ1回分6GBか・・・。まあHDDはTBクラスの時代なので、半年に6GB程度ずつ・12GB/年というペースで増えたところで大した影響はないか。2,500冊分以上あるNASのPDFがちょうど100GB分くらいで、現用の1TBのNAS(RAID1)にはまだ余裕がある。
 PNG読み取り確認。上と同じ原稿で容量は50MBほどで問題はないが、読み込みが途方もなく遅く、試算したらコミケ1回分にスキャン時間だけで300時間以上かかると出た。さすがにやってられないので、TIFFを試すかそれでダメならJPEGにする。
 ホームベーカリーのパンづくりのために導入したデジタルスケールで同人誌の重さを測って試算。2kgちょっとくらいまでしか測れないけど、誤差1g未満なので正確。2011年冬(直近)のコミケのは8.3kgだった。紙の束8.3kgって相当なもんだよ。薄いコピー誌は1冊60gくらい。
 同人誌はパッチでPDF保存を1回かけて自動的に1冊1ファイルで保存(その後マニュアルでファイル名修正)、その後原稿をもう1回スキャンにかけ、JPEG(品質は70くらいで)かTIFFで連続取り込みすることにする。JPEG/TIFFのはファイルを分割しない。PDFだけでもいいといえばいいんだけど、やや斜行が目立つことがあり、バックアップとしてTIFFかJPEGで取っておこうかと。
 これでコミケ1回のA5サイズの本を一括して取り込んでみた。パッチシートを入れたり出したりするのと、ファイルリネームがやや手間だが、ほぼ思った通りのことができそう。JPEGで取り込んで後でPDFにしてもいいかなと思ったが、やはり読み取り時にOCRが済んでいるのは魅力で、どうせ流すだけなので。B5サイズ用のパッチシートも作らねば・・・。

2012/05/13(日)

自炊
 実家の文庫本が早く片付いたので、夜は同人誌を仕分け。とりあえず、開催別・大きさ別に分けた。2005年以前とかいう異様に古いものもいくつかあるが、これは再販モノだろうな。
 PDFで取るか、JPEGで取ってZIPでまとめるかちょっと悩み中。DRにはマルチストリームという機能があって、一度に2つの設定の読み取りができる(例えば高解像度カラーと低解像度白黒とか)のだけど、ファイル形式は同じにしなくてはならないので、PDFとJPEGを同時に取ることは出来ない。
 JPEGのは保存用として割りきって、開催コミケ・大きさで一緒くたにしてしまって本毎に分けることはせず、PDFは例のパッチコードシートを付けて自動的に本毎にファイルを分ける、つまり2回スキャンするというのはどうだろうとか考えている。いずれにせよほぼ「流す」だけなので、こまねずみのように忙しかった新書・文庫の取り込みよりはラクができるかと思っているが、甘いか?
 あと、マンガはJPEGで取ったほうが良さそうではあるので、そのお試しという感じもあるかな。同人誌が終わったらコミックに取り掛かろうと思っているので。

2012/05/09(水)

自炊
 DRが動かせない夜遅くに同人誌をちょっとずつ整理はじめる。コミケ毎・サイズ毎に分ける予定。が、ここ3回分くらいと思っていたが、2006年とか結構古いのもある。再版とか在庫を買ったのもあるけど、どうもScanSnapでの自炊から漏れていたものもそこそこあるようだ。意外とサイズ毎に分ける作業が面倒かも。ただまあ、ScanSnapでもサイズ毎に揃えたほうが裁断の関係から効率はいいので、どのみち必要な作業ではあるし、取りあえずは下記で考えた通りの「サイズ毎で一気に読み取る方式」を試みてみるが。
 やっぱりコミケ終わって直ぐにスキャンした方が開催回毎に仕分けする余計な作業がない分良かったなあとちょっと後悔。次からはちゃんとやろう。
 表でも書いたが横送りでも天地逆にならない設定ができたので、これで同人誌も斜行を抑えた横送りが出来るようになる。ありがたい。

2012/05/08(火)

自炊
 今実家本の最後の文庫を進めているが、実家本の自炊が終わったら、次は同人誌に着手しようかと思う。表で書いている「パンフ類」とはこれのことだ(^^;)。3回分・ダンボール3つ分くらいある。
 ScanSnapでは1冊ずつ裁断・1冊ずつ読み込み→Acrobat編集・保存と1冊1冊ちまちまとやってて、まあこの方法でも1日みっちりやればコミケ1回分くらいは終えられるんだけど、せっかく新兵器DRを投入したので何かもうちょっと効率的な方法がないか検討。
 DRにはコードを印刷した紙を挟んでおけば、自動的にそのコードの紙を区切りにしてスキャンしたファイルを保存するという機能(パッチコードシート機能)というのがあり、これを使えばいいんではないかと。
 つまり、サイズを揃えた同人誌を一気に裁断し(DRで一度に読める分くらい=200枚くらい?)、1冊1冊にこのコードを印刷した紙を挟んでおき、そのセットを一気にスキャン実施。スキャンの間、前のセットのファイルのリネームや次のセットを準備。スキャン終了後、次のセットをスキャン開始。というやり方にした方が、バッチコードシートを準備したり挟んだりする手間はかかるけど、1個1個スキャンしながらファイルを開きリネームして保存してというのを繰り返すよりは、作業の連続性も維持できるし煩雑でなくていいんではないかと、頭の中でシミュレーションした上では良さそうに思え、早速試してみた。
 A5サイズの同人誌数冊を裁断し、バーコードみたいなパッチコードを印刷してA5サイズに切りそろえたのを、1冊1冊の区切りに挟んでおき、スキャンを実施。何回か試行して、縦送りなら問題なくパッチコードを境に1冊1ファイルとして自動的に保存されることを確認した。
 保存場所やファイル名は、通常のスキャンでも保存場所を指定したり自動的に連番を点ける機能はある。ファイル名については、以前から発行コミケ年・夏冬と、タイトルをファイル名にしているので、例えば「2011夏_○○○○.pdf」といったルールでファイルを作っていた。パッチコードスキャンでも、この「2011夏_」の部分までは自動で入れられることを確認。後は連番になっているので、これは後で手で修正する必要があるけど、横送りだとやはり1個1個PDFを開いて偶数ページだけを天地逆にしないといけないようだ。何でハードウェアで裏面だけ天地逆に読み取る設定がないのか理解に苦しむが・・・(IPRの関係かもしれない)。
 文庫などの読み取りに比べるとスキャンスピードが遅く、何らかの設定変更が必要かも知れない。ただ、あまり速くても、次のセットを用意する時間がないかもしれないので、そこまでの速さはこだわらない。縦送りで試した感じではやや斜行が目立つ感じもあり。文字自動認識で縦横を検知して補正する機能もあるんだけど、これは文字が少ないとまともに機能しないので、用紙の縦横を文字の方向で判別する機能はOFFにした方が良く、これを頼りに横送りは無理っぽく、横送りの場合は後で偶数ページだけを回転させるとかの処理が必要になるだろう。横送りにした場合に、個別のPDFファイルを開いて、偶数ページだけ回転して、名前をつけて保存というのがどのくらい時間がかかるか計測して、スキャン中に間に合うようなら、横送りにした方が良いかも知れない。多少の画質の荒れはまだ良いが、斜行は気になるので。
 それにしてもさすが業務用というべきか、ScanSnapでは考えもつかないような、何というかプロ向きというかいかにも業務的な機能が搭載されているよなー。一時はスキャンスピードが期待以下だったため失敗したと思い、ヤフオクか何かで売ってKVを買い直そうかとすら思ったんだけど、徐々に元は取れそうな気がしてきた。




トップページ