The Ultimate Book Scanner!!
本をそのままスキャン出来ます 
大切な書籍を痛めません 非破壊スキャナ

 本を解体せずハイスピードスキャン 1時間当たり1,800ページ

BookDriveについて、当社の視点

 
ブックスキャナの販売と印刷物のデジタル化サービスについて、当社の視点と考えを簡単にまとめてみました。
印刷物のデジタル化に関する 幾つかの視点
 
1)デジタル化と保存
 
デジタル化の結果得られるものは、アナログデータのデジタル変換による複製保存と、再利用(流通性拡張)可能性の付与ではないでしょうか?  たとえば、家屋の建築に際し、紙媒体の図面が施主に渡されていました。 建築事務所での保管は、せいぜい実質10年程度。 早い場合は数年で保管場所の制限から屋根裏保管や運が悪いと破棄されずとも、行方知らず。 保管は自己責任...となります。 木造家屋だけでなく、大規模住宅でも定期的なメンテナンスが施され、長期にわたり図面の管理が必要になります。 酸性紙の影響や、温度・湿度・虫食いなどや、万が一原本が水漏れでくっついてしまったなど、紛失と同様の状態になる可能性は紙である以上避けられません。
 
企業の場合・・・  企業の本質は、Going Concern つまり、永続性にあります。 活動の記録は、企業だけの歴史にとどまらず、大げさに言えば人類の活動の歴史を構成する重要な資料ともなりえます。
日本には、100年企業が世界一多く存在します。世界中が注目する日本の長所を、世界に発信するにも、更に歴史をつなげるためにも、活動記録は丁寧に残しておくべきではないでしょうか?
そうした場合、オリジナル書類あっての、デジタル複製に意義を見出せます。
 
書籍、書類のデジタル化の恩恵は、頒布・バックアップの容易さにメリットを生み出すことにもなりました。 かつて、レコードからCDへ、そして、MP3へ音楽のフォーマットなど急激に変わりました。今では、ダウンロード保存すら飛び越えて、サブスクリプションで音楽を楽しむのが普通に。
書籍も同様に、いくつかのフォーマットの選択肢がありますが、デジタルブック、eBookとして、これまでなかった使い方、効果も発生することにつながりました。 特に、音楽でMP3のもたらした変革は、大方の予想を大きく飛び越え、今となってはビジネスのあり方すら変えてしまいました。
 
しかし、残念ながら デジタルデータの保存は、DVDディスクのような保存メディアと、その再生機の組み合わせで、成立する為、20年前のCD-Romですら、製品の質や保存状態によって再生出来ない状態であることも発生しています。
今の所、どのフォーマットで保存しても、保存メディアが紙媒体ほど長期保存を経験したことがなく、メディアに対応する再生機も含めた保存が、必須となりますが、100年後に利用できる家電が存在することは無いだろうと考えるのが普通です。
つまり、紙の状態で保存することは、それほど悪い選択肢では無い・・・とも考えられます。
一方、デジタル化のメリットは、複製の容易さと、保存の容易さ、物理的な容量などがあげられ、一度デジタル化してしまえば、ハードディスクや記録メディアの大容量化、高速化に対応することは、それほど困難ではありません。 むしろ、デジタルデータを分散して保管することで万が一の対応策も選択肢を広げています。10年前までは、長期保存フォーマットのDVDで保存が現実的でしたが、現在では、クラウドサービスによる、デジタルデータの保存が、安全な方法と言われています。
電子化において重要な事は、保存データは出来るだけ汎用性のある規格化されたフォーマットを選択し、少なくとも10年単位で保管方法を検討する。万が一の、フォーマットの変換に耐えられる準備もしなければなりません。
紙資料、書籍、印刷物のデジタル化は、それを活用・保存する方法も考えた上での技術的な検討があってこそ、有効に利用できる資産となります。元データである紙資料はより安全で、低コストな保管場所で保存し、デジタルデータだけはクラウドでいつでも見れる状態にしておく。 こんな状況が、当たり前の時代になってきました。
 
2)デジタルデータの活用
 
例えば、今までは東京から大阪の専門図書館に出かけて、閲覧許可を申請し、現物を調べる、もしくは許可をとってデジカメや、スマートフォンで撮影する。影が入ってしまったりページが曲がってしまっても、無いよりはマシと数時間かけて撮影する。 同じような目的で、年間10人の研究者が資料を扱うと、日に日に資料は痛み、運が悪いと破損してしまうかもしれません。こういった目的であれば、デジタル化したデータを保管しておけば、交通費の半分以下の利用料を払ったとしても、十分納得できる金額として利用者に受け入れられるのではないでしょうか? 利用者にとっても、資料の所有者にとっても、デジタル化のメリットを活かせます。
 
もっと、壮大な視点でみれば、情報公開は民主主義の基本。あらゆる情報は公開され、特に、行政・立法・裁判の資料は国民の資産として保存、管理、公開される事で、市民と行政の効率化も促される。 と言えなくもないのではないでしょうか。
 
3)デジタル化の本当の目的
 
2010年頃の 自動ページめくり機能がついたスキャナの値段です。
4digitalbooks (仏) 販売価格、約5,000万円(推定)
Kirtas社(米) 販売価格 約2,400万円(推定)
 
本の大量スキャンをすることは、ただ単に「印刷物のデジタル化」ということだけにとどまらず、デジタル化した書類は、OCR(電子テキスト化)にかけることで、更に活用の範囲が広がるデジタル資産と変化する、ダイヤの原石を製造する作業とも言えます。
 
スキャナは、あくまで道具ですし、デジタル化すれば何でも良い、というわけではありません。 OCRを前提にすれば、「文字認識し易い画像」を準備することが重要になります。認識しやすい画像とは、文字がはっきり、くっきり、傾きなく揃っていることが重要です。通常、本を読む時は、本の中心(ノド)に向かってページは強く曲がり影が入ります。 人間の目は優れていて、文字が歪んでいても、影があっても字を認識できます。
最近のOCRは優秀だとは言え、はやり、こういった歪んだページの文字認識は苦手です。
 
最近は、ページの歪みを自動的に補正し、きれいに真っ平らにしてくれるよ。とは言いますが、5枚程度ならそれでも良いでしょう。1冊500ページの本を補正するのも、厄介ですが、5万枚を補正しなければならない・・・ となれば、少々のスペックのパソコンでは手に負えないことは想像できると思いまます。紙面の歪み補正に専用パソコン、更にそれからOCRだと随分と時間とエネルギーを消費することになります。
 
では、はじめからできるだけ無駄を省き、OCRソフトが認識し易いスキャン画像を連続して、そして、大量に準備できれば、後はOCRだけですからパソコンの性能やパソコンの進化の恩恵を受けられるようになります。 職人的な技術者でなくとも、同質のスキャン画像を、長期に渡り、複数の人間が携わっても、同質の結果を得られる環境を整えれば良いことになります。 
「認識しやすい画像」を大量スキャンするには、照明、スキャン位置、角度、方法などを統一し、同じ条件で再現できる環境を実現しなければなりません。これこそが、Atiz BookDrive ブックドライブの提供するポイントであり、最大のメリットでもあります。
 
現在のOCRの精度が仮に、99%だとしても、400字原稿のなかで3,4文字の間違いが許容範囲かどうかは、おそらく、ほとんどの人が受け入れるでしょう。実際には、70%前後の認識率でも検索用途には十分使えますので、将来の高性能高機能AI OCRを見据えつつ、検索用途としてのOCRを活用するなり、JPEG、TIFFやPDFそのままで、インデックスで工夫して簡易検索及び、可読電子データとして利用もできます。
 
4)全自動と手動スキャナ
 
実際のスキャン作業現場がネットなどで公開されていますが、Kirtas社のスキャナを使用している画像を見ても、専門のオペレーターが付き、時にページめくりを手動で補助している様子を発見できますが、これをもって、全自動は大嘘と言うには早合点すぎます。
例えが突飛かも知れませんが、フェラーリが買えてしまう高価な機械を、まったく無人で、ズブの素人が運用するのは現実的にはありえない相談では?と思います。
高性能な機械は、定期的なメンテ、校正、修理・・・そしてなによりも、プロのサポートがないとすぐに粗大ごみとなってしまうのです。 時として、本体価格よりも、メンテ費用の方が多くかかることは、いまや不思議ではありません。
なにより、こうした専用スキャナのメリットは、前述のOCRに適した資料を、同条件で大量に取得するツールとして開発されています。 いわゆる、フラットベッドのスキャナを使い、本を裏返してガラス面に押し当てて、スキャンしては裏返し、ページをめくり、次をスキャン。 よくある風景ですが、いくらガイドに合わせてスキャンしても、ノドの部分には歪みと影が入り、スキャンする人によっては、少しずつ抑える位置がズレてゆき・・・・ そのデータをOCR認識させるには、相当な苦労が予想されます。
 
前フリが長くなりましたが、Atiz社のスキャナは、光学部分の精密機械はKirtas社も利用する日本製カメラを使い、また、交換・アップグレードを容易にすることで長期に渡り、運用できるようにいたしました。 例えるなら、日本車の軽トラック。 安く、便利で、そして壊れずに、長期にわたり役に立つ。 自動車としての性能は高級車と比べることが無意味な上に、内装も簡素で、スピードも、乗り心地もあまりよくないかもしれません。 ただ、主目的がA地点からB地点への移動(アナログからデジタルへ移行)であるならば、荷物もたくさん積めて、確実に目的を達成してくれます。 むしろ、高級スポーツカーよりも、故障がすくなく、燃費もよく、長期にわたり役立つことが期待できます。
 
5)Atizブックスキャナの運用
 
話を本のスキャンに戻しますと、本の状態は年代、サイズ、紙質、保存など・・・様々な要因で、性質が異なります。 理想的には機械に放り込んで、全自動でスキャンが完了となれば文句はありませんが、本を良く知るプロの声は逆のようです。そもそも全自動はなにかあったらオッカナイ、ということです。
実際、K社の製品を使用しても、スキャン条件、サイズなど、また、スキャン前の調整を考慮すれば、1時間あたり1000ページから1500ページと、AtizのBookDriveと遜色ないどころか、BookDriveの方が上回るケースも出てきます。
全自動の意味は、結局、作業員・オペレーターの疲労具合を低減することによる、ミスの予防と言う側面が重要となるのではないでしょうか? なによりも、スキャニングの条件を整え、同じ品質の同じ状態のスキャンデータを、長期に大量に生産することが、全自動の最大のメリットであり、そこにスキャンの本質として評価されているポイントが存在します。
Atiz社のBookDriveは、ページめくり部分を手動にすることで、本のダメージや状態によった最適な対応を施し、全自動製品以上に均質な状態の画像をスキャンすることを可能とした製品です。
 
6)ADFとの比較
 
複合機の一機能として提供されているものも含めると、ADF(オートドキュメントフィーダー)を備えた、ビジネスマシンの各オフィスへの導入は、かなり高い率で進んでおります。 フラットベッドスキャナの得意分野は、1枚1枚に分かれる、紙の四隅、端がしっかりしている状態の印刷物になります。 一方、印刷物でも、製本されているもの、契約書のように、紙縒りや、ホッチキスでの紙綴じ書類は、一枚一枚手作業での紙面の調整が必要になり、作業効率は非常に低いのが特等です。 
本の背表紙をカットして、1枚1枚のページを切り離すことで、ADFでのスキャンも可能ですが、本を復元するには、再度、職人の技が必要となり、稀少本などには適応できません。 また、バラしてしまった本を職人に、再生してもらうなら、新しく購入してしまうほうが経済合理的なことが現実です。
 
ADFでの高速スキャナは、その構造上、ホコリやゴミによる、縦スジの陰や色ムラなど定期的なメンテ・掃除が不可欠であり、フィーダーと呼ばれる、紙の取り込みローラーによる紙詰まり、破損は、誰もが経験しているのではないでしょうか? グシャと音がして、機会の中でグチャグチャに。 更に、両面スキャン、600dpi以上の高精度のスキャンとなると、スピードは極端に低下することも機械によっては起こります。
非破壊スキャナを販売する弊社が言うのも気が引けますが、正直に言えば、ほとんどの書籍はバラバラに分解して、ADF装置で自動でスキャンするほうが早く、安く、品質も安定した電子化を実現できます。 世間に出回る書籍の殆どは、後日必要であれば入手できる可能性のあるものばかりですので、よほどの稀覯本、高額書籍でなければわざわざコスト高の方法を選択する理由は乏しいこともありえます。
 
7)目的に合わせたスキャナの選択を
 
増え続ける書類のデジタル化は、紙の書類・製本・綴じ書類などの種類ごとに、適正なスキャナーを使うことで、効率・品質の高いデジタル化が可能となります。
目的、用途によって、選択肢を見極めることが、大量デジタル化には必要となる視点になります。
弊社では、電子化の目的に合わせた方法、機材の選択、運用までのトータルなサービスを提供しています。



Atiz.JP は、Atiz Innovation,Inc.の製造販売する製品の紹介サイトです。
Atiz社の日本総代理店 安全貿易有限会社が運営しております。

BookDrive 資料

 
LinkIconBookDrivetとその他の比較。当社の視点 revised 2022.11.20
 
 
現行モデル カタログ
BookDrive ProII
BookDrive MKII Lite
BookDrive Mini2
BookDrive N
2022.11.20
 
 
旧モデルカタログ
BookDrivePro カタログ
BookDriveMini カタログ
BookDrive-N カタログ
2010-2011年実施、国会図書館の大規模デジタル化にて採用されたモデルです。
その後、世界中でも採用。

 

  • 商品に対するお問い合わせは下記から
 
 
BookScan 情報、リンク、資料等