スキャナを買うと、たいていは 不幸にして、OCRソフトが付属していなかったり、その性能に不満な場合は、下記を試してみましょう。 新聞など、薄い紙からOCRする場合は、裏に黒い紙を当ててスキャンすると、裏の文字の透けが邪魔にならず、うまく文字認識できます。 また、OCRソフトで、縦書き、横書きの読み込み指定ができる場合は、明示的に方向を指定したほうが、より正しく認識できます。 私は、スキャンの解像度は、白黒300dpi以上のテキスト読み込みを使っています。ブライトネス(明るさ)は、50〜40程度で調整しています。 白黒化の方法を指定できる場合は、単純2値の、スレッショルド(threshold 閾)法を選択します。ディザモード(誤差拡散法)など、中間調まで取り込む擬似階調画像にすると、文字認識率は、低下してしまいます。 カラー画像からOCRしたい場合は、XnView を使って、「画像」→「モノクロに変換」→「Floyd-Steinberg型(Floyd-Steinberg 誤差拡散法 ディザリング (減色) )」を使うと、OCR 読み取り率が良いようです。 Softi FreeOCR横文字専用の、OCRソフトです。freeocr26.exe例えば、学校の外国語のテキストを、スキャン→OCR→機械翻訳、して予習して行けば、学習効果が上がり、成績もアップするでしょう。 この OCR は、スキャンで、300 DPI のグレースケールを推奨しています。 Softi FreeOCR バージョン2.6では、PDF 文書をそのまま読み込んで、OCR できます。これはすごいです。 "The quick brown fox jumps over a lazy dog" という句は、アルファベットのすべての文字を使っています。
ダウンロード http://softi.co.uk/freeocr.htm http://code.google.com/p/tesseract-ocr/ http://www.brothersoft.com/freeocr-download-59672.html 窓の杜の紹介 http://www.forest.impress.co.jp/article/2007/07/30/softifreeocr.html 日本語のOCRソフトは、「バイリンガル」と銘打っているものでも、英文判読が苦手です。 下の例は、同一のスキャン画像を使って、私が持っている、某有償ソフトと読み取り比較したものです。Softi FreeOCR が優れていることが、分かります。 -Softi .某市販ソフト -Product Specification Information Management System .Product SpecincHon IIubrmHon Managemem System←i,f,nを判読できていない -Confirming Contents of` Design alteration .coInrming Contents ofDesign aIteration←小文字のlと大文字のIを誤認 -Altering Sales Unit Name for.Each Model and Type .Altering sales Unit Name fbnEach ModeI and Type←Sの大文字と小文字を誤認 SmartOCR Lite Editionこのサイトでは、SmartOCRについての、様々な情報を提供しています。http://ocr.rossa.cc/ 窓の杜の紹介 http://www.forest.impress.co.jp/article/2005/11/29/smartocrlite.html http://www.forest.impress.co.jp/article/2006/04/25/smartreading.html 今なら、最終版 SmartOCRLite107.zip (26,947KB)をダウンロードできるので、お急ぎを。 (SmartOCRLite106.zip の方が良い、という記事を見たことがあるので、ブロードバンドなら両方ダウンロードしてみるとか。) http://www.4shared.com/dir/1006463/575b200b/public.html http://www.4shared.com/file/4511298/d62b2347←ダウンロードのリンクが表示されるまで、数十秒待ちます。 上の掲載場所を教えていただいたブログ Tool is Over http://xxxleastxxx.blog28.fc2.com/ http://xxxleastxxx.blog28.fc2.com/index.php?q=SmartOCR 下記に、SmartOCR 1.0 ヘルプもありました。 http://ocr.rossa.cc/ http://ocr.rossa.cc/index.htm 必要な方は、Website Explorer などを使って、ダウンロードしておきましょう。 |
Checking file system on J: The type of the file system is FAT. One of your disks needs to be checked for consistency. You may cancel the disk check, but it is strongly recommended that you continue. Windows will now check the disk. Volume Serial Number is 9349-A63E More than one DCIM entry in folder \. Renamed to DCIM.--0. More than one DCIM entry in folder \. Renamed to DCIM.--0. More than one DCIM entry in folder \. Renamed to DCIM.--1. More than one DCIM entry in folder \. Renamed to DCIM.--1. Windows has made corrections to the file system. 128352256 bytes total disk space. 393216 bytes in 17 folders. 57344000 bytes in 261 files. 70615040 bytes available on disk.
ソフト名 | 累計ダウンロード数 | 使い方など |
KaZaA | 18,200万 | http://www.getjoho.com/info/KaZaA.html http://www.itmedia.co.jp/news/ 0205/21/ne00_benjamin.html クライアントソフト http://www.kazaalite.tk/(オランダのサイト) |
Morpheus | 10,900万 | http://www.getjoho.com/info/Morpheus.html http://www.itmedia.co.jp/news/ 0203/06/e_morpheus_m.html |
iMesh | 4,300万 | http://www.hotwired.co.jp/ news/news/20010215105.html |
Audiogalaxy | 3,100万 | http://www.itmedia.co.jp/ news/0106/15/e_audio.html http://storm.prohosting.com/ you4get/audiogalaxy.htm |
BearShare | 1,800万 | http://www.jnutella.org/review/ bearshare206_review.shtml http://members.jcom.home.ne.jp/ bearshare/ |
LimeWire | 1,500万 | |
Grokster | 600万 | |
WinMX | 500万 | |
Blubster | 300万 | |
Qtraxmax | 200万 |