Сжатие конспектов — различия между версиями
(→Просмотр и печать) |
(→Просмотр и печать) |
||
Строка 84: | Строка 84: | ||
Перед печатью следует включить только передний план. Если в таком режиме конспект читабелен, видны рисунки (т.е. при кодировании они не были отнесены к фону) - можно подавать на печать. Иначе, лучше произвести печать вместе с фоном. | Перед печатью следует включить только передний план. Если в таком режиме конспект читабелен, видны рисунки (т.е. при кодировании они не были отнесены к фону) - можно подавать на печать. Иначе, лучше произвести печать вместе с фоном. | ||
+ | |||
+ | == Пример == | ||
+ | |||
+ | [http://sun.mmcs.rsu.ru/~alexey/misc/djvu_process/raw_example.jpg Исходник] (2.27 MiB | 2324 KiB) | ||
+ | |||
+ | [http://sun.mmcs.rsu.ru/~alexey/misc/djvu_process/ready_example.tif Обработанный исходник] (5.11 МiB) | ||
+ | |||
+ | [http://sun.mmcs.rsu.ru/~alexey/misc/djvu_process/djvu_example.djvu Результат (DjVu)] (0.05 MiB | 51.6 KiB) | ||
+ | |||
+ | Коэффициент сжатия: 2324 KiB / 51.6 KiB = 45 | ||
== Ссылки == | == Ссылки == |
Версия 15:43, 21 декабря 2008
Содержание
Введение
Статья посвящена эффективному сжатию цифровых копий конспектов, полученных с помощью фотокамеры (в первую очередь) или сканера.
Пара слов о получении фотографий
При съемке конспекта нужно быть аккуратным: следить за фокусом и стараться, чтобы разворот в каждом кадре занимал одно и то же место. Последнее крайне важно при автоматизированной обрезке — соотношение сторон тетради и фотокадра разное, поэтому неизбежны поля, кторые следует обрезать в целях сокращения объема данных. Так же важно установить максимально возможное качество для фото: разрешение и сжатие jpeg. Это важное правило актуально не только в нашем случае: исходники всегда должны иметь хороший запас качества.
Подготовка материалов к сжатию
Итак, основная задача: подготовить фотографии конспекта к последующему сжатию в формат DjVu. Подготовка заключается в преобразовании изображений таким бразом, чтобы djvu-кодировщик мог правильно выделить передний план (текст) и задний план (фон). Текст должен быть черным, контрастным. Фон - значительно бледнее. Такое преобразование позволит добиться впечатляющего сжатия без потери читабельности, а в некоторых случаях даже облагородит материал (например, возможна дальнейшая распечатка без фона "в клеточку").
Windows
Средства: IrfanView.
Небезызвестный бесплатный просмотрщик умеет проводить пакетную модификацию изображений, изменяя нужные нам параметры.
Какие это параметры:
- цветность - необходимо преобразование в оттенки серого (grayscale)
- яркость (brightness)
- контрастность (contrast)
- гамма (gamma)
- четкость (sharpness)
Так же утилита позволяет настроить параметры обрезки (cropping).
Приступим:
- Запустите IrfanView
- File -> Batch Conversion/Rename или нажмите 'B'
- Выберите местоположение сканов и добавьте их к задаче
- Выберите выходной формат - TIF (для экономии места) или BMP (если все равно)
- Выберите выходной каталог (Output directory)
- Поставьте галочку 'Use advanced options' и нажмите кнопку 'Advanced', чтобы добраться до самого главного - настройки параметров изображения
- Установите следующие параметры (вообще говоря, подбираются экспериментально):
Sharpness = 50 Brightness = 100 Contrast = 75 Gamma correction = 0.3
- Установите галочки 'Convert to grayscale' и 'Overwrite existing files'
- Можете настроить обрезку на фрейме 'CROP'. Т.к. визуальных средств прицеливания нет, с первого раза попасть может не получиться
- Можете сохранить настройки на будущее, нажав 'Save settings' (так или иначе вьювер помнит последние)
- Нажмите 'OK', тем самым закрыв окно расширенных настроек
- Для начала обработки нажмите 'Start Batch'
После обработки обязательно гляньте, что вышло. Если результат недостаточно контрастен, или наоборот, слишком насурмлен - поиграйтесь с настройками.
Linux
Увы, пока не исследовано.
Сжатие
Windows
Средства: DjVu Solo 3.1
Это последняя версия программы, она более не развивается. Несмотря на то, что она использует старый формат, Solo 3.1 нам подойдет - это самый простой вариант под Windows.
- Запустите утилиту
- File -> Open, выберите тип файла (тот, в который сохраняли во вьювере) и откройте ОДНУ первую обработанную страницу конспекта
- Щелкните по thumbnail'у этой страницы правой кнопкой и выберите 'Insert Page(s) After'
- Опять в диалоге выберите тип файла (иначе ничего не увидите), и откройте оставшиеся листы
- Из-за бага проводника Windows, последний файл окажется вторым. Перетащите его куда положено
- File -> Encode As DjVu, выберите 'Bundled' и нажмите 'OK'
- Сохраните файл
- Укажите Resolution = 300, Scanned
- Нажмите 'OK' и дождитесь окончания кодирования
Просмотрите результат. Если он вас не устроит, придется повторить обработку в IrfanView с другими параметрами.
Linux
Увы, пока не исследовано.
Просмотр и печать
Средства:
- DjView (из состава DjVIewLibre)
- WinDjView
- DjVu Solo 3.1 - не рекомендуется к использованию, только на безрыбье.
Перед печатью следует включить только передний план. Если в таком режиме конспект читабелен, видны рисунки (т.е. при кодировании они не были отнесены к фону) - можно подавать на печать. Иначе, лучше произвести печать вместе с фоном.
Пример
Исходник (2.27 MiB | 2324 KiB)
Обработанный исходник (5.11 МiB)
Результат (DjVu) (0.05 MiB | 51.6 KiB)
Коэффициент сжатия: 2324 KiB / 51.6 KiB = 45