Russian Arms Forum

Пожалуйста, войдите или зарегистрируйтесь.

Расширенный поиск  

Новости:

Страницы: [1] 2 3   Вниз

Автор Тема: Сканирование и обработка книг или "у каждого свой вкус"  (Прочитано 25615 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Suvorov

  • Редактор
  • Ветеран
  • ******
  • Оффлайн Оффлайн
  • Сообщений: 1626
  • ну, що, ссуки, помогли вам вашi ляхи?
    • RussianArms.SU Бесплатный военно-технический и исторический архив

СКАНИРОВАНИЕ И ОБРАБОТКА КНИГ
или
У каждого свой вкус - сказал кобель, облизывая свои яйца.


Пошаговые инструкции.

----------------------------------------

Вариант 1. Редакция 2. (Сканируй быстро - пока есть книга)
Исходные условия:
1. Как можно меньше тратить времени на редактирование.
2. Сохранить ?разумный? баланс качество-объем. Сохранить в JPGах.
3. Сохранить электронный вариант книги как можно ближе к оригиналу (не в ущерб п.1)
4. Создать материал для ознакомления. DJVU


1. Создаешь папку с названием материала. Например:
Лучшие рестораны Моршанска. Пособие для офицеров. Книга 12. Издание 4. 2007(jpg)

    2. Сканируешь в эту папку в формате jpg, 300 dpi, 24 bit, цветной. Качество "максимальное"
    3. В Фотошопе открываешь первую страницу материала. Хорошо бы и на вторую и т.д.
    4. Штампуешь своё имя. Например: "Zembulatoff  (zema1234@mail.ru) для http://www.russianarms.ru".
    5. Сохраняешь эти файлы как копии, оставляя оригиналы нетронутыми.
    6. Запускаешь DjVu® Solo 3.1 (Non-Commercial version)
                                   http://www.f1cd.ru/soft/windows/text/djvu/djvu_solo_31_28/
    Файл.
    Открыть.
              В окошке "Тип файлов" выбираете расширение с которым сохранены Ваши картинки. (Хочется думать, что jpg)
              Заходите в директорию где хранятся Ваши файлы.
              Открываете Вашу первую картинку.
              Она появляется в большом окне и в окошке слева.
              Делаете клик левой кнопкой мыши на этой миниатюре.
              Выпадает меню.
              Выбираете "Вставить страницу(ы) после"
              Открывается окошко "Открыть"
              Снова указываете расширение добавляемых файлов «jpg»
              Выбираете хором те картинки которые хотите. (Первой выбираете последний лист! далее используя SHIFT присоединяете все прочие страницы)
              Нажимаете "открыть"
              Если картинок много - придется подождать.
              Через некоторое время все добавленные картинки появятся в окошке слева.
              Заходите в меню "Файл"
              Выбираете "сохранить" (с расширением .djvu)
              Будут задавать вопросы по разрешению - выбирайте не более 300 (меньше-лучше качество).
              Может появиться вывеска "Saving"
              Указываете "Bundled"
              Спокойно ожидаете окончания преобразования одиночных картинок в книгу.
6а. Все материалы зажмутся в 20-50 раз.
           И все дела.
        Сначала муторно, но после десятка манипуляций - все становиться обычным.

7. В известной папке появляется известный материал с расширением "ххххх.djvu"
8. Отдели папку с исходниками от папки с файлом djvu. эти папки должны иметь одинаковые имена и отличатся только размерами, например:
Лучшие рестораны Моршанска. Пособие для офицеров. Книга 12. Издание 4. 2007(jpg)156=zema1234 работа
и
Лучшие рестораны Моршанска. Пособие для офицеров. Книга 12. Издание 4. 2007(djvu)3.62=zema1234 работа

8. Архивируй папку с djvu.
9. Выбирай только бесплатный файлообменник. Лучше http://narod.yandex.ru/
    а. В секции "Загрузить файлы" жми на "по одному" или "сразу много"
    б. появляется окошко. жми "Добавить файлы"
    в. Выбираешь файл на своем компе. жми Открыть
    г. Так можно добавить несколько файлов. Максимальный размер каждого файла ~ 2 ГБ
    д. Жми на клавишу “ЗАКАЧАТЬ
    е. Наблюдай за процессом загрузки.
    ж. ВАЖНО! Терпеливо ждешь окончания загрузки (это может продолжаться несколько минут)
    з. ВАЖНО! Ничего не делай с этой вкладкой (не закрывай, не обновляй)
    и. По окончании загрузки появиться окно со резюме
    к. жми "поделиться" затем "на форуме" затем "скопировать"
    л. сохрани ссылку для последующего использования

10. Раздавай ссылку всем. С пометкой ВПЕРВЫЕ В ИЕТЕРНЕТЕ
11. Не рассчитывай на благодарность.
12. Выбрось из головы, планы обогащения на поприще сканирования.
13. Не удивляйся, обнаружив в Интернете свой материал по чужим именем.
14. Жди пакостей. Ублюдки найдутся.
15. Всё в порядке. Слава богу - ты в России.
16. Плюнь на всё.
17. Делай, что хочешь и пусть будет, что будет.
18. Переходи к следующей книге.

Прошу присылать иные варианты Памятки (пошаговые)

С уважением, Суворов АВ
« Последнее редактирование: Мая 27, 2011, 11:26:46 am от Suvorov »
Записан
В чужих руках всегда хрен толще.

Suvorov

  • Редактор
  • Ветеран
  • ******
  • Оффлайн Оффлайн
  • Сообщений: 1626
  • ну, що, ссуки, помогли вам вашi ляхи?
    • RussianArms.SU Бесплатный военно-технический и исторический архив
Re: СКАНИРОВАНИЕ И ОБРАБОТКА КНИГ
« Ответ #1 : Ноября 25, 2008, 10:24:58 pm »

пишет Carrey:

Вариант Памятки для желающих выкладывать материалы.
...
Прошу присылать иные варианты Памятки

Александр Васильевич в общем всё правильно изложил, хоть и немного не по уставу...  8) Вот вариант подоступнее:

Сканировать лучше всего с максимальной скоростью вашего сканера - той, с которой делается предварительное предсканирование (когда нажимаете кнопку на сканере). Надо лишь узнать, при каком физическом разрешении (сколько DPI) обеспечивается такая скорость. Устанавливаем DPI (dots per inch - точек на квадратный дюйм) от минимального, постепенно увеличивая (50 .. 100 .. 150 .. 200 .. 300 .. 400 .. 600 .. 1200 ..), и наблюдаем, при каком значении сканер начнёт сканировать медленнее. У моего Hewlett-Packard ScanJet 5590 - 200 DPI. Глубина цвета, как правило, на скорость не влияет (1bit ч/б, 24bit полноцветный, 8bit greyscale и т.д.), не влияет и формат сохранения изображения (jpeg, gif, tiff, pdf и т.д.). Разрешение в 200 DPI является минимально допустимым для наших целей, если меньше - то мелкий текст и графика будут уже нечитаемыми. Идеально, если ваш сканер способен быстро сканировать в 300 или даже 600 DPI. Разрешение в 600 DPI и больше резонно только для фальшивомонетчиков  ;D или для очень мелкой графики - обычный текст лучше не станет, а фотографии в полиграфии образуются из растра (смотрите в лупу) - и при сканировании в крупных разрешениях мы сканируем скорее растр а не фото. Итак, 200 или 300 DPI считаем оптимальным разрешением.

Далее, формат файла, в котором будут сохраняться сканируемые страницы. Настраивается обычно в программе для сканера, идёт в комплекте на диске. Для текстовых страниц (ТОЛЬКО текстовых, без рисунков, графики, чертежей, схем и проч.) отлично годится формат TIFF, 1-битный (= одноцветный = монохромный = битональный = ч/б), в разновидности CITT group 4 (правда, DjVu Solo 3.1 его не понимает, поэтому рекомендую универсальный TIFF with LZW compression = TIFF compressed). Для всех прочих случаев рекомендую JPEG максимального качества (= минимальной степени сжатия). Важно так-же узнать, в какое место на диске сохраняются сканы, от туда и будем забирать.

Приступаем к сканированию. Сначала обложки, переднюю, заднюю. Потом, если книжка разбита логически - например, цветные вклейки с фотографиями и тетрадки с текстом - сканируем в полноцветный JPEG цветные вклейки, потом выставляем в программе сканирования цвет на минимум, и сканируем разворотами (если влазит на стекло сканера. Хитрость: фломастером нанесите риску возле стекла ровно посередине длинной стороны и кладите книгу разворотом на стекло, выравнивая сгиб корешка по этой риске.) текст в битональный TIFF. По мере сканирования проговариваем про себя или вслух сканируемые страницы, помогает  :) не пропустить страничку-другую. Если страниц много, резонно сканировать пачками по 200-300 стр., чтобы не потерять весь объём работы в случае сбоя электричества и т.п. Хитрость: что-бы на сканах не просвечивал текст с оборота (особенно грустно наблюдать это на фотографиях и чертежах), поверх сканируемой страницы кладите чёрную непрозрачную плёнку (типа рентгеновской засвеченной или попросите специальную в типографии/у дизайнеров). Хитрость: если на сканах фотографий вылез муар из-за растра (сетка из кружков или квадратиков под небольшим углом, портящая изображение), попробуйте слегка поменять DPI на ±20-50 единиц или в программе сканирования включите опцию Descreen (сканировать будет медленнее но без муара).

Далее создаём в удобном месте на диске директорию (новую папку) и переносим в неё все файлы скана одной книги. Проверяем, всё ли на месте, переворачиваем, если надо, подгоняем-подрезаем, если надо. На этом этапе за многие годы отлично себя зарекомендовала программа ACDSee 3.1, в её встроенном редакторе (Photo Enhance) отлично выравнивается гистограмма (Auto Levels) - контраст и насыщенность изображения.

Теперь надо зажать скан. На сегодняшний момент лучшим алгоритмом сжатия растрового изображения является DjVue, это признала даже фирма Adobe, встраивая сжатие изображений по этому алгоритму в свежих версиях редактора Adobe Acrobat Pro. DjVue имеет четыре разновидности, крайне важно их различать.

DjVue/Photo жмёт изображение крайне аккуратно, с минимальными потерями, за счёт большего размера конечного файла - по типу компрессии JPEG. Потери качества, конечно, есть - но на глазок вы их не увидите, и при печати результат практически неотличим от оригинала. Разница в объёме файла по сравнению с форматом JPEG - лучше (меньше) в 5-7-9 раз, толстая книжка с серыми иллюстрациями займёт около 50 МБ, полноцветный фотоальбом формата A4 64 стр. займёт около 30 МБ и т.д. Рекомендую для всех случаев, кроме исключительно битонального текста. (Хитрость: при просмотре книжки выберите отображение только ч/б (Layers: black & white) - текстовые страницы будут более читаемы)

DjVue/Scanned, DjVue/Clean и DjVue/Bitonal - эти три формата жмут очень сильно, результирующий файл будет занимать очень мало, но - за счёт качества. Немного отличаются первые два, Scanned лучше жмёт фотографии (где больше полутонов), Clean лучше жмёт графику (диаграммы, графики, плакатные рисунки - где нет цветовых переходов и кол-во цветов ограничено). Bitonal хорошо жмёт битональные изображения.

Как зажимать? Открываем в программе DjVu Solo 3.1 первый файл скана, Edit > Append Pages, внизу выбираем отображение всех типов файлов (*.*), кликаем на последний файл, держим Shift, кликаем на ВТОРОЙ файл, ОК. Ждём, пока откроет. File > Save as... > выбираем Bundled (что-бы результат был в одном файле а не пофайлово-постранично), выставляем разрешение (необязательно, можно оставить сколько там будет, или вписать фактические DPI) > вот теперь выбираем алгоритм сжатия (Photo / Scanned / Clean / Bitonal) и зажимаем. Когда процесс завершится (100%), файл уже будет готов.

Хитрость: если книжка, например, состоит из отдельных страниц с текстом и отдельных с фотографиями, можно сделать культурный скан малого размера, не жертвуя качеством иллюстраций (чем, к сожалению, грешат 99.99% выложенной в сети литературы). Для этого отсканируем всё вместе, а зажмём по-разному. После сканирования отделим файлы с картинками, а потом соберём всё вместе. Проще всего - выставив режим отображения файлов сканов в Thumbnails, удерживая Control и кликая мышкой, выделим все страницы с картинками и перенесём  в отдельную директорию. Теперь зажмём все текстовые страницы в один файл DjVue/Scanned, а все страницы с картинками (ВАЖНО: и так-же обложками) - в другой файл DjVue/Photo. Открываем в DjVu Solo второй файл, и добавляем в него же (Edit > Append Pages...) первый файл. Перераспределяем, если надо, страницы, что-бы всё шло по-порядку, и сохраняем общий файл под другим именем (File > Save As...).

А теперь самое главное - поделиться результатом. На основе почти годового опыта имею честь предложить лучший на мой взгляд вариант - mediafire.com - бесплатный надёжный (тьфу-тьфу-тьфу!) ресурс без ограничений, на котором будут храниться все ваши файлы. По-быстрому регистрируемся (создаём свой аккаунт) - никакого подтверждения через э-мейл не требуется, всё происходит там-же, потом не беспокоят никак. Логинимся и запоминаемся на своём компьютере. Заливаем файл скана, если надо - создаём сразу папку для этого дела. По окончанию загрузки жмём на кнопку Share и копируем в буффер ссылку на файл (лучше с именем файла). Вставляете ссылку сюда и огребаете по полной респекты и уважухи...  ;D

Буду рад развеять возникшие сомнения и прояснить укоренившиеся заблуждения  ;D

Суворов:
Спасибо, дорогой Carrey!
Записан
В чужих руках всегда хрен толще.

Suvorov

  • Редактор
  • Ветеран
  • ******
  • Оффлайн Оффлайн
  • Сообщений: 1626
  • ну, що, ссуки, помогли вам вашi ляхи?
    • RussianArms.SU Бесплатный военно-технический и исторический архив
Re: СКАНИРОВАНИЕ И ОБРАБОТКА КНИГ
« Ответ #2 : Ноября 25, 2008, 10:36:33 pm »

пишет Arrested

Вариант Памятки для желающих выкладывать материалы.
 
              Заходите в меню "Файл"
              Выбираете "сохранить" (с расширением .djvu)
              Будут задавать вопросы по разрешению - выбирайте не менее 300.
Цитировать
выставляем разрешение (необязательно, можно оставить сколько там будет, или вписать фактические DPI)
Все изложено ясно и точно. От себя хочу добавить: чем МЕНЬШЕ число (варьируется от 50 до 1200), тем ВЫШЕ качество (пример: выставляем 1200 - на выходе получаем очень маленький файл с абсолютно нечитаемым текстом и неразличимыми рисунками).
По всей видимости, это запрашивается не разрешение, а некий делитель для уменьшения размера конечного файла за счет ухудшения качества.
Записан
В чужих руках всегда хрен толще.

Suvorov

  • Редактор
  • Ветеран
  • ******
  • Оффлайн Оффлайн
  • Сообщений: 1626
  • ну, що, ссуки, помогли вам вашi ляхи?
    • RussianArms.SU Бесплатный военно-технический и исторический архив
Re: СКАНИРОВАНИЕ И ОБРАБОТКА КНИГ
« Ответ #3 : Ноября 25, 2008, 10:38:20 pm »

пишет knkd

Вариант Памятки для желающих выкладывать материалы.
 
              Заходите в меню "Файл"
              Выбираете "сохранить" (с расширением .djvu)
              Будут задавать вопросы по разрешению - выбирайте не менее 300.
Цитировать
выставляем разрешение (необязательно, можно оставить сколько там будет, или вписать фактические DPI)
Все изложено ясно и точно. От себя хочу добавить: чем МЕНЬШЕ число (варьируется от 50 до 1200), тем ВЫШЕ качество (пример: выставляем 1200 - на выходе получаем очень маленький файл с абсолютно нечитаемым текстом и неразличимыми рисунками).
По всей видимости, это запрашивается не разрешение, а некий делитель для уменьшения размера конечного файла за счет ухудшения качества.
:-) Вторая поправка!
Выбранное число никак не влияет на качество.
Единственное на что оно влияет это на отображаемый масштаб странички.
Тоесть:
 - у нас есть скан сделаный с разрешением 300dpi
 - в редакторе мы поставили 1200
 - на выходе получаем очень маленькие страницы.
 - Увеличиваем их - видим что качество не изменилось.
И наоборот:
 - сканируем 1200dpi
 - в редакторе ставим 300
 - видим огромную букву на весь экран.
 - размер файла тот же.
Вывод: С каким разрешением сканировали - такое число и ставим.
Исключения: Есть огромный лист (может даже склееный из разных сканов) чертежа, он не влазит на экран, мешает масштабировать остальные странички по ширине - ставим разрешение БОЛЬШЕ чем на самом деле - страничка легко помещается на экране. (естественно экзекуцию со страничками нужно проводить индивидуально) Обратное тоже верно, можно увеличивать видимый размер различных вкладышей, табличек etc.

ЗЫ *.jpg - худший формат для книги. Он подходит только для полноцветных картинок. Это из за него на многих сканах расплывшиеся буквы. Какое бы малое сжатие не стояло этот формат всегда искажает штриховые изображения. Лучче всего *.tif
Записан
В чужих руках всегда хрен толще.

Suvorov

  • Редактор
  • Ветеран
  • ******
  • Оффлайн Оффлайн
  • Сообщений: 1626
  • ну, що, ссуки, помогли вам вашi ляхи?
    • RussianArms.SU Бесплатный военно-технический и исторический архив
Re: СКАНИРОВАНИЕ И ОБРАБОТКА КНИГ
« Ответ #4 : Ноября 25, 2008, 10:40:10 pm »

пишет Arrested

Цитировать
Лучче всего *.tif
Зато одна страница в этом формате весит до 15 Mb!
Цитировать
Выбранное число никак не влияет на качество.

- на выходе получаем очень маленькие страницы.
 - Увеличиваем их - видим что качество не изменилось.
Так в том-то и дело, что очень сильно влияет и качество падает ниже плинтуса.
Записан
В чужих руках всегда хрен толще.

Suvorov

  • Редактор
  • Ветеран
  • ******
  • Оффлайн Оффлайн
  • Сообщений: 1626
  • ну, що, ссуки, помогли вам вашi ляхи?
    • RussianArms.SU Бесплатный военно-технический и исторический архив
Re: СКАНИРОВАНИЕ И ОБРАБОТКА КНИГ
« Ответ #5 : Ноября 25, 2008, 10:41:45 pm »

пишет knkd

Цитировать
Лучче всего *.tif
Зато одна страница в этом формате весит до 15 Mb!
tif это метаформат - в нём легко настраивается сжатие. Он может быть всего в два-три раза больше чем djvu. Надо только выбирать сжатие без потерь, а то он может использовать обычное jpg сжатие.
Цитировать
Выбранное число никак не влияет на качество.

- на выходе получаем очень маленькие страницы.
 - Увеличиваем их - видим что качество не изменилось.
Так в том-то и дело, что очень сильно влияет и качество падает ниже плинтуса.
хм. У вас какая программа?
У меня «LIZARDTECH Document Express Professional 6.0 build 1320» там єто в хелпе написано по-буржуйски

P.S. А если в свойствах изображения указаны DPI или истинный размер, то это поле вообще игнорируется.
Записан
В чужих руках всегда хрен толще.

Suvorov

  • Редактор
  • Ветеран
  • ******
  • Оффлайн Оффлайн
  • Сообщений: 1626
  • ну, що, ссуки, помогли вам вашi ляхи?
    • RussianArms.SU Бесплатный военно-технический и исторический архив
Re: СКАНИРОВАНИЕ И ОБРАБОТКА КНИГ
« Ответ #6 : Ноября 25, 2008, 10:44:34 pm »

пишет BuffoG

Вы только не забывайте, что некоторые любят сохранять в PDF или DJVU сильно ужимая? а это в свою очередm сказывается на качестве. И зачастую после такого сжатия нормально изучать материалы изложенyые в книге становится просто невозможно.
Так что господа, не доводите до крайностей!
Записан
В чужих руках всегда хрен толще.

Suvorov

  • Редактор
  • Ветеран
  • ******
  • Оффлайн Оффлайн
  • Сообщений: 1626
  • ну, що, ссуки, помогли вам вашi ляхи?
    • RussianArms.SU Бесплатный военно-технический и исторический архив
Re: СКАНИРОВАНИЕ И ОБРАБОТКА КНИГ
« Ответ #7 : Ноября 25, 2008, 10:45:39 pm »

пишет carrey

ЗЫ *.jpg - худший формат для книги. Он подходит только для полноцветных картинок. Это из за него на многих сканах расплывшиеся буквы. Какое бы малое сжатие не стояло этот формат всегда искажает штриховые изображения. Лучче всего *.tif
Вот и первые заблуждения пошли  ;D

Видите-ли, в чём дело. Типографически раньше (в докомпьютерные времена) текст печатался краской по шрифту, и печатный текст был строго битональным, отпечатки шрифта были настолько филигранные, насколько филигранным был стальной шрифт. В наше нелёгкое время всё печатается по цифровым технологиям, подготавливается макет, печатаются плёнки (ага, на принтере с некоторым DPI, т.е. изображение уже растрировано), с них просветкой или другими способами перепечатывается книга.

Таким образом, что-бы максимально достоверно превратить печатный текст в цифровой растровый битональный файл (Вы ведь именно на битональность намекаете, не так ли?), нужно либо делать это в огромном разрешении (более 600 DPI) - для шрифтовой полиграфии, либо угадать исходное разрешение растрирования предпечатного макета (что сложно в нашем случае). Иначе получим либо непропорциональный размер файла, либо растровый муар, либо значительные искажения мелкой графики и мелкого текста.

Полутоновое сканирование в JPEG в разрешении 200-300 DPI сродни восприятию изображения человеческим глазом. Колбочки сетчатки воспринимают отдельные пиксели, а мозг сливает их вместе в цельную картинку. Так-же и JPEG - текст в нём такой, каким мы его видим невооружённым взглядом. Проблема появляется при мелком тексте и мелкой графике (что, впрочем, я уже ранее объяснял) - тогда резонно сканировать в 300 - 400 - 600 DPI.

Расплывшиеся буквы, как мне кажется - на сканах в разрешении 72 .. 150 DPI, это с некоторыми бывает 8) Ну а если буквы расплываются в файле DjVue - переключите режим отображения слоёв с Color на Black & white - буквы станут битонально-чёрными и резкими.
Записан
В чужих руках всегда хрен толще.

Suvorov

  • Редактор
  • Ветеран
  • ******
  • Оффлайн Оффлайн
  • Сообщений: 1626
  • ну, що, ссуки, помогли вам вашi ляхи?
    • RussianArms.SU Бесплатный военно-технический и исторический архив
Re: СКАНИРОВАНИЕ И ОБРАБОТКА КНИГ
« Ответ #8 : Ноября 25, 2008, 10:48:00 pm »

пишет Arrested

Проведем эксперимент.
Берем программу LizardTech DjVu Solo 3.1 с переводом от Odino4ka@nextmail.ru.
Берем файл bav61.rar из поста №753 с 38-ой страницы данного форума (это jpeg-и, заархивированные RAR-ом), вес - чуть больше 49 Mb. Проводим скрещивание  :D.
При запросе непонятной цифры, описанной мной выше, оставляем ее как предлагает программа (у меня 300) - за 50 сек получаем файл размером 1506 Kb вполне неплохого качества. Выставляем 1200 - за 39 сек получаем файл весом 1241 Kb,- текст вроде-бы не изменился, а картинки как будто водой облили. Выставляем 50 - за 5 минут получаем файл весом 8697 Kb с качеством, практически неотличимым от оригинала.
В ПО моего сканера есть утилита, позволяющая сразу преобразовать сканы в PDF. При стандартном сжатии за 14 сек получаем 54 Mb, при высоком - за 16 сек 5944 Kb.
Цитировать
Так что господа, не доводите до крайностей
Золотые слова!
P.S. Есть предложение полемику по данному вопросу закончить.
Записан
В чужих руках всегда хрен толще.

Suvorov

  • Редактор
  • Ветеран
  • ******
  • Оффлайн Оффлайн
  • Сообщений: 1626
  • ну, що, ссуки, помогли вам вашi ляхи?
    • RussianArms.SU Бесплатный военно-технический и исторический архив
Re: СКАНИРОВАНИЕ И ОБРАБОТКА КНИГ
« Ответ #9 : Ноября 25, 2008, 10:50:32 pm »

пишет knkd

ЗЫ *.jpg - худший формат для книги. Он подходит только для полноцветных картинок. Это из за него на многих сканах расплывшиеся буквы. Какое бы малое сжатие не стояло этот формат всегда искажает штриховые изображения. Лучче всего *.tif
Вот и первые заблуждения пошли  ;D ...
Цитата: WikiPedia
http://ru.wikipedia.org/wiki/JPG
...
Сжатие
При сжатии изображение переводится в цветовую систему YCbCr. Далее каналы изображения Cb и Cr, отвечающие за цвет, уменьшаются в 2 раза (по линейному масштабу). Уже на этом этапе необходимо хранить только четверть информации о цвете изображения.
Реже используется уменьшение цветовой информации в 4 раза или сохранение размеров цветовых каналов как есть. Количество программ, которые поддерживают сохранение в таком виде, относительно невелико.
Далее цветовые каналы изображения, включая черно-белый канал Y, разбиваются на блоки 8 на 8 пикселей. Каждый блок подвергается дискретно-косинусному преобразованию. Полученные коэффициенты подвергаются квантованию и упаковываются с помощью кодов Хаффмана (см. Алгоритм Хаффмана).
Матрица, используемая для квантования коэффициентов, хранится вместе с изображением. Обычно она строится так, что высокочастотные коэффициенты подвергаются более сильному квантованию, чем низкочастотные. Это приводит к огрублению мелких деталей на изображении. Чем выше степень сжатия, тем более сильному квантованию подвергаются все коэффициенты.
...
Достоинства и недостатки
К недостаткам формата следует отнести то, что при сильных степенях сжатия дает знать о себе блочная структура данных, изображение «дробится на квадратики». Этот эффект особенно заметен на областях с низкой пространственной частотой (плавные переходы изображения, например, чистое небо). В областях с высокой пространственной частотой (например, контрастные границы изображения), возникают характерные «артефакты» — иррегулярная структура пикселей искаженного цвета и/или яркости. Кроме того, из изображения пропадают мелкие цветные детали.
Вывод: Джипег сильно уродует изображение. Но на фотографиях это практически незаметно потому что искажение происходит в том диапазоне который плохо воспринимается человеческим глазом.
При резких краях на изображении (буквы) мы имеем артефакты.
В любом случае tiff - сжатие БЕЗ ПОТЕРЬ и выбрав нормальное сжатие в редакторе мы получим изображение максимально возможного качества.
В наше нелёгкое время всё печатается по цифровым технологиям, подготавливается макет, печатаются плёнки (ага, на принтере с некоторым DPI, т.е. изображение уже растрировано), с них просветкой или другими способами перепечатывается книга.
(Внутренне содрогаясь от ужаса) Объяснения современных технологий печати выходят за рамки обсуждения. Поэтому ищите в интернете по словам «Офсет», «Офсетная печать», немного сдесь http://ru.wikipedia.org/wiki/%D0%9E%D1%84%D1%81%D0%B5%D1%82. Коротко: сказаное вами не имеет ничего общего с реальностью, текст строго битонален (+/- цвет бумаги) вне зависимости от технологии.

2Arrested
Никогда не пользовался DjVu Solo.
Да и в литературе которую обрабатывал фотографий было немного, только илюстрации одноцветные.
Но это поле задаёт именно масштаб изображения.
Возможно на основании масштаба оно принимает решение о том как сжимать фотографии. И при задании маленького DPI просто уменьшает сетку.
Для текста и одноцветных изображений никакой разницы кроме масштаба точно нет. Файлы различаются размером только на несколько байт.
Кстати. Попробуйте теперь в этом файле в просмотрщике поставить масштаб 100%  :)
Моя программа для сканирования принудительно вставляет в файл информацию о DPI поэтому когда сжимаю свои файлы это поле всегда игнорируется, что бы я туда не вводил.

З.Ы. Вот если бы кто ещё подсказал как правильно обрабатывать сканы книг с очень желтой бумагой, когда бумага мало отличается от текста, а на корешке ещё следы от проржавевших скрепок... Уже неделю мучаюсь над книгой в 70 страниц. Результат более чем печальный.
Записан
В чужих руках всегда хрен толще.

Suvorov

  • Редактор
  • Ветеран
  • ******
  • Оффлайн Оффлайн
  • Сообщений: 1626
  • ну, що, ссуки, помогли вам вашi ляхи?
    • RussianArms.SU Бесплатный военно-технический и исторический архив
Re: СКАНИРОВАНИЕ И ОБРАБОТКА КНИГ
« Ответ #10 : Ноября 25, 2008, 10:52:43 pm »

пишет knots

knkd
Есть отличная програмка Book Restorer. Может отбельть бумагу, убрать геометрические искажения, выровнять освещение, замаскироватьт дефекты или пальцы на изображнении.
Вот смотри до и после, некоторые книги я не могу сканировать (домой не дают) фотографирую и правлю. Качество я для выкладки ухудшил, на самом деле получается TIFF приличного качества.

http://i067.radikal.ru/0811/31/a8604ed755e9.jpg
http://s49.radikal.ru/i125/0811/85/66b3a8a8f3c7.jpg

Суворов:
      Спасибо, уважаемый knots!
Записан
В чужих руках всегда хрен толще.

Suvorov

  • Редактор
  • Ветеран
  • ******
  • Оффлайн Оффлайн
  • Сообщений: 1626
  • ну, що, ссуки, помогли вам вашi ляхи?
    • RussianArms.SU Бесплатный военно-технический и исторический архив
Re: СКАНИРОВАНИЕ И ОБРАБОТКА КНИГ
« Ответ #11 : Ноября 25, 2008, 10:54:55 pm »

пишет carrey

Есть отличная програмка Book Restorer.
Не желаете ли выложить программку вместе с лекарством?
Записан
В чужих руках всегда хрен толще.

Suvorov

  • Редактор
  • Ветеран
  • ******
  • Оффлайн Оффлайн
  • Сообщений: 1626
  • ну, що, ссуки, помогли вам вашi ляхи?
    • RussianArms.SU Бесплатный военно-технический и исторический архив
Re: СКАНИРОВАНИЕ И ОБРАБОТКА КНИГ
« Ответ #12 : Ноября 25, 2008, 10:57:07 pm »

пишет carrey

http://ru.wikipedia.org/wiki/JPG
...
Достоинства и недостатки
К недостаткам формата следует отнести то, что при сильных степенях сжатия дает знать о себе блочная структура данных, изображение «дробится на квадратики».

Вывод: Джипег сильно уродует изображение.
...ага, при СИЛЬНЫХ степенях сжатия. К тому-же учтите, что в википедию обычно пишут всякую отсебятину безграмотные школьники, следите за источниками публикаций.

При резких краях на изображении (буквы) мы имеем артефакты.
...опять же, при СИЛЬНЫХ степенях сжатия. Я же рекомендую пользовать JPEG при максимальном качестве/минимальном сжатии.

В любом случае tiff - сжатие БЕЗ ПОТЕРЬ и выбрав нормальное сжатие в редакторе мы получим изображение максимально возможного качества.
Почитайте про TIFF разновидности LZW, так-же про CITT Group 3 и 4, много нового узнаете про потери.
Ещё раз: потери от битональности формата TIFF больше, чем от "артефактов" формата JPEG. Особенно наглядно выражается на чертежах. Вы определитесь со своей позицией - либо Вы объясняете преимущества конкретных форматов с конкретными установками, либо просто противоборствуете против формата JPEG как такового.

(Внутренне содрогаясь от ужаса) ... Коротко: сказаное вами не имеет ничего общего с реальностью, текст строго битонален (+/- цвет бумаги) вне зависимости от технологии.
Возьмите-ка, например, журнал "Авиация и Время", любой номер за 2000-2003 год, и сравните в лупу с тем-же журналом за этот год, особенно чертежи.

Никогда не пользовался DjVu Solo.
Да и в литературе которую обрабатывал фотографий было немного, только илюстрации одноцветные.

Приятно иметь дело с человеком, имеющим настолько богатый опыт, авторитет налицо, под стать аргументации.
Записан
В чужих руках всегда хрен толще.

Suvorov

  • Редактор
  • Ветеран
  • ******
  • Оффлайн Оффлайн
  • Сообщений: 1626
  • ну, що, ссуки, помогли вам вашi ляхи?
    • RussianArms.SU Бесплатный военно-технический и исторический архив
Re: СКАНИРОВАНИЕ И ОБРАБОТКА КНИГ
« Ответ #13 : Ноября 25, 2008, 10:59:15 pm »

пишет knkd

http://ru.wikipedia.org/wiki/JPG
...
Достоинства и недостатки
К недостаткам формата следует отнести то, что при сильных степенях сжатия дает знать о себе блочная структура данных, изображение «дробится на квадратики».

Вывод: Джипег сильно уродует изображение.
...ага, при СИЛЬНЫХ степенях сжатия. К тому-же учтите, что в википедию обычно пишут всякую отсебятину безграмотные школьники, следите за источниками публикаций.
Первоисточник школьников (это читается)
При резких краях на изображении (буквы) мы имеем артефакты.
...опять же, при СИЛЬНЫХ степенях сжатия. Я же рекомендую пользовать JPEG при максимальном качестве/минимальном сжатии.
При любых степенях сжатия (см. «первоисточник»)
В любом случае tiff - сжатие БЕЗ ПОТЕРЬ и выбрав нормальное сжатие в редакторе мы получим изображение максимально возможного качества.
Почитайте про TIFF разновидности LZW, так-же про CITT Group 3 и 4, много нового узнаете про потери.
Ещё раз: потери от битональности формата TIFF больше, чем от "артефактов" формата JPEG. Особенно наглядно выражается на чертежах. Вы определитесь со своей позицией - либо Вы объясняете преимущества конкретных форматов с конкретными установками, либо просто противоборствуете против формата JPEG как такового.
Да. Я объясняю преимущества конкретных форматов, при конкретных установках. TIFF - формат хранения документации. JPG - формат хранения фотографий.
Вопрос для внимательных! В каком месте этого файла спрятана битональность TIF-а?
Да бох с ними с фотками. Но чем вам не угодила битональность чертежей?

2Suvorov
В резервацию это всё надо. А то мы так ещё долго могём. :-)
Записан
В чужих руках всегда хрен толще.

Suvorov

  • Редактор
  • Ветеран
  • ******
  • Оффлайн Оффлайн
  • Сообщений: 1626
  • ну, що, ссуки, помогли вам вашi ляхи?
    • RussianArms.SU Бесплатный военно-технический и исторический архив
Re: СКАНИРОВАНИЕ И ОБРАБОТКА КНИГ
« Ответ #14 : Ноября 25, 2008, 11:01:30 pm »

пишет knots

Не желаете ли выложить програмку вместе с лекарством?

Я её здесь брал http://www.djvu-soft.narod.ru
Мотать почти в самый низ страницы, там программа и русификатор. Советую качать версию 4.1, т.к. 4.2 я качал из разных источников но заставить ее работать не смог. Она запускается но панель инструментов пустая. А 4.1 работает, после русификации там никаких лекарств не надо.

Дополню:
Эта программа поддерживает пакетную обработку.
Очень рекомендую использовать скрипты. Звучит страшновато, но на самом деле всё очень просто. Вытаскиваем на редактирование одну страницу, повозились с ней, когда результат удовлетворил, просто пытаемся вспомнить все свои действия. Берем еще страницу, в панели реставрации нажимаем кнопочку «Записать скрипт» и проделываем все операции заново, после чего останавливаем запись. Запись запоминает все ваши действия с этой страницей.
Далее выбираем страницы на которых вы бы действовали точно так же. Выделили их и нажимаем «применить скрипт», программка сама выполнит все записанные действия на выделенных страницах….. вуаля :) Все готово :)
Если на некоторых страницах результат не понравился, кликаем – Возвратить эту страницу в исходное состояние, и можем ее настроить отдельно. Или записать еще один скрипт для таких страниц.
Записан
В чужих руках всегда хрен толще.

Suvorov

  • Редактор
  • Ветеран
  • ******
  • Оффлайн Оффлайн
  • Сообщений: 1626
  • ну, що, ссуки, помогли вам вашi ляхи?
    • RussianArms.SU Бесплатный военно-технический и исторический архив
Re: СКАНИРОВАНИЕ И ОБРАБОТКА КНИГ
« Ответ #15 : Ноября 25, 2008, 11:06:10 pm »

пишет carrey

Вкратце...

Но чем вам не угодила битональность чертежей?

Битонал - первый  ;D А вот, что-бы битонал был не хуже того, что на втором - надо или много-много DPI, или компромиссный полутон. Что касается мелкого текста - с ним в битонале та-же беда, что и с заклёпками в приведённом примере.
Записан
В чужих руках всегда хрен толще.

Suvorov

  • Редактор
  • Ветеран
  • ******
  • Оффлайн Оффлайн
  • Сообщений: 1626
  • ну, що, ссуки, помогли вам вашi ляхи?
    • RussianArms.SU Бесплатный военно-технический и исторический архив
Re: СКАНИРОВАНИЕ И ОБРАБОТКА КНИГ
« Ответ #16 : Ноября 25, 2008, 11:08:10 pm »

пишет knots

Битонал тоже можно настроить :) Вот если бы мне кто оригинал дал от этого изображения. В полутоне деталей больше сейчас но если бы был оригинал, я бы настроил не хуже полутона в деталях. Одну страницу настроить, а потом скрипт – и на все страницы книги с изображениями.

 ;)
Записан
В чужих руках всегда хрен толще.

Suvorov

  • Редактор
  • Ветеран
  • ******
  • Оффлайн Оффлайн
  • Сообщений: 1626
  • ну, що, ссуки, помогли вам вашi ляхи?
    • RussianArms.SU Бесплатный военно-технический и исторический архив

пишет carrey

Битонал тоже можно настроить :)
Позвольте уточнить, Александр Васильевич предлагал публиковать варианты памятки для желающих НАЧАТЬ сканировать материалы или же варианты технического завизированного официального стандартного непогрешимого руководства для профессионалов?

Конечно, всё можно настроить, заскриптовать (автоматизировать) и улучшить, но это далеко не всякий потянет. Согласитесь, лучше читать файл, зажатый из JPEG но со всеми заклёпками, чем читать криво настроенный битонал или разыскивать обладателя оригинала и упрашивать его пересканировать в том-же JPEG если он противится попыткам обучения его настраиванию параметров битонала.

Есть предложение считать вопрос закрытым в пользу универсальности и простоты JPEG качества 100% до опубликования Вашего варианта Памятки желающим сканировать и выкладывать материалы.  :)
Записан
В чужих руках всегда хрен толще.

Suvorov

  • Редактор
  • Ветеран
  • ******
  • Оффлайн Оффлайн
  • Сообщений: 1626
  • ну, що, ссуки, помогли вам вашi ляхи?
    • RussianArms.SU Бесплатный военно-технический и исторический архив

пишет knots

Ну что я могу сказать….
1.   Плох тот солдат который не мечтает стать Александром Васильевичем. Это раз :)
2.   На момент первой публикации о форматах DJVU я имел весьма смутное представление.
3.   Не так страшен черт, как его малюют.
Вот это я и хотел сказать :)
Записан
В чужих руках всегда хрен толще.

Suvorov

  • Редактор
  • Ветеран
  • ******
  • Оффлайн Оффлайн
  • Сообщений: 1626
  • ну, що, ссуки, помогли вам вашi ляхи?
    • RussianArms.SU Бесплатный военно-технический и исторический архив

пишет knkd

Вкратце...
В программе для сканирования есть такое поле/движок «гамма» - она у вас сильно завышена (пророчу уровень 60-70%)
Для чёрно-белых/серых изображений её лучше опустить до 0-15% - станет немного лучше. Но вообще такида "чертежи" такого "качества" нужно обрабатывать отдельно от текста.
Проблема с серым шрифтом должна решится сбросом гаммы в 0%  + контраст 80-85% если сразу не помогает - попробуйте уменьшить разрешение сканирования, немного. (в принцЫпе, если серый шрифт печатается растром то на 100% поможет вариант сканировать с увеличенным разрешением -> размыть изображение gauss_3х3 -> уменьшить разрешение. Но это долго и нерационально.)
(тут уж не мне советовать... но... "чертежи" эти выдраны издательством из интернета и криво увеличены в M$-Word. Не имеет ли смысла найти оригиналы на http://www.airwar.ru/ и тд. ? Работы правда больше но качество будет получше :-) )
Но недостатков JPEG в сравнении с TIFF это не отменяет!

2knots
Вот если бы инсталятор этой чудо-програмки еще запускался под вайном. :-[
Нет ли случайно распакованного варианта?
Записан
В чужих руках всегда хрен толще.

Suvorov

  • Редактор
  • Ветеран
  • ******
  • Оффлайн Оффлайн
  • Сообщений: 1626
  • ну, що, ссуки, помогли вам вашi ляхи?
    • RussianArms.SU Бесплатный военно-технический и исторический архив

пишет knots

2knots
Вот если бы инсталятор этой чудо-програмки еще запускался под вайном. :-[
Нет ли случайно распакованного варианта?

Ээ.... так сказать, не совсем понял вопрос.
Попытаюсь ответить наугад. Программа в RaR архиве. У формата RAR до версии 3.0 свой алгоритм, а выше 3.0 другой. Если у вас программа выше 3.0, она распакует всё. А если ниже, то возможно что архивы жатые более поздней программой дадут ошибку.
Записан
В чужих руках всегда хрен толще.

Suvorov

  • Редактор
  • Ветеран
  • ******
  • Оффлайн Оффлайн
  • Сообщений: 1626
  • ну, що, ссуки, помогли вам вашi ляхи?
    • RussianArms.SU Бесплатный военно-технический и исторический архив

пишет knkd

knkd:
Вот если бы инсталятор этой чудо-програмки еще запускался под вайном. :-[
Нет ли случайно распакованного варианта?

knots:
Ээ.... так сказать, не совсем понял вопрос.
Попытаюсь ответить наугад. Программа в RaR архиве. У формата RAR до версии 3.0 свой алгоритм, а выше 3.0 другой. Если у вас программа выше 3.0, она распакует всё. А если ниже, то возможно что архивы жатые более поздней программой дадут ошибку.
Не совсем.
Проблема в том что у меняя Линукс. Для запуска windows-программ я использую эмулятор WINE (правда это не эмулятор но... :)). Архив я распаковываю хорошо. Потом запускаю инсталятор, а он не работает. Дело в том что инсталятор использует прямое обращение к памяти (что в современных операционных системах называется "через левое ухо зуб удалять"). По соображениям безопасности это блокируется. Результат - программ не устанавливается. Мне бы её же только уже установленную, из "программ_файлс". Правда если вся программа написана в таком духе то это не поможет.

ЗЫ Некоторые антивирусы, если программа напрямую обращается к памяти считают её трояном.
Записан
В чужих руках всегда хрен толще.

knots

  • Молодой
  • **
  • Оффлайн Оффлайн
  • Сообщений: 63
Re: СКАНИРОВАНИЕ И ОБРАБОТКА КНИГ или "у кажд&
« Ответ #22 : Ноября 26, 2008, 09:35:42 am »

А…, вот оно что. Хм…
Мне кажется если я выдерну папку из программ файлс то она не будет работать. Эти виндовские программы рассыпают кучу своих записей во всякие служебные папки типа windows\sustem32  и в реестр что то прописывают. Если выдернуть папку без всего что рассыпано по другим папкам – очень сомнительно.
Я могу сделать так, удалю свою программу и заново инсталлирую но уже через менеджер реестра, он покажет куда и чего эта программа рассыпает при инсталляции. А потом поспрашивать у Линуксников.



Вобщем Линуксники мне сказали так, эта программа через Вайн не пойдет. Советуют поставить виртуальную машину и через неё запускать виндовские программы. Это будет без заморочек.
« Последнее редактирование: Ноября 26, 2008, 09:52:15 am от knots »
Записан

knkd

  • Участник
  • ***
  • Оффлайн Оффлайн
  • Сообщений: 101
Re: СКАНИРОВАНИЕ И ОБРАБОТКА КНИГ или "у кажд&
« Ответ #23 : Ноября 26, 2008, 12:57:43 pm »

Советуют поставить виртуальную машину и через неё запускать виндовские программы. Это будет без заморочек.
Ну это было бы полным извращением  ;D
Я её уже распаковал. Под вайном работает.
Осваиваю, тяжко.
Спасибо!

З.Ы. Доктор Вэб и КламавАнтивирус таки говорят что в инсталяторе троян.
Записан
В тумані С'єрри танк стоїть
Немов страшна примара
Його гранатою підбив
Ернесто Че Гевара!

knots

  • Молодой
  • **
  • Оффлайн Оффлайн
  • Сообщений: 63

А мои Касперский и NOD молчат как рыба об лёд.

Ну это было бы полным извращением  ;D

Ну как сказали так я и передал :) Они еще массу вопросов назадавали, на которые я не смог ответить. Учитывая что я в этой операционке полный ноль, возможно что получился "испорченый телефон"  ;D
Записан
Страницы: [1] 2 3   Вверх