Вторая жизнь бумажных книг, журналов, газет и прочих печатных изданий.
Настоящему книголюбителю станет не по себе. Когда он видит как уходит от него Книга. Бумажная книга, которая может быть сдана на утиль, сожжена или использована вообще не по назначению. Да, бывает всякое и с всеми. Случайно или предумышленно.
Но радует то, что ушли времена когда книги переписывали вручную, перерисовывали картинки, делали новый переплет. Даже при появлении печатных станков, все же вопрос о сохранении информации не был таким актуальным как сейчас. Сейчас, можно более легко и акуратнее и проще сделать копию книги или какой то издаваемой продукции. И тогда, имея ее копии можно распространять информацию, спасать накопленный записанные знания. Передавать другим поколениям.
Стоит оговориться, что в век бурной защиты авторских прав и легкой доступности литературы, изначально сверстанной в электронной форме, имеет смысл оцифровывать либо старые фундаментальные советские учебники, либо что-то действительно редкое и только для личного пользования.
Законной является оцифровка книг, права на которые истекли, или книг, авторы и издатели которых разрешают их свободное распространение через интернет или другим образом (например, если автор выложил на интернет-странице электронную книгу после того, как издательство вернуло ему все имущественные права). Учтите, что законом запрещается оцифровывать или копировать (в том числе через бесплатные или платные интернет-сайты) электронные книги, являющиеся в настоящее время объектами имущественного права. Хранение таких электронных книг на вашем личном компьютере уже является копированием и также запрещено, за исключением того случая, если вы сами купили эту книгу у издательства в электронном виде. Даже если у вас есть купленный вами бумажный экземпляр какой-либо книги, защищенной имущественным правом, закон запрещает вам изготавливать оцифрованную версию этой книги или хранить на своём компьютере где-либо взятую оцифрованную версию, если только вы сами не купили электронную книгу у издательства, дополнительно к бумажному экземпляру.
Новые поколения требуют новые варианты и новые технологии. Сейчас популярные электронные книги. Которые распространяются между потребителями в сети и на сьемных носителях.
Многие отдают оцифровку своих фондов сторонним компаниям, однако есть и те, кто приобретает сканер или фотоапарат и занимается этим самостоятельно.
Как же это делается? Точнее откуда, кем и как рождается электронная книга? Давайте разберемся в этом вопросе. Попробуем с вами создать электронную книгу. Точнее не создать, а оцифровать уже существующие издания, которые мы имеем в бумажном виде.
Лучше всего - если уж возможно и не жалко, все страницы отрезать или расшить и тогда просканировать. Пропадает проблемма затемнения при развороте близ корешка книги и больше удобств при сканировании. Так и исчезает проблемма зажима при перелистивании страниц. Особенно удобно при многостраничных фолиантах, когда имеем дело с двусторонним сканированием.
У приведенного способа есть один очень большой плюс - он меньше влияет на состояние книги. Для современной новой печатной продукции это неактуально. Вот для старой - очень даже потому что сканирование планшетным сканером книга бы не пережила.
Сначала мы с вами определимся - имеем работу со сканером или с фотоапаратом. Даваейте сначала поговорим о работе с фотоапаратом. Потом уже и с работой принтеров.
Кажется что при современных навороченных фотоаппаратах проблем не должно быть. Ведь даже и школьник имеет моб.тел. с фотокамерой. В чем же проблемма? А вот - высокачественны фотографии иллюстраций требует и высокого разрешение. Можно и на весу держать фотоапарат, но лучше из старого фотоувеличителя сделать небольшую установку. Штатив и кронштейн - чтобы можно было регулировать положения камеры. Все это подгоняем к своему фотоапарату (размер, крепление, положение, отверствия и прочее). Все это подгоняем к вашему аппарату. То есть к цыфровой камере или смартфону или что там у вас есть. Зафиксируйте экспозицию, баланс белого, фокус, зум и проч. в вашей камере, чтобы все кадры ничем не отличались по освещенности, цвету и проч.
Делаем нужное освещение, желательно мягкий рассеяный свет. Не забывая о том что некоторые лампи могут дать неправильный оттенок или отблеск на страницах.
После всех процедур установки сьемочного устройства нужно правильно уложить и закрепить книгу. То есть правильно развернуть страницы и закрепить их. Можно использовать их закрепление на столе. Так чтобы мы могли их перелистывать, не нарушая расположении самой книги. Перевернутые и развернутые изображение или текст не нужно сейчас исправлять, это сделаем потом. При обработке картинок.
Если раскрывать страницы стеклом, положенным сверху. Тогда источник света должен быть сбоку, чтобы не было засветки. В идеале нужно книгу раскрывать на 90-120 градусов, но при этом каждая страница сканируется отдельно. Иногда неправильное освещение или угол сьемки искажает картинку, которая под ним. Что очень важно при дальнейшем использовании при обработке сканов. Так же можно, по возможности, и удалить какие то пометки, переломы, грязь из страниц.
Если мы будем работать со сканером, посмотрим на то что у нас есть. Можно кроме обычного сканера использовать планетарный сканер. Но это уж затратный и с искажениями. Книжный сканер на основе ЦФК делает работу приятнее и намного легко. Этот экзотический вариант более подходит для больших библиотечных архивов. Ведь здесь нужно постоянно следить за настройками. Хотя он отлично и качественно делает свою работу.
Работая с сканером мы придерживаемся почти таких же требований как и с при работе с фотоапаратом. То есть правильно разворачиваем книгу, размещаем книгу и листаем страницы. Следует помнить то, что сканер рассчитан на сканирование расшитых документов не превышающих формат А4. Иногда книги большого размера, что становится проблематично при сканировании (при расшитых страницах можно их сложить и вложить в сканер и избавится от затемнения при развороте близ корешка книги и прочих ошибок). Ну и постоянное открытие и закрытие крышки самого сканера раздражает.
Имея все сканы книги, то есть обложки и страниц с текстом и иллюстрациями сохраним их. Подключив сьемочной аппарат к компьютеру. Желательно просмотреть все перед сохранениям. Чтобы исправить огрехи на месте. То есть пропущенные страницы, нечеткие изображения, сдвиги и прочие браки. Не меняя положения камеры, освещения и самой книги.
Вот теперь и пришло время и оцифровать, распознать, вычитать и сконвертировать нашие фотографии. Но сначала нужно хорошо обработать все фотографии. На этом этапе нам необходимо принять четкое решение - хотим ли мы оставить книгу в виде изображений - наиболее легкий пусть, или создать файл книги в текстовом формате с возможностью редактирования.
Сначала разберемся с правильной обработкой картинок. То есть с помощью программ мы с вами исправим ориентации, разрежем страницы, компенсируем наклон, выберем полезные области, определим поля, исправим цвета, некоторые браки при сканировании. Короче, приведем все в приличный вид. Подготовимся к дальнейшему етапу оцифровки.
Если вам не нужно делать текстовый файл время остановится. Так и для технических книг, где важны всякие иллюстрации где графики, диафрагми и чертежи.
Теперь достаточно переформатировать сканы-картинки в формат DjVu или PDF c помощью некоторых компьютерных программ.
Для текстовых файлов мы должны иметь программу для распознавания текста с картинок. Вот здесь нужно будет немного потрудится. Ведь даже при хорошем скане текст не всегда распознается. Обратите внимание на разрешение и оформления скана. Нужно учитивать и язык текста и наличия терминов. Так же и быть внимательным к рукописным символам (книга или каталог с рукописными пометками). Так же и сканы иллюстраций. Иногда текст в иллюстрации распознается и неверно обробляется программой. Поэтому нужно по возможности изьять из распознавания картинки с текстом (иллюстрации, графики или чертежи и подобное). Такое лучше оставить в виде картинки, потом вставить в готовый текст.
После распознавания нужно проверить и оформить все. Вычитать текст на предмет ошибок, вложить на свои места иллюстрации, подправить заголовки, сноски, колонтитулы и прочее оформления и правки. Все это делаем в текстовом редакторе. И после этого начинаем конвертировать в нужный нам формат. Следует помнить что не все форматы могут восприниматся всеми устройствами и всеми системами. По своей сути нет идеального формата, так как каждый из них имеет свои плюсы и минусы.
Вот небольшой пересчет и описание более популярных форматов в которые можно перевести книги. Здесь же не все варианты, но самые популярные и используеми частейше.
EPUB
Тип файла - Open eBook - Категория Data
Описание Цифровая электронная книга. Формат базируется на XML для электронных книг и публикаий. Стандартный формат цифровых публикаций для издателей и потребителей. Представляет собой zip-архив с html-страницами, а иногда и со встроенными шрифтами, аудио-видео. Открывается в приложениях, поддерживающих формат, и некоторых устройствах (Amazon Kindle, Sony Reader).
Чем открыть
Windows Adobe Digital Edition, Lexcycle Stanza, Mobipocket Reader Desktop, FBReader, dotReader, calibre
Mac Adobe Digital Editions, Lexcycle Stanza, FBReader, calibre
Linux FBReader, dotReader.
MOBI Mobipocket eBook
Mobipocket книга хранится в формате MOBI и прикреплена с расширением MOBI файла и используется Mobipocket. Эти MOBI файлы обычно классифицируются как файлы данных, которые содержат цифровую электронную книгу на основе стандарта Open книга в формате XHTML включительно JavaScript, текст, изображения, и кадров. MOBI файлы могут также иметь расширение файла КНР и может быть либо защищен DRM или не формат DRM. КНР файлы специально используется системой PalmOS или устройств Palm Pilot КПК. Эти reflowable файлы можно читать с помощью Mobipocket Reader, установленный в КПК, который позволяет читателям поставить Highlights, закладки, исправления, заметки и рисунки в любой части книги. Этот читатель в полноэкранном режиме включает в себя электронные закладки, полный способность текстового поиска и встроенный словарь. Формат Mobipocket книга уже прекращено в январе 2012 года. Программное обеспечение Калибр и Geometer Плюс FBReader может использоваться в Mac OS, Linux и Microsoft Windows систем, основанных на доступ и просмотр MOBI файлы.
DJVU
Тип файла - DjVu Image - Категория Image
Описание Формат сжатых изображений, разработанный компанией AT&T и распространяемый фирмой LizardTech. Создан, чтобы сканировать цветные страницы книг, журналов, каталогов и т.д. с высоким разрешением и публиковать их в Интернете. Формат DjVu позволяет сжать цветные документы в 5 – 10 раз больше, чем форматы JPEG и GIF, и в 3 – 8 раз больше, чем формат TIFF для черно-белых изображений. DjVu произносится как «дежа вю».
Чем открыть
Windows WinDjView, Lizardtech DjVu Solo
Mac MacDjView
DOC
Тип файла - Microsoft Word Document - Категория Text
Описание Текстовый документ, созданный в программе Microsoft Word – наиболее популярном текстовом редакторе. Может содержать форматированный текст, изображения, таблицы, графики, схемы, размеченные страницы и настройки печати.
Чем открыть
Windows Microsoft Word, Microsoft Word Viewer, OpenOffice.org Writer, Nuance OmniPage Professional 17
Mac Microsoft Word, Apple Pages, Apple AppleWorks, OpenOffice.org Writer, Nuance OmniPage Pro X
Linux OpenOffice.org Writer
Тип файла
WordPad Document
Категория Text
Описание Текстовый файл, созданный в программе Microsoft WordPad.
Чем открыть
Windows Microsoft WordPad
Mac Microsoft Word
FB2
Открытый формат, основан на XML. Основное преимущество FictionBook(fb2)– возможность без труда создавать (в том числе и автоматически) книги в этом формате из файлов всех популярных текстовых форматов (*.txt, *.doc, *.rtf. *.html и пр.). Кроме того, FictionBook поддерживается большинством распространенных программ и устройств для чтения книг.
Описание Формат электронной книги, разработанный в России. Чтобы описать каждый элемент электронной книги, используется XML. Изначально создан для фантастики. Читается различными программами, в том числе на Pocket PC.
Чем открыть
Windows HaaliReader for Windows, FBTools, FB Writer, Cool Reader, BookDesigner, Athenaeum, Any to FB2
Linux PyBookReader, OrnamentBook, Okular
PDF
PDF (Portable Document Format) - это формат для электронных документов, чаще текстовых, созданный фирмой Adobe Systems.
Предназначен для представления документов вне зависимости от ОС, аппаратного и программного обеспечения.
С помощью .PDF-файлов обычно распространяются книги, журналы, анкеты, инструкции, рекламные буклеты, техническая документация, чертежи.
Каждый документ .PDF может включать в себя текст, шрифты, векторные и растровые изображения, формы и мультимедиа-вставки а также другую информацию, необходимую для его отображения.
Также поддерживается защита документа паролем и шифрование, цифровая подпись, гиперссылки, прозрачность, слои.
Для создания и редактирования файлов PDF обычно используют программу Adobe Acrobat, а для чтения и просмотра - бесплатные Foxit Reader, STDU Viewer, Adobe Reader и многие другие.
TXT
Файлы с расширением .txt представляют собой файлы, содержащие неформатированный универсальный текст. Эти файлы могут быть созданы практически в любом текстовом редакторе, однако формат TXT не поддерживает такие возможности и функции, как работа с таблицами, графиками, выделение текста жирным шрифтом или курсивом.
Файлы, зафиксированные в формате TXT, структурированы в виде ряда текстовых строк, и считаются универсальными. Вы можете открыть такой файл почти на всех операционных системах, включая мобильные устройства.
Среди популярных приложений, использующих документы с расширением .txt, можно упомянуть Блокнот и TextEdit.
Какой программой открыть файл с раширением TXT
Free File Viewer, eType Application, PSPad, NFOPad, EmEditor
TIF
Тип файла - Tagged Image File - Категория Image
Описание Формат графических изображений высокого качества. Используется для хранения многоцветных изображений, таких как цифровые фотографии. Сокращенное название от TIFF. Поддерживает слои и многостраничные документы. TIF-файлы могут сохраняться без сжатия или с сжатие JPEG. Также можно использовать сжатие LZW, которое уменьшает размер TIF-файла без потери качества.
Чем открыть
Windows CorelDRAW Graphic Suite X4, Corel Paint Shop Pro Photo X2, Microsoft Windows Photo Gallery Viewer, Adobe Photoshop CS4, ACDSee Photo Manager 2009, ACD Systems Canvas 11, Nuance PaperPort 12, Nuance OmniPage Professional 17, Roxio Creator 2010, The Logo Creator 5
Mac Apple Preview, Adobe Photoshop CS4, Nuance OmniPage Pro X, Roxio Toast 10 Titanium, The Logo Creator 5
CHM
Тип файла - Compiled HTML Help File - Категория Web
Описание Консультативная документация, собранная и сохраненная в сжатом формате HTML; может включать в себя текст, изображения и гиперссылки; доступна для просмотра в Интернет браузере; используется и другими программами как центр онлайн справки. Примечание: Некоторые файлы CHM могут открываться с помощью Интернет браузера, в то время как другие открываются только с помощью CHM редактора или программ дял просмотра CHM файлов.
Чем открыть
Windows xCHM, Help Explorer Viewer, Internet Explorer или Firefox, например, Интернет браузер, ChmDecompiler, Dawningsoft PowerCHM, Help Software WinCHM, GridinSoft CHM Editor или CHM Decoder
Mac Safari или Firefox, например, Интернет браузер, xCHM, CHM Viewer, Chmox
Linux xCHM, Help Explorer Viewer
HTML
Тип файла - Hypertext Markup Language - Категория Web
Описание Веб-страница закодированная в HTML, который может быть выведен на экран в Веб-браузере; форматирует текст, таблицы, изображения, и другой контент, выведенный на экране в странице; у большинства страниц в пределах статических веб-сайтов есть ".html" расширение. Исходный код HTML проанализирован браузером и обычно не заметен пользователю. Если Вы хотите просмотреть HTML веб-страницы, выберите " View Source " из меню браузера «View». Так как файлы HTML сохраняются в стандартном текстовом формате, они могут быть открыты и отредактированы основным текстовым редактором.
Чем открыть
Windows Any Web browser, W3C Amaya, Adobe Dreamweaver CS5, Adobe ColdFusion Builder, Microsoft Visual Web Developer, Microsoft Visual Studio 2010, Any text editor
Mac Any Web browser, Adobe Dreamweaver CS5, Adobe ColdFusion Builder, W3C Amaya, KompoZer, Any text editor
Linux Any Web browser, Any text editor, W3C Amaya, SCREEM