Мои алгоритмы работы с FR11
August 4th, 2012 golma1
Последнее время часто стали возникать вопросы по поводу работы с ФР. Я много раз описывала свои методы - в личке, в форуме.
Сейчас решила собрать все советы в своём блоге.
Никого не собираюсь переубеждать, не буду тратить время на доказывание, что мой метод лучше какого бы то ни было другого; просто делюсь своими наработками - вдруг кому-нибудь пригодится? На вопросы по содержанию с удовольствием отвечу.
Я большой приверженец работы с ФР. С хорошими исходными файлами он позволяет максимально подготовить текст для экспорта сразу в fb2.
При таком экспорте решается сразу несколько важных проблем:
- диалоги сохраняют начальное тире, хотя в ФР после них стоят знаки табулятора (список/перечисление)
- сохраняется форматирование курсивом/полужирным
- никаких "мягких" переносов
- возможен экспорт картинок. Это, правда, половинное преимущество, поскольку картинку всё-таки хорошо бы обработать. Но, во-первых, обрабатывают картинки не все верстальщики, а во-вторых, сразу видно место, где они должны находиться.
Текст во многом писался для друзей, поэтому периодически встречается обращение на "ты".
После распознавания сохраните документ ФР.
Продолжение:
Файл fb2, полученный из FR11
Перед тем как начать работать с текстом, уделите две минуты редактору стилей.
1. Измените размер шрифта у всех сносок на 7 (к примеру, размер каждый может выбрать удобный для себя; важно, чтобы он зрительно отличался от размера основного шрифта). Можно объединить все стили "Сноска" в один, но тогда будьте готовы к тому, что курсив кое-где придётся изменять вручную. Визуальное различие очень важно, поскольку ФР11 иногда распознаёт текст в нижней трети страницы как сноску, если он отделён пустой строкой или "звёздочками" от остального текста. Если в тексте встретится такой фрагмент, скопируйте его в блокнот (для удаления всех типов форматирования), а потом из блокнота скопируйте обратно в ФР. Проследите, чтобы курсор в этот момент стоял в месте, отмеченном стилем "Основной текст" - тогда и вставленный текст будет в этом стиле. Если во фрагменте были курсив/болд, восстановите.
2. Измените размер шрифта у всех стилей "Основной текст" на 10. Не рекомендую их объединять, поскольку при этом наверняка потеряются курсив и болд.
3. Объедините все стили "Колонтитул", придав им тоже размер 7.
4. Объедините все стили "Заголовок", придав им размер 24.
5. Если встречается стиль "Оглавление", придайте ему размер 28, а также болд и курсив. Этим вы обезопасите себя от очень неприятного бага ФР11, когда часть диалога распознаётся как оглавление и не передаётся в fb2. Если в тексте встретится такой фрагмент, скопируйте его в блокнот (для удаления всех типов форматирования), а потом из блокнота скопируйте обратно в ФР. Если во фрагменте были курсив/болд, восстановите.
6. Для стиля "Подписи к картинкам" проделайте то же, что и для "Оглавления", хотя это не так критично, поскольку этот стиль передаётся при экспорте в fb2.
Работа с распознанным текстом
Неуверенно распознанные символы выделяются? Проверка правописания включена? Это - твои реперы. Двигаешься по ним.
Слева - "Крупное изображение", выставь приятный глазу размер. Если позволяет монитор, так, чтобы видеть всю страницу.
Справа - "Текст". Я делаю "по ширине" (внизу значок с горизонтальной стрелкой <-->) и уменьшаю потом до комфортного размера.
Листать кнопкой... ээээ... у меня она в переводе называется "картинка (экран)". То есть, сначала видно верхняя половина страницы, а после нажатия на кнопку - нижняя. Если листать постранично - Alt+ стрелка вниз/вверх.
Глазами ищешь голубой фон (неуверенно распознанные знаки) и красную черту (ошибка). Всё, что не ошибка, игнорируешь. Спорные места сличаешь с картинкой в "Крупном изображении". Нужное - исправляешь. При хорошем скане исправлять надо немного.
При этом ставишь (если пользуешься) служебные знаки - для пустой строки, например. Или для стихов, цитат и пр. ФР 11 понимает форматирование от руки, т.е. если где-то пропущен болд/курсив, можно просто отметить, при экспорте переймётся. Но! При экспорте переймётся и неверно распознанный болд/курсив. Поэтому, если замечаешь, исправляй.
Запятые вместо точек в прямой речи удобнее исправлять скриптом в ФБЕ - быстрее, во всяком случае.
Если сносок не слишком много, я их переношу к слову и ставлю в фигурные скобки. Потом в fb2 одним кликом расставляю. Важно следить, чтобы скобки не были выделены болдом/курсивом.
Сноски ФР11 умеет переносить, но, к сожалению, небезошибочно. Однако при большом количестве сносок имеет смысл поручить ФР их расставить при экспорте, а потом пролистать ещё раз книгу, сравнивая только порядок сносок. При обнаружении пропущенных - добавить. При этом важно поискать их текст в уже готовом fb2-файле: иногда он оказывается в конце книги, иногда отсутствует, иногда обнаруживается после текста страницы.
Добавлю.
Просмотр неуверенно распознанных символов очень важен. Если вы не собираетесь вычитывать книгу, только он поможет найти ошибки типа "передним" вместо "перед ним", "подлинным" вместо "по длинным", "зашита" вместо "защита".
Много подобных сочетаний собрано в скрипте "Поиск по регэкспам" в ФБЕ, но далеко не все. Поэтому чем тщательнее вы просмотрите текст, тем меньше ошибок он будет содержать.
Служебные знаки
Бывает такое, что абзац разрывается в конце страницы как раз на точке. То есть:
Цитата:
Вдали виднелись дома. [новая страница]Он рванулся к ним.
Такое место никакими скриптами, естественно, не ловится. Найти ошибку может только опытный вычитывальщик, сравнив это место с оригиналом.
Во избежание такой ошибки все такие места я помечаю (###) в начале следующей страницы, в нашем случае перед "Он рванулся..."
Потом, в FBE, прохожусь поиском и объединяю разорванный абзац.
Пустые строки ФР "съедает". Раньше я отбивала их двумя пустыми строками, одну из которых потом убирал скрипт "Заголовки, подзаголовки". Потом Tanja45 рассказала, что ставит вместо пустой строки знак (===), который потом после запуска того же скрипта убирает массовой заменой.
На прежних версиях это было особо актуально, потому что ФБЕ периодически "схлопывал" все пустые строки, а этот способ позволял их сохранить до последнего момента.
Сейчас такого не наблюдается, но привычка осталась. На всякий пожарный.

Важно: если вы делаете служебную пометку вместо пустой строки, не добавляйте ещё пустых строк рядом. Иначе получится двойная пустая строка: сначала скрипт оставит одну, затем добавится ещё одна после массовой замены пометки на "ничего".
Стихи и цитаты я отбиваю с двух сторон знаками ###.
При работе уже в fb2 при поиске разорванных абзацев (тот же служебный знак) форматирую стихи и цитаты.
Проверка текста
Насчёт неуверенно распознанных знаков я уже писала, добавлю пару слов по поводу слов, подчёркнутых как ошибка.
В самом начале любого текста выделяются подчёркиванием неизвестные ФР имена. Если это распространённое имя, типа Джимми и пр., имеет смысл занести его в словарь. Если какое-то не слишком часто встречающееся или имеющее различные написания (Дэнни и Денни, например), лучше воспользоваться опцией "пропустить все". Для этого щёлкнуть ПКМ по слову и выбрать соответствующую строку. Страниц через 30-40 вам наверняка попадутся все формы имени, если оно склоняется.
А это значит, что на последующих страницах подчёркиваться они не будут, и просмотр пойдёт значительно быстрее.
Ремарка: всё подряд кликать и нажимать "пропустить всё" может оказаться обременительным. Может быть такое, что название города один раз мелькнуло и больше нигде не встретится. Я отмечаю имя собственное, когда встречаю его второй-третий раз на протяжении 3-5 страниц. Иначе времени на щёлканье тратится больше, чем на просмотр.

То же самое относится к "спецсловам", что особенно актуально в жанре фантастики.
update:
Иногда полезно сразу сделать "массовую замену". Например, действующее лицо "Китс" периодически (или постоянно) распознаётся как "Ките". Не забудьте только при "заменить все" поставить "галочку" на "Учитывать регистр".
Для более тщательной замены (чтобы, например, "Китель" не превратился в "Китсль") можно это проделать несколько раз: с пробелом после слова, с точкой, с запятой. Но, как правило, это не нужно. Принимать же окончательное решение следует в каждом конкретном случае.
После того как вы просмотрели все страницы в ФР (поначалу быстро не будет, да и не надо; но со временем дело пойдёт значительно быстрее, поверьте), поищем склеенные абзацы.
ФР11 склеивает реже, чем ФР10 (который в своё время был в этом смысле на порядок лучше ФР9), но всё же...
А это значит, что шары не будет, придётся проверить.
Кому интересно, рассказываю (ещё раз) о методе ТаКира.
С начала файла пройтись поиском:
.^l
!^l
?^l
:^l
»^l
При этом следить за курсором в окне "Крупное изображение" (благо, в ФР11 он теперь отображается). Для наглядности можно включить непечатаемые символы - значок ¶ в правом углу окна "Текст".
Если курсор стоит в конце
абзаца в окне "Крупное изображение", это ошибка - мы ведь задали поиск конца
строки и нашли его в окне "Текст".
Исправляем, ставя курсор в нужное место и нажимая Enter.
Ремарка.
Поиск с точкой - самый долгий, на книге большого объёма может быть весьма утомительным, а учитывая редкость ошибок ФР11, зачастую - бесплодным. Поэтому для полуперфекционистов достаточно пройти всеми остальными вариантами поиска и, если ничего не обнаружится, считать, что и с точкой был бы такой же результат.
Больным же на голову Перфекционистам же придётся искать по всем вариантам. Раз встречается, должно быть выявлено и устранено.
update 2:
Пропустила очень важный момент. Тоже совет
ТаКира.
Перед поиском склеенных строк уберите переносы.
Курсор - в начале файла.
Замена:
- в "Поиск": дефис и разрыв строки
- в "Заменить на": мягкий перенос и разрыв строки
Специальные знаки можно вставить, нажав на стрелочку рядом с окошком:
Пройдитесь по всему тексту, делая замену в нужных местах. В словах типа "где-нибудь" оставляйте дефис, нажимая "Следующее".
Пусть вас не пугает пробел рядом с дефисом. При экспорте в fb2 он не учитывается, а при замене заменяется вместе с дефисом.
Эта замена уменьшает количество слов с (ненужными) дефисами, проверить которые следует уже в fb2-файле при помощи опции "Слова" (см. пункт меню "Сервис").
Разорванные абзацы
Разорванные абзацы были бы не слишком большой проблемой (учитывая наличие специального скрипта в ФБЕ), если бы ФР в своей текущей версии не разрывал абзацы на строке, в конце которой стоит точка. Скрипт этого не видит, что логично.
Благодаря поддержке
niksi и
Ronja_Rovardotter получилось вывести некую закономерность:
Чаще всего такой разрыв случается в абзаце после диалога, если первая строка кончается точкой. Довольно часто бывает, что разрывается строка, следующая за склеенной (см. выше; имеет смысл при исправлении склеенных строк сразу смотреть, нет ли разорванного абзаца сразу после них).
Способа (полу)автоматического поиска я так и не нашла. Поэтому просматриваю текст ещё раз - с
выключенными (!) неуверенно распознанными символами (чтобы не отвлекали), но обязательно с включёнными непечатаемыми знаками (которые и являются предметом поиска).
Уменьшаю размер страницы "Текст" так, чтобы видеть сразу всю страницу и листаю. Обращаю внимание на два идущим один за другим знака ¶ в строках, где они стоят близко к правому краю страницы (см. скриншот). При навыках получается довольно быстро. Сложности возникают только в диалогах с репликами длиной в одну строку. Но и этому быстро научаешься.
Теперь можно экспортировать документ ФР в fb2.
Выбирайте "Сохранить как fb2". В открывшемся окне в правом нижнем углу есть кнопка "Опции".
Заполняем (если хотим) "Название" и "Авторы" (автоматически перейдут в нужные поля дескрипшена), выбираем оформление "Форматированный текст".
Для внесения имени автора нужно нажать кнопку с тремя точками - откроется дополнительное окно.
Если есть картинки и мы хотим их сохранить, ставим "галочку" в "Сохранять картинки" и выбираем "Высокое качество" (если собираемся их потом обрабатывать) или "Небольшой размер" (если устраивает полученный результат). Для знатоков есть опция "Пользовательское".
Ок, сохранить.
Заготовка fb2 готова. В ней есть все тире в диалогах, все (а иногда даже лишние) курсивы и болды, и, если со стилями всё было правильно распознано, заголовки секций.
Кстати, насчёт лишних курсивов и болдов: я просматриваю файл с помощью скрипта "Обзор элементов", опции emphasis и bold. Если Вы видите тире или "— Я" в списке, с большой долей вероятности - это ошибка. Выбрав все такие места их легко превратить в простой текст одним нажатием кнопки.
Но тут речь уже идёт о работе с файлом fb2, и это уже совсем другая тема.