Такие последовательности называются предопределенными сущностями.
Список таких символов в FictionBook крайне мал. Их, собственно, всего три.
& — &;
< — <;
> ; — >;
Cтандартные сущности XML ' и " в FiсtionBook не используются и конвертируются в символы «'» и «"» соответственно.
§ 2.14 Список атрибутов элементов
Многие элементы в FictionBook имеют дополнительные параметры — атрибуты.
Атрибут align
Выравнивание текста в ячейке таблицы.
Используется в элементах: td, th, tr
Значение: фиксированное; left, right, center, justify
Значение по умолчанию: left
Атрибут alt
Назначение аналогично HTML — текст, отображающийся вместо картинки.
Используется в элементах: image
Значение: произвольная текстовая строка
Атрибут colspan
Позволяет объединять столбцы таблиц.
Используется в элементах: th, td
Значение: произвольное целое число
Атрибут content-type
Определяет тип содержимого элемента-контейнера binary
Используется в элементах: binary
Значение: фиксированное; image/png, image/jpeg, image/tiff, image/bmp, octet-stream
Атрибут create
Назначение неясно.
Используется в элементах: output-document-class
Значение:
Атрибут currency
Валюта, в которой определена цена платной книги.
Используется в элементах: output
Значение: ограниченно-произвольное
Атрибут href
Ссылка. Как правило, внутри документа.
Используется в элементах: a, image
Значение: ссылка.
Атрибут id
Метка, позволяющая ссылаться на элемент.
Используется в элементах: annotation, binary, cite, epigraph, image, p, poem, section, subtitle, table, td, text-author, th
Значение: текстовая строка.
Атрибут info-type
Характеризует произвольную информацию.
Используется в элементах: custom-info
Значение: произвольная текстовая строка.
Атрибут include
Назначение неясно.
Используется в элементах: part
Значение:
Атрибут include-all
Назначение неясно.
Используется в элементах: output
Значение: фиксированное
Атрибут match
Определяет степень соответствия произведения выбранному жанру.
Используется в элементах: genre
Значение: целое число в диапазоне от 1 до 100
Атрибут mode
Способ вывода платного документа
Используется в элементах: output
Значение:
Атрибут name
Позволяет присвоить элементу имя. В отличие от метки (id), имя элемента используется исключительно программными средствами обработки документа.
Используется в элементах: body, sequence, output-document-class
Значение: произвольное
Атрибут number
Порядковый номер книги в серии.
Используется в элементах: sequence
Значение: произвольное целое число
Атрибут price
Цена платного документа
Используется в элементах: output-document-class
Значение: произвольное число c плавающей запятой
Атрибут rowspan
Позволяет объединять строки таблицы.
Используется в элементах: th, td
Значение: произвольное целое число
Атрибут style
Позволяет выбрать для элемента предопределенный стиль.
Используется в элементах: p, subtitle, table, td, text-author, th
Значение: произвольное; строка состоящая из латинских букв и цифр.
Пример:
<p style="text-align: right">Текст, выровненный по правому краю<p>
<p style="background-color: black; color: white; margin-left: 20%; margin-right: 20%; margin-top: 10px; margin-bottom: 10px; line-height: 180% ">Текст: фон черный, цвет шрифта белый, отступы справа и слева 20 процентов, сверху и снизу — 10 пикселей, высота строки 180 процентов</p>
Атрибут title
Позволяет добавить к рисунку заголовок (подпись)
Используется в элементах: image
Значение: произвольная текстовая строка
Атрибут type
Определяет тип элемента.
Используется в элементах: a, stylesheet
Значение: фиксированное (текстовая строка) обычно «note» для элемента a и «text-css» для stylesheet
Атрибут value
Дата.
Используется в элементах: date
Значение: произвольная дата в формате YYYY-MM-DD
Атрибут xmlns
Ссылка на спецификацию формата.
Используется в элементах: FictionBook
Значение: жестко фиксированное (URL) обычно: http://www.gribuser.ru/xml/fictionbook/2.0
Атрибут xmlns:l
Ссылка на общую спецификацию формата.
Используется в элементах: FictionBook
Значение: жестко фиксированное (URL) обычно: http://www.w3.org/1999/xlink
§ 2.15 Алфавитный список всех элементов FictionBook 2.1
a (§ 2.11)
annotation (§ 2.5)
author (§ 2.5)
binary (§ 2.3)
body (§ 2.3)
book-name (§ 2.5)
book-title (§ 2.5)
cite (§ 2.8)
city (§ 2.5)
code (§ 2.11)
coverpage (§ 2.5)
custom-info (§ 2.4)
date (§ 2.5)
description (§ 2.3)
document-info (§ 2.4)
email (§ 2.6)
emphasis (§ 2.11)
empty-line (§ 2.8)
epigraph (§ 2.7)
FictionBook (§ 2.3)
first-name (§ 2.6)
genre (§ 2.5)
history (§ 2.5)
home-page (§ 2.6)
id (§ 2.5)
isbn (§ 2.5)
image (§ 2.7)
keywords (§ 2.5)
lang (§ 2.5)
last-name (§ 2.6)
middle-name (§ 2.6)
nickname (§ 2.6)
output-document-class (§ 2.12)
output (§ 2.12)
p (§ 2.8)
part (§ 2.12)
poem (§ 2.8)
program-used (§ 2.5)
publish-info (§ 2.4)
publisher (§ 2.5)
section (§ 2.7)
sequence (§ 2.5)
src-lang (§ 2.5)
src-ocr (§ 2.5)
src-title-info (§ 2.4)
src-url (§ 2.5)
stanza (§ 2.9)
strikethrough (§ 2.11)
strong (§ 2.11)
style (§ 2.11)
stylesheet (§ 2.3)
sub (§ 2.11)
subtitle (§ 2.8)
sup (§ 2.11)
table (§ 2.8)
td (§ 2.10)
text-author (§ 2.9)
th (§ 2.10)
title (§ 2.7)
title-info (§ 2.4)
tr (§ 2.10)
translator (§ 2.5)
v (§ 2.9)
version (§ 2.5)
year (§ 2.5)
Часть III
Конвертирование книг из других форматов
Cлучаи, когда книга готовится в формате FictionBook изначально, (как вот эта книга :) ) чрезвычайно редки. Обычно имеется готовый текст, который необходимо конвертировать в формат FictionBook.
Вообще, создание книги в формате FictionBook можно разделить на три этапа.
1) подготовка исходного текста;
2) конвертация текста в формат FictionBook;
3) вычитка, структурирование и окончательная доводка книги.
Первый этап включает набор текста или сканирование исходного документа с распознаванием. Или же выдирание текста из PDF, или, какого-нибудь экзотического формата, например, ExeBook. Также сюда входит первичная вычитка текста.
Второй этап — конвертация в формат FB2.
Третий этап — доводка книги. По моему скромному мнению, самый тонкий и важный этап.
Дело в том, существующие программные средства позволяют конвертировать документы txt, html, doc(rtf), что называется «одним кликом». Но, к сожалению, качественный FB2 таким образом создать совершенно невозможно. После конвертации такую книгу приходится загружать в редактор и доводить до ума вручную.
Использование автоматической конвертации без последующей доводки допустимо только в том случае, если текст конвертируется исключительно для того, чтобы закачать на КПК, прочесть и удалить.
Но если книгу планируется выкладывать в Сеть, или распространять еще каким-то образом, то изготавливать ее «одним кликом» совершенно недопустимо. Не забывайте, что в этом случае, как бы еретически это ни звучало, вы фактически являетесь ИЗДАТЕЛЕМ книги. Проявите же уважение к автору и читателям.
Распознавание и подготовка исходного текста — это тема для отдельной книги, поэтому здесь углубляться в нее не будем. Предположим, что исходный текст у вас уже есть. О редактировании и доводке книги будет подробно рассказано несколько ниже. Сейчас же речь пойдет именно о конвертировании текстов.
§ 3.1 Требования к исходному тексту