sábado, 24 de septiembre de 2011

ePub accesibles

Índice

¿Qué es un ePub?

ePub (Electronic Publication) es un formato de código abierto para la creación y distribución de libros electrónicos (e-books) que se adapta a los diferentes tamaños de pantalla de los eReader del mercado y que se está convirtiendo en el estándar más aceptado.

Fue un hito hace dos años cuando Google Books comenzó a ofrecer más de un millón de libros no sólo en formato PDF sino también en formato ePub

Menú de Google Books que permite descargar un libro en PDF o ePub

Un fichero .epub es un contenedor comprimido con archivos XML y XHTML. Si renombras el fichero como .zip podrás ver que contiene un directorio OPS con los ficheros CSS, HTML (XHTML 1.1 que no pueden contener formularios, mapas de imagen, eventos o scripts) y las imágenes (admite JPG, PNG, GIF y SVG).

En el fichero “content.opf” se incluyen los metadatos con Dublin Core (siendo obligatorio definir el lenguaje y el título), el inventario de contenidos y el orden en el que se muestran. En “toc.ncx” se incluye la tabla de contenidos para el dispositivo de lectura mejorando así la accesibilidad del libro.

Vista de los ficheros que contiene un ePub vista con Sigil

Estructura de un ePub vista con Sigil

Puedes consultar la descripción detallada de los elementos que componen un ePub en “Taller de creación de documentos ePub” de APEI

¿En qué dispositivos puedo leer un ePub?

Puede leerse en casi todos los dispositivos de lectura electrónica (eReaders) de forma nativa, a excepción de Kindle de Amazon, sin embargo pronto lo admitirá también [1], entonces podremos afirmar que es el formato generalizado de los e-books. Incluso eReaders antiguos se han actualizado vía firmware para poder leer ePub.

También podemos leer un ePub en otros dispositivos (ver lista completa de todos los lectores de e-books para los diferentes dispositivos):

Al estar basado en HTML tampoco hay mucha dificultad para verlos con un navegador web. Por ejemplo, podemos instalar el complemento EPUBReader para Firefox  o por ejemplo el complemento MagicScroll Ebook Reader para Chrome.

También existen sitios para leer libros ePub en línea como bookworm 

¿Cómo creo un ePub?

Desde 2008 InDesign permite generar ePub, se puede consultar el vídeo “Creating an iBook (ePUB) for the iPad with InDesign CS5”  o la guía “Making eBooks from InDesign (PDF, 4 MB)”, de InDesign Magazine nº32

Primera pestaña de la exportación a ePub de InDesign

Segunda y tercera pestaña de la exportación a ePub de InDesign

Exportación a eBook de InDesign

Atlantis Word Processor es un editor para Windows que permite guardar en formato ePub. Está disponible en versión portable.

Menú Guardar de Atlantis que admite guardar como ebook

Pantalla de opciones de la exportación a eBook de Atlantis

Exportación a eBook de Atlantis Word Processor

Recomiendan utilizar la plantilla “eBook.rtf”. Se pueden consultar otras recomendaciones en Atlantis Word Processor Online Help: eBooks

Pero también podemos crear un ePub desde un fichero ya existente: PDF, ODT, DOC, HTML, etc. con los siguientes programas:

dotePub

Es una extensión que permite crear un ePub desde una página web. Es compatible con Chrome, Firefox, Safari u Opera. Se puede ver cómo funciona en el vídeo Installing and using the dotEPUB bookmarklet

QualityEpub

Es un programa gratuito para Windows que permite generar un .epub a partir de un documento Word.

ToDoEpub

Es un programa gratuito para Windows escrito en.NET, que permite generar un .epub a partir de un documento HTML. También tiene opciones simples de edición.

Pantalla de edición de ToDoEpub

Pantalla de edición de ToDoEpub

GrabMyBooks

Es una extensión para Firefox que nos permite crear libros electrónicos en formato .epub a partir de páginas web. Cada una de las páginas que vayamos guardando se acumulará dentro de un libro que luego podremos guardar en nuestro disco.

Gammata Conversor

Podemos convertir un HTML, DOC o PDF a EPUB

Pantalla principal de Grammata Conversor

Pantalla principal de Grammata Conversor

Calibre

Los formatos de entrada que admite son: CBZ, CBR, CBC, CHM, EPUB, FB2, HTML, HTMLZ, LIT, LRF, MOBI, ODT, PDF, PRC, PDB, PML, RB, RTF, SNB, TCR, TXT, TXTZ

Los formatos de salida que admite son: EPUB, FB2, OEB, LIT, LRF, MOBI, HTMLZ, PDB, PML, RB, PDF, RTF, SNB, TCR, TXT, TXTZ

No admite DOC (sería necesario guardarlo como ODT) aunque si PDF, pero avisa que la conversión de PDF a ePub es siempre complicada.

El vídeo Pasar libro de PDF a EPUB  te enseña cómo convertir un PDF en EPUB con Calibre

Jutoh

Permite crear un ePub desde TXT, ODT o HTML. La importación permite bastante personalización: metadatos, posibilidad de importar o no las imágenes y su tamaño, aplicar una CSS personal al fichero, importar sólo un fichero o un directorio, diseñar la cubierta, etc.

Pantalla de creación de Jutoh, puede crear un fichero desde cero o importar ficheros

Pantalla de creación de Jutoh, puede crear un fichero desde cero o importar ficheros

Pero además, permite crear un ePub desde cero. Como veremos también permite la edición del ePub.

eCub

Es similar a Jutoh pero mucho más simple y con menos prestaciones. Permite convertir a ePub un fichero de texto o HTML, pero también crearlo desde cero y editarlo.

Pantalla de principal de eCub

Pantalla de principal de eCub

Barra edit@

Permite a los usuarios del gestor de contenidos Alfredo convertir documentos DOC, ODT o HTML en ePUB

¿Cómo puedo editar un ePub?

Cómo hemos visto en el apartado anterior, las herramientas Jutoh, eCub y ToDoEpub permiten la edición de ficheros ePub.

La más recomendable de las tres es Jutoh:

Pantalla de edición de las propiedades del documento de  Jutoh

Pantalla de edición de las propiedades del documento de Jutoh

Pantalla de edición de las imágenes de Jutoh, que permite poner texto alternativo a las mismas

Pantalla de edición de las imágenes de Jutoh, que permite poner texto alternativo a las mismas

Disponemos también de otra herramienta potente y muy recomendable: Sigil, que es gratuita.

En Sigil podemos ver las páginas en modo edición, en modo código o en modo mixto, lo cual nos permite modificar el código fuente de los XHTML.

Edición del código XHTML de las páginas del ePub con Sigil

Edición del código XHTML de las páginas del ePub con Sigil

Sigil tiene otras muchas prestaciones como la validación de ePub y la validación de errores estructurales, la generación de la tabla de contenidos a partir de los encabezados, un editor avanzado de metadatos. Sin embargo no podemos editar las propiedades de las imágenes o insertar un hipervínculo, acciones que deberemos hacer manualmente en la edición del código.

Se pueden consultar varios tutoriales como Crear un epub con Sigil o los vídeos Curso de eBooks con Word con capítulos dedicados a Sigil

¿Cómo validar un ePub?

No hablamos de validar la accesibilidad del ePub sino de validar que el ePub esté bien formado: que los metadatos sean correctos, que todas las imágenes resulten visibles, que la tabla de contenidos sea correcta y aparezcan en el orden apropiado, que la codificación sea UTF 8 o UTF 16, etc.

Las herramientas de edición Jutoh, eCub y Sigil que hemos visto en el apartado anterior incluyen también herramientas de validación.

Existe un validador online: Validate EPUB documents. También existe bookworm pero es necesario registrarse.

Otros validadores son: Epubcheck  y Flightcrew

Sin embargo, como hemos visto, el contenido del ePub no deja de ser XHTML + CSS, así que podríamos pasarles también un validador de código como Unicorn del W3C o un validador de accesibilidad como TAW.

ePub accesibles

Las normas a seguir para que un ePub sea accesible no dejan de ser similares a las que aplicaríamos a un Word, a un PDF o un HTML, y que están definidas por el WCAG (Web Content Accessibility Guidelines)

  • Crear una tabla de contenidos, teniendo en cuenta que hay dos tipos, la que suele aparecer al comienzo del documento y la que  se utiliza como mapa de navegación en los eReader (sería el equivalente a los Bookmarks de los PDF) Se podrá generar al exportar el documento (a partir de los estilos, de los encabezados) o crearla con los programas de edición de ePub
  • Asegurar el correcto contraste del texto y el fondo
  • Incluir metadatos
  • Incluir texto alternativo en los elementos no textuales
  • Que el contenido textual sea texto y no imágenes
  • Estructurar correctamente el contenido con las etiquetas adecuadas (formatear las tablas, columnas (en DOC y ODT) y las listas como tales, que los títulos estén marcados como encabezados y no sólo definidos por su aspecto visual, insertar correctamente los pies y cabeceras, etc.)
  • Utilizar un sistema de encabezados coherente
  • Utilizar una galería de estilos uniforme. Es muy importante cuando se trabaje con Word, InDesign, etc. utilizar siempre estilos pues estos serán utilizados para crear la CSS. Si se pone el texto simplemente en negrita o itálica, en vez de aplicarle un estilo, no se formateará en el ePub. Incluso la opción de InDesign de basar las hojas de estilo en el formato local da resultados impredecibles
  • Asegurar que el texto sea legible y que se pueda modificar su configuración (aumentar o disminuir su tamaño)
  • Asegurar un orden de lectura correcto, por ejemplo en DOC y ODT teniendo cuidado con los cuadros flotantes
  • Asegurar que se pueda convertir correctamente de texto a voz
  • etc.

Para ello será importante trabajar adecuadamente el fichero de origen asegurando que sea accesible.

Pero además habrá que tener en cuenta las peculiaridades de los ePub y que se pueden consultar detalladamente en “Making eBooks from InDesign”, de InDesign Magazine nº32, por ejemplo:

  • se ignorarán los números de página automáticos, los saltos de página y los retorno de carro extra entre párrafos
  • se debe eliminar los saltos de línea forzados que sí se mantendrán y producen un efecto extraño según el lector y el tamaño de letra
  • los hipervínculos se mantienen, incluyendo las referencias cruzadas o las anclas, pero no así se los enlaces que saltan a páginas específicas
  • las notas se mantienen pero se convierten en notas finales del libro o la sección. Se ignoran los estilos de los números de la nota y se convierten en números normales
  • se recomienda crear una archivo para cada sección. Al crear el ePub los programas permitirán seleccionar todos los ficheros que conformarán el eBook. De este modo se crea un XHTML para cada sección mejorando el rendimiento en el eReader
  • cuanto más complicada sea la maquetación (por ejemplo el caso de una revista) la diferencia entre cómo se vería en un PDF o en una versión impresa respecto a la versión del ePub será mayor, puesto que pondrá los elementos en un flujo continuo. En la guía se dan consejos para mitigarlo.
  • hay que tener en cuenta las fuentes. Se pueden incrustar fuentes, pero no todos los eReaders admiten las fuentes incrustadas, utilizando sus propias fuentes por defecto. Además de las diferencias en cuanto al estilo y tamaño de la fuente original y la fuente por la que se sustituye, si se incluyen caracteres especiales estos se sustituirán por otros o por un cuadrado. Deben evitarse pues dichos caracteres especiales puesto que además ofrecen problemas al convertirse de texto a voz.
  • tener cuidado con las tablas, pues aunque se exportan como tales se pierde el estilo y debería aplicarse después cuando editemos el ePub. Pero además no todos los eReader soportan las tablas formateadas.

Cuanto más accesible sea el fichero de origen menos modificaciones será necesario hacer en el ePub. Pero una vez creado podremos editarlo con alguna de las herramientas de edición que comenté anteriormente. Mis preferidas son Sigil y Jutoh. Con ellas podremos modificar el ePub si presenta problemas: podremos añadir texto alternativo a las imágenes, crear o modificar la tabla de contenidos o la metainformación, etc.

Finalmente será necesario validar el ePub con los validadores que hemos visto, visualizarlo con diferentes eReader y tamaños de letra y con un lector de pantalla.

Recomiendo también la lectura de Generic guidance for accessible ebook creation (Word, 229KB) que incluye incluso una checklist de verificación de la accesibilidad del eBook.

¿Qué es un libro DAISY?

El objetivo de este artículo era hablar de la accesibilidad de los ficheros ePub y no de otras alternativas a los mismos, pero no quiero terminarlo sin al menos nombrar los libros DAISY,

Daisy Accessible Information System (Sistema Digital de Información Accesible) es un estándar basado en XML que presenta un libro en formato acústico con navegación activada dentro de una estructura secuencial y jerarquizada de texto sincronizado con audio. Es un conjunto de archivos de audio, generalmente MP3, que contiene la voz de un lector narrándonos un libro, es decir, un audiolibro.

Para la conversión a Daisy se usan principalmente transformaciones XSLT (XSL, XPath) y TTS (Text to Speech), SSML (derivado de XML específico para síntesis de voz) y SMIL (Synchronized Multimedia Integration Language) para sincronizar los diferentes audios.

La accesibilidad del EPUB aumentará en breve, en cuanto se ponga a disposición la versión EPUB 3.0, puesto que se prevé que la nueva norma convergerá con las capacidades que ofrece la norma DAISY, siendo plenamente compatibles el estándar DTBook

La barra edit@ que comentábamos anteriormente permite crear libros DAISY.

En la última pestaña de exportación a eBook de Indesign se puede seleccionar guardarlo con formato XHTML o DTBook, que incluirá un fichero XML con la compilación DAISY

Se puede consultar un listado de lectores de libros DAISY en  el artículo de Xavier Ciscar Presas Daisy en tu PC

Otros enlaces de interés

A lo largo del documento he incluido mucha documentación que recomiendo leer. Otros enlaces de interés son:

Artículos relacionados








[1] Michael Koz (18 de mayo de 2011). Amazon to Allow ePub eBooks on the Kindle e-Reader

7 comentarios :
Valentin dijo...

gracias por este artículo

en el FICOD del año pasado, en una charla sobre epub el ponente comentó que él usaba una extensión de openoffice para hacer la conversión a epub.

no he probado cómo es el resultado pero por si te interesa se llama Writer2ePub

supongo que también existe en libreoffice

y respecto a Daisy existe un conversor, desarrollado en el Aegis Project, que se llama odt2daisy
[y hay otro para braille y otro software en la sección de descargas del proyecto]

por lo que tengo entendido a veces al convertir a epub desde Indesign hay enlaces que no se generan correctamente.

Andres dijo...

Interesante artículo.
Gracias por compartir la informacíon.
Este Blog ya está metido en favoritos.

Olga Carreras dijo...

También existe una extensión (Aspose.Words) para Word que permite guardar en ePub: http://www.tecnologiablog.com/post/2472/asposewords-una-extension-para-word-que-permite-crear-archivos-epub

Hay otra aplicación para crear ePub, que no he nombrado porque es de pago, aunque barata: ePub Creator: http://www.epubcreator.net/

Ivette dijo...

Excelente blog. Muchas gracias por esta información tan interesante.
Saludos

Maximiliano Martin dijo...

Hola Olga,
solo un dato. El link "Taller de creación de documentos ePub" está roto ahora.
Saludos

Anónimo dijo...

Gracias Olga por este artículo realmente fue de muchísima utilidad gracias por tu tiempo y dedicación. Slds

administrad@r dijo...

Interesante artículo, de verdad que no es fácil encontrar material serio sobre el tema de la edición de epub. Mi pregunta, si puedes responder es la siguiente.
Si quiero crear un epub desde copiar y pegar texto web para un libro de...digamos 1000 pàginas en edición impresa. Con pocas fotos, pero con criterio de divulgación máxima entre dispositivos, es decir, nada de malabarismos, epub puro y duro, con un depurado máximo del código en mac OSX 10.6.8 que no sea Sigil? Ya que Sigil dejó de ser aplicable desde su versión 0.6.2 a mi sistema operativo. Sabes de algún otro parecido en español? Ya que veo que mi Sigil no es del todo fiable. Por decirlo suave, hace cosas raras en cuanto a su funcionabilidad.
Busco como loca y no encuentro nada parecido.
Gracias!

Publicar un comentario en la entrada