martes, 26 de junio de 2007

PDF accesibles

Última actualización: 27/06/2014

El formato PDF

El formato PDF (Portable Document Format) fue desarrollado por Adobe en el año 1993. En 2008 se convirtió en un estándar formal y abierto publicado por la ISO (Organización Internacional de Estandarización) como ISO 32000-1:2008 (Document management -- Portable document format-- Part 1: PDF 1.7, disponible de forma gratuita en la web de Adobe.

El formato PDF se ha convertido en el principal formato digital para distribuir documentación en Internet debido a sus características:

  • Es multiplataforma.
  • Es una especificación abierta. Actualmente se puede generar un PDF desde prácticamente cualquier aplicación, y hay numeroso software libre para crear o visualizar ficheros PDF.
  • Puede integrar una amplia combinación de contenidos heterogéneos: textos, imágenes, vídeo, formularios, etc.
  • Es fiable, robusto y mantiene la integridad de la información: muestra el mismo aspecto y estructura que el documento original, independientemente del programa desde el que se generó o desde el que se visualice.
  • Admite opciones de seguridad y firma digital.
  • Tiene capacidad de búsqueda.
  • Puede ser accesible para los usuarios de lector de pantalla si se tienen en cuenta unas buenas prácticas.

Existen diversas versiones de PDF. En la versión 1.4 (Acrobat 5.0) se incluyeron los PDF tags (etiquetas en español) y en la versión 1.5 (Acrobat 6.0) se mejoró el etiquetado de los PDF, que como veremos es imprescindible para la accesibilidad. La última versión es PDF 1.7, Adobe Extensión Level 8. La ISO está trabajando en la siguiente versión que será PDF 2.

Cada versión del software disponible para visualizar, modificar o crear archivos PDF, podrá visualizar o generar determinadas versiones de PDF. Se puede consultar una descripción detallada de las características de cada versión en Portable Document Format, Wikipedia.

Por tanto es importante conocer las diferentes versiones de PDF y con qué versiones de Adobe Acrobat se corresponden. Al guardar el PDF podremos indicar la compatibilidad con versiones anteriores, pero siempre habrá que tener en cuenta las características generales y de accesibilidad que admite la versión seleccionada.

Desde 1995, Adobe ha trabajado en el proceso de la ISO (Organización Internacional para la Estandarización) para proporcionar subconjuntos especializados de PDF como estándares para funciones y sectores específicos:

PDF 1.7 - ISO-32000

Podremos por tanto guardar por ejemplo nuestro PDF como PDF/A, pero un PDF/A no es un PDF accesible.

El estándar PDF/A está pensado para que se conserve igual a largo plazo y por tanto toda la información del documento (fuentes, perfil de color, etc.) debe estar incluida en el mismo. En un PDF/A no está permitido incluir audio, vídeo, javascript o cifrado.

Existen tres versiones de PDF/A y cada una tiene diversos niveles de cumplimiento: PDF/A-1b y PDF/A-1a; desde 2011 PDF/A-2, basado en PDF 1.7 (PDF/A-2b, PDF/A-2a, PDF/A-2u); y desde 2012, también basado en PDF 1.7, PDF/A-3, con los mismos niveles de cumplimiento.

Según el nivel de cumplimiento (avanzado, básico o unicode), un PDF/A tendrá algún requisito de accesibilidad, cómo estar etiquetado, pero en sí mismo no asegura ni remotamente que el documento sea accesible.

En 2012 se publicó el nuevo estándar PDF/UA (ISO 14289-1:2012) que recoge las características de la especificación PDF necesarias para la accesibilidad de un PDF. Todavía no se puede guardar un PDF como PDF/UA, y aun cuando sea posible, tampoco garantizará por sí mismo que el PDF sea accesible, pues muchas de las acciones y comprobaciones para convertir un PDF en PDF accesible no pueden realizarse automáticamente.

El validador de accesibilidad de Adobe Acrobat XI Pro ya tiene en cuenta los requisitos del estándar PDF/UA, así como los de las WCAG 2.0, pero solo pueden corregirse automáticamente los requisitos que pueden evaluarse automáticamente, el resto necesita validación y corrección manual.

He tratado específicamente el formato PDF/UA en los artículos:

Que és un PDF accesible

Un PDF accesible es aquel cuyo contenido es accesible para todos los usuarios independientemente de su discapacidad o contexto de uso.

Muchas de las acciones, aunque no todas, que se llevan a cabo para convertir un PDF en PDF accesible están pensadas para las personas que utilizan un lector de pantalla. Por ello, la mayoría de las modificaciones no son apreciables visualmente, y puede no haber diferencias visuales entre la versión del PDF antes de hacerlo accesible y la versión del PDF accesible.

Un lector de pantalla es un software que interpreta el documento y lo presenta al usuario mediante un sintetizador de texto a voz o mediante una línea braille, como podéis ver en este ejemplo: Refreshable Braille and the Web

Por tanto, para realizar PDF accesibles es necesario comprender cómo acceden al documento las personas que utilizan un lector de pantalla y saber utilizar de forma básica alguno de ellos, como NVDA, cuyo uso está muy extendido y es gratuito. La opción "Leer en voz alta" de Adobe Acrobat nunca puede sustituir la revisión del documento con un lector de pantalla.

¿Cuáles son algunas de las acciones que realizaremos para convertir un PDF en PDF accesible?

Estas son algunas de las acciones más importantes:

  • Indicar el idioma del documento, e indicar el idioma de cada contenido que esté en un idioma diferente al principal. De este modo el lector de pantalla podrá leer el documento adecuadamente.
  • Incluir texto alternativo a las imágenes informativas para que el lector de pantalla pueda leer al usuario la información que transmiten. Y por el contrario, indicar qué imágenes son decorativas (artifacto) para que no las anuncie.
  • Etiquetar el documento correctamente, es decir, indicar internamente de que tipo es cada contenido (un encabezado, una tabla, una lista, etc.) Así el lector de pantalla anuncia adecuadamente cada contenido y el usuario puede "ojear" el documento saltando de un tipo de elemento al siguiente mediante atajos de teclado.

    Paleta Tags de Adobe Acrobat

    Esta es una de las acciones en las que es habitual invertir más tiempo, puesto que, aunque puedes generar el PDF etiquetado o etiquetarlo automáticamente desde Adobe Acrobat, después suele ser necesario hacer muchas correcciones. El número de correcciones a realizar dependerá mucho de cómo se haya maquetado el documento de origen.

  • Revisar el orden de lectura interno que no siempre coincide con el visual, lo cual provocará que el lector de pantalla lea el documento en desorden y por tanto sea incomprensible.
  • Revisar que la paginación interna del documento se corresponde con la que aparece en las páginas o que incluye un índice de marcadores para facilitar la navegación por el documento.
  • Incluir un texto alternativo a los enlaces cuando no es claro su destino, o si estamos cumpliendo el nivel AAA, también a las abreviaturas y acrónimos en determinados casos, de manera que el lector de pantalla lea este texto en vez del enlace o la abreviatura.
  • Asegurar un orden de tabulación coherente entre los elementos interactivos.
  • Asegurar que la configuración de seguridad no interfiere con el acceso a la información por parte del lector de pantalla.
  • etc.

También hay otros requisitos que no están relacionados con los usuarios de lector de pantalla, como puede ser asegurar un correcto contraste de color. Otros que solo serán aplicables si el PDF incluye vídeos o formularios.

¿Quién define todos los requisitos a cumplir? ¿dónde puedo consultarlos?

Los requisitos a cumplir vienen definidos en las WCAG 2.0, que incluye 61 requisitos de conformidad. Algunos de estos requisitos no se aplican a los documentos PDF, otros se aplican igual que en cualquier otra tecnología, y algunos se aplican de forma especifica para los documentos PDF. Estos últimos puedes consultarlos en mi artículo PDF Techniques for WCAG 2.0

Algunos requisitos específicos del estándar PDF/UA no están incluidos en las WCAG 2.0, como es asegurar que la configuración de seguridad no interfiera con el acceso al contenido si usas un lector de pantalla. Los comenté en el artículo: PDF/UA. Descripción de la norma. Comparativa y relación con las WCAG 2.0

Convertir un PDF en accesible puede ser una tarea laboriosa. Muy pocos de los requisitos pueden corregirse de forma completamente automática, siempre requiere de un trabajo manual y especializado.

Para ello es importante conocer las buenas prácticas que pueden llevarse a cabo desde el fichero de origen para que el trabajo a realizar en el PDF con Adobe Acrobat XI Pro sea menor. Puedes ver un ejemplo en PDF accesible. PDF correctamente etiquetado desde inDesign. Sin embargo, por mucho que se trabaje el documento de origen, siempre serán necesarias acciones con Adobe Acrobat XI Pro.

También es importante seguir una metodología de trabajo y realizar las acciones en un determinado orden, para mayor eficacia y para evitar problemas que a posteriori no pueden resolverse sin volver a generar el PDF o solo pueden corregirse de una más forma compleja. Hablé de ello en: PDF accesibles (2): metodología

Comprobar la accesibilidad del PDF

Adobe incluye un validador de accesibilidad que permite comprobar aquellos criterios de conformidad que admiten una validación automática. En la última versión de Adobe Acrobat XI Pro se ha mejorado mucho el validador y evalúa de acuerdo a las WCAG 2.0 y el estándar PDF/UA. Hable de ello en Novedades de Adobe Acrobat XI Pro relacionadas con la accesibilidad de los PDF

Aunque es un herramienta valiosa, es importante recalcar que pasar con éxito el validador de Adobe Acrobat asegura cierto nivel de accesibilidad, pero hay muchos requisitos que no puede evaluar, y solo una revisión manual permitirá comprobar que es efectivamente accesible.

Por ello, para comprobar la accesibilidad de un PDF se debe:

  • Pasar el validador de accesibilidad de Adobe Acrobat XI Pro
  • Se debe verificar manualmente la accesibilidad y acceder al documento con un lector de pantalla.

También existen otros validadores, para mi gusto menos fiables, como:

Recomendaciones para enlazar correctamente el PDF desde nuestra web

Por último unas recomendaciones para enlazar correctamente el PDF desde la web:

  • Indica claramente que el enlace es a un fichero PDF y si se va abrir en una ventana nueva o si se va a descargar.
  • No lo embebas en la página o incluye también su descarga. No todas las ayudas técnicas soportan que el PDF se abra en el navegador.
  • Indica el tamaño del PDF.
  • Acompáñalo de un resumen de su contenido.
  • Incluye un enlace a un software gratuito que permita visualizar el PDF (por ejemplo Adobe Reader).
  • Haz el PDF en una versión inferior a la última del mercado.
  • Pon un nombre significativo y amigable al fichero.

Artículos relacionados

Servicios PDF accesible

Envíame un email si quieres más información.

17 comentarios :
Anónimo dijo...

Buen artículo... A raíz de lo que comentas de por qué no suelen hacerse accesibles, casi siempre es por falta de tiempo y presupuesto. Al menos, en todos los proyectos donde he estado y ha surgido el tema de los pdf siempre ha pasado lo mismo. Y no hablamos de uno o dos documentos a tratar, sino de portales de la administración públicas con cientos y cientos e incluso podrían superar el millar de documentos que deberían tratarse en un espacio muy , muy corto de tiempo.

Si ya de por sí a la gente le choca mucho el tema de la accesibilidad (aún), cuando lo relacionas con PDF se quedan aún más extrañados.

El siguiente enlace de del.icio.us es una cuenta donde se recopilan direcciones relacionadas con la accesibilidad en los documentos PDF:

del.icio.us/tag/pdfua

Olga Carreras dijo...

El problema es que este tipo de portales suelen ser como dices de la Administración Pública que por ley deben ser accesibles.

Debemos por tanto informarles de que los PDF son parte del portal y por ello deben ser accesibles, y si no es así, por mucho que tengan un icono que diga lo contrario, no cumplen con los requisitos de accesibilidad.

Pero no vivimos en un mundo utópico, y como dices, lo que suele pasar es que lo que importa es sacar el portal en los plazos previstos y con el menor coste.

Pero si las empresas se negaran a certificar que un portal es accesible, o simplemente no poner los famosos iconos, a no ser que realmente sea accesible (lo cual incluye los PDF y no sirven las frases famosas "salvo por los PDF"), entonces el cliente quizás se replanteara el tema...

... en un mundo utópico claro...

en el mundo real dicen, bueno pues ponemos la misma frasecita que han puesto estos otros y listo, adiós al engorro de los PDF.

TaSMi dijo...

Un artículo muy interesante :)
Una cosilla, las guías de accesibilidad en PDF son de Inteco (no Indeco), un pequeño error tipográfico :P

Olga Carreras dijo...

Gracias :-))

Ya está corregido.

Unknown dijo...

como configurar la version 8 para poder imprimir en A4 real 297*210 sin que suba o baje varios milimetros.

Pablo Alonso de Linaje dijo...

Muchas gracias por este articulo tan completo. Llevo algo de tiempo buscando información sobre como hacer los PDF accesibles, e intentando por consiguiente definir unas pautas para conseguirlo, pero me topo con un problema un tanto dificil de eludir para realizar este cometido.

Estoy diseñando unos PDF que deben generar una serie de informes (iReport + JasperReport) y quiero lograr que sean accesibles, pero no se si el etiquetado podra ayudarme, o incluso si la definición de las internacionalizaciones podra evitar que el fichero sea poco o nulamente accesible.

Por lo tanto mi pregunta concreta es...
¿Como puedo crear un informe (Datos de Empresa + Datos concretos de Actividad) que sea accesible en PDF?

Muchisimas gracias por adelantado.

Pablo Alonso de Linaje García

Anónimo dijo...

Hola!
Hay veces en los que no es posible facilitar un contenido alternativo al PDF (un XHtml por ejemplo), y además, los PDF's son generados "al vuelo", es decir, a partir de consultas a la base de datos se general el XML que luego se transforma en PDF.
Ante esta situación, la solución es crear el PDF Taggeado, y para ello, al crearse al vuelo no puedes utilizar herramientas como Adobe para taggearlo.

En estos casos se convierte el XML en PDF utilizando XSL-FO y FOP [1], pero de momento Apache FOP [2], en su versión 0.20.5, 0.93 y 0.94, no soporta como formato de salida el pdf taggeado (PDF/A-1a) [3], mientras tanto habrá que esperar.

[1]http://www.programacion.net/articulo/joa_pdf/
[2]http://xmlgraphics.apache.org/fop/
[3]http://xmlgraphics.apache.org/fop/0.94/pdfa.html#status

Slayer dijo...

Hola,

quería saber si podríais decirme si los pdf están reconocidos realmente al 100% por el WC3, porque queríamos hacer accesibles los pdf que tenemos en nuestra web y saber si realmente merece la pena o el consorcio no los reconocería con las pautas que poneis en el artículo. Soy becario de una administración pública y estamos trabajando en ello.

Gracias.

Olga Carreras dijo...

Los PDF no son un estándar del W3C y no los recomienda, eso no significa que no se puedan utilizar, de hecho, en la propia web del W3C hay muchos PDF.

Se pueden utilizar siempre y cuando se hagan accesibles como se explica en el artículo.

Edgar I. Martínez dijo...

Felicidades por tu blog en general, y en particular por tu articulo, ya que buscando en la red, poca se encuentra y menos aún en castellano.

Hablando de acrobat 8.0.0 (CS3), quería preguntarte, hasta que punto se que es valido mi PDF?, ya que el informe de accesibilidad viene en tres partes y esas tres partes, con divisiones, a mi me valida el guidelines 1.0 y el 2.0, la prioridad 2 y 3 en ambos, el de adobe imposible.

En mi caso el documento fue hecho desde un programa de maquetación, que por lo que se ve te hace el PDF como le sale de las narices, esto es por que el documento fue pensado para impresión.

He seguido paso a paso tus instrucciones, lo he probado con el JAWS y con el lector acrobat reader 8, y lo leen bien los dos, sin embargo, en el estudio tienen ciertas dudas, osea que no me creen.

¿son suficientes los informes de validación?
¿como se ademas de lo mencionado que mi PDF es accesible?

salud!

Anónimo dijo...

Que tal lo que falta aca es un ejemplo de pdf accesible nose si no vi bien pero no vi ningun enlace para ver un ejemplo de como funciona, si tienes por alli un link de pdf echo acdcesible pasamelo porfa.
angelseron@gmail.com

Anónimo dijo...

PDF es estándar ISO

Olga Carreras dijo...

Otros recursos en accesoweb

cris dijo...

¿Conoces algún metodo de unir un documento de adobe livecycle con un pdf de texto normal?

El problema es que no consigo crear la tipica tabla, en medio de un documento de texto, con campos editables que sea accesible.

Gracias por adelantado

Anyi Marcela Ortega dijo...

Olga buenas tardes, de acuerdo con tu experiencia què herramienta para validar archivos PDF me recomiendas? estoy entre usar meramente Adobe Acrobat Pro, Commonlook PDF, commonlook pdf Validator o PAC3. De ante mano muchas gracias por tu ayuda

Cuchacara Imanajaria dijo...

Olga gracias, dado tu inmensa experiencia, podrìas recomendarme que herramienta usar para validar pdf? estoy entre usar meramente Adobe Acrobat pro, commonlook pdf, commonlook pdf validator o PAC3. De ante mano agradezco tu ayuda.

Olga Carreras dijo...

Hola,

te aconsejo que valides el documento con el validador de accesibilidad de Adobe Acrobat Pro. Tampoco sobra pasar adicionalmente otro validador, como http://checkers.eiii.eu/en/pdfcheck/

Pero en cualquier caso, el verdadero validador, y el que deberías usar siempre para comprobar que un PDF es realmente accesible, es un lector de pantalla, como NVDA (https://nvda.es/), que es gratuito (no vale la opción de Leer en voz alta de Acrobat).

Saludos,

Publicar un comentario