Calidad de un eBook (2): formatos y estándares

Decíamos ayer que la calidad de un eBook se puede dividir en cuatro niveles:

  • Nivel 0: no es un eBook aún, no hay calidad.
  • Nivel 1: eBook básico sin validaciones.
  • Nivel 2: eBook validado automáticamente.
  • Nivel 3: eBook validado manualmente.

Para pasar un texto de un nivel a otro son necesarias herramientas, por supuesto, pero también decisiones en cuanto al formato escogido y a los estándares que sigue ese formato.

Cómo crear un eBook, parte 1

(o cómo pasar de calidad 0 a calidad 1)

Suponiendo que el texto ya existe (nótese que no lo llamo eBook aún porque no tiene calidad 1: no es un eBook), es necesario hacer una primera distinción: ¿es nativo digital o se publicó en papel? A menudo, la respuesta es papel. Quien pasee por ferias del libro de esta década notará que la (abrumadora) mayoría de los puestos dedicados a los eBooks son empresas que ofrecen servicios de digitalización, no proveedores de contenido en sí. Se dirigen a editoriales con fondo de catálogo de libros en papel que necesitan ser convertidos a contenido digital, a eBook. No todas las editoriales guardaron en su día un fichero WordPerfect o  PageMaker con el texto que se iba a imprimir, o incluso si lo hicieron, necesitan hacer una conversión que dista mucho de ser perfecta.

Si solo hay versión en papel, el proceso es hacerle fotografías y luego aplicar una herramienta llamada OCR (reconocedor óptico de caracteres), que convierte esas imágenes en texto. Este artículo de la Biblioteca Central de la UNAM explica el proceso y, aunque se refiera a libros antiguos, los problemas debidos a las manchas, tipografías, reconocimiento de títulos, números de página, pies de fotografía, etc. son exactamente los mismos hoy. No voy a extenderme en este concepto porque 2709 books es una editorial cuyos textos son nativos digitales.

Una vez aplicado el OCR, o bien si el fichero se conservó en su día (por ejemplo, en PageMaker), el resultado es un fichero digital que no es aún un eBook porque el lector no tiene una herramienta para leerlo. Las conversiones de estos ficheros a eBooks (es decir, subirlos de calidad 0 a calidad 1) suelen ser rápidas y causar infinidad de problemas, pero la clave es la decisión que incluyen: ¿qué formato escoger?

(Necesaria) definición de eBook

Un eBook es un texto digital. Por partes:

  • Texto: podría ser una sola frase (un microrrelato), el Quijote o un libro de texto interactivo de la segunda ley de la termodinámica. Puede contener imágenes o vídeos o no.
  • Digital: se lee en un soporte externo al propio eBook, sea un ordenador, un teléfono, una tableta, un eReader…

El soporte externo es la clave que diferencia un eBook de un libro tradicional en papel. El primero necesita un continente o soporte: infraestructura (hardware) y aplicación (software, que puede estar integrado, como en los eReaders, o instalarse en el ordenador o teléfono, como Calibre). Por el contrario, el libro en papel lo lleva todo incluido.

¿Cuál es la ventaja de separar continente y contenido que ofrece el eBook? Que el soporte es común a todos los eBooks, y por tanto podemos tener una biblioteca completa en un solo eReader o teléfono o carpeta en el ordenador.

¿Cuál es la desventaja del eBook? Que sin esos soportes tecnológicos el eBook no es legible. Además, ordenadores, aplicaciones y formatos cambian cada década como máximo: no existen los soportes digitales para toda la vida. Por tanto, cada eBook que generamos o compramos hoy, si queremos que sirva (sea legible) dentro de unos años, debería estar en un formato que permita su migración a medio plazo.

Formatos de eBooks (y asimilados)

  • Aplicaciones: no es un formato realmente, sino que cada libro depende de su propia aplicación o entorno, e incluye el contenido más el software que permite leerlo. No tiene estándar que lo respalde, y futuras conversiones o migraciones serán un dolor de cabeza para los editores. Basta cambiar de ordenador o teléfono, y probablemente el eBook ya sea ilegible (vuelve a calidad 0).
  • Formatos propietarios iBook, mobi/azw: muy extendidos, y sin estándar que los respalden, durarán lo que duren los planes de negocio de sus propietarios o de las empresas que los impulsan. Apple y Amazon son hoy gigantes que parece que existieron y existirán para siempre, pero Kindle o iPad no tienen aún diez años de vida (nacieron en 2007 y 2010 respectivamente). Es muy improbable que existan sus formatos y lectores dentro de diez años, mientras que eBooks, escritores y editoriales sí exisitrán entonces.
    Estos artículos de ZDnet y Glazblog tratan del tema: «El formato de salida de iBooks Author es propiedad de Apple, similar al estándar ePub standard, pero con extensiones que impiden su lectura o edición externas (a dispositivos Apple). El formato utiliza espacios de nombres XML exclusivos y no documentados, así como extensiones de CSS no documentadas».
  • Formatos propietarios en desuso: .lit (Microsoft Reader): ejemplo de lo anterior en la vida real (TM), fue enterrado en 2012.
  • Formatos abiertos en desuso: como DjVu, utilizado para agrupar páginas digitalizadas en libros. Sin embargo, la tendencia es usar PDF o cómic, como explico más abajo.
  • Formatos abiertos docx, open doc, xml, texto ansi o utf8: aunque estos formatos y estándares se utilizan a menudo para contener textos, no suelen ser su formato definitivo, sino uno intermedio.
  • Formatos PDF: PDF no es un formato sino una familia; algunos son estándares internacionales ISO, por ejemplo. Se suele decir que PDF es un formato propietario, pero solamente lo fue hasta 2008, cuando Adobe lo abrió al público. PDF es hoy el formato más extendido para eBooks cuya puesta en página es fija: no se adapta al lector que lo muestra. Se suele recomendar PDF para eBooks con muchas imágenes, pero tiene un gran problema: para añadirle sonido, o vídeos, o interactividad, hay que recurrir a extensiones propietarias de Adobe y por tanto deja de ser un estándar.
  • Formatos cómic CBZ, CBR: ficheros que realmente son paquetes (zip, rar) de imágenes JPG. Muy extendidos para cómics, porque lo importante (a diferencia de los eBooks) son las imágenes y la puesta en página; el texto depende siempre de ellas.
  • Formato ePub: grupo de estándares internacionales para eBooks cuya puesta en página es dinámica: el tamaño de letra y la longitud de las frases se adaptan al lector que los muestra. Este formato es básicamente equivalente a una página web, y por tanto como estándar está garantizado su futuro. Con el código HTML y CSS adecuado, se puede usar para puesta en página fija, cómics, vídeo, interactividad, etc. Es el formato elegido por 2709 books.

Cómo crear un eBook, parte 2

Una vez decidido qué formato usar para el eBook, en este caso el ePub, no hay más que construir una página web con el texto (y las imágenes y todo aquello que queramos) y seguir el estándar. También podemos usar una herramienta como Adobe Digital Editions, Calibre, Sigil para crear el fichero ePub, o incluso una herramienta online para convertir el fichero original a ePub.

Con esto habremos pasado de calidad 0 a calidad 1, la más básica que puede tener un eBook. En una próxima entrega hablaremos de cómo validar automáticamente los eBooks, y por tanto cómo considerar que han pasado de calidad 1 a calidad 2.

 

2 comentarios en “Calidad de un eBook (2): formatos y estándares”

  1. Carmen Fragano

    Sin duda los editores nos enfrentaremos cada día a nuevos procesos en el manejo y producción de libros en formato digital. Como siempre, el gremio se ve enriquecido enormemente al compartir las experiencias del día a día. Gracias por estos temas y esta página.

Los comentarios están cerrados.

Scroll al inicio