Manual de Calibre | Page 70

Manual de usuario de calibre, Publicación 2.73.0 o frases que generalmente (en inglés) van en cursiva, como «etc.» o «et cetera». Sustituir el sangrado mediante caracteres por sangrado CSS Algunos documentos establecen las sangrías mediante espacios duros. Cuando se activa esta opción, calibre intenta detectar este tipo de formato y lo convierte a una sangría del 3 % usando CSS. 1.4.5 Buscar y sustituir Estas opciónes son útiles principalmente para la conversión de documentos PDF u OCR, aunque también pueden usarse para corregir muchos problemas específicos. Como ejemplo, algunas conversiones pueden dejar encabezados o pies de página en el texto. Estas opciones usan expresiones regulars para tratar de detectar encabezados, pies de página u otro texto arbitrario y eliminarlos o sustituirlos. Recuerde que operan sobre el código XHTML intermedio producido durante la conversión. Existe un asistente que le ayudará a personalizar las expresiones regulares para cada documento. Pulse sobre la varita mágica junto al cuadro de expresión, y pulse el botón Prueba tras completar una expresión regular. Las coincidencias se resaltarán en amarillo. La búsqueda funciona utilizando una expresión regular python. Todo el texto de la coincidencia se elimina del documento o se stituye utilizando el patrón de sustitución. El patrón de sustitución es opcional, si se deja en blanco el texto de la coincidencia se borrará del documento. Puede aprender más acerca de las expresiones regulares y su sintaxis en Todo acerca de cómo utilizar expresiones regulares en calibre (página 177). 1.4.6 Detección de estructura La detección de estructura significa que calibre hace lo que puede para detectar elementos estructurales en el documento de entrada, cuando no tienen una especificación apropiada. Por ejemplo, capítulos, saltos de página, encabezados, pies de página, etc. Como puede imaginar, este proceso varía mucho de un libro a otro. Por fortuna, calibre tiene opciones potentes para controlarlo. Con la potencia viene la complejidad, pero si se toma el tiempo de aprender la complejidad, encontrará que bien vale el esfuerzo. Capítulos y saltos de página calibre tiene dos grupos de opciones para detección de capítulos e insertar saltos de página. Esto puede ser algo confuso en ocasiones, ya que calibre insertará un salto de página antes de los capítulos detectados, además de en las ubicaciones detectadas en la opción de salto de página. El motivo es que a menudo existen ubicaciones donde hay que insertar un salto de página sin que haya cambio de capítulo. Además, existe la opción de incluir los capítulos detectados en el índice generado automáticamente. calibre usa XPath, un potente lenguaje que permite al usuario especificar límites de capítulo o saltos de página. XPath puede ser un poco intimidante al principio, pero por suerte existe un Cursillo de XPath (página 142) en el Manual de usuario. Recuerde que la detección de estructura actúa sobre el XHTML intermedio producido durante el proceso de conversión. Use la opción de depuración descrita en Introducción (página 60) para deducir la configuración adecuada para un libro concreto. También hay un botón para un asistente de XPath que le ayudará a generar expresiones XPath sencillas. De manera predeterminada, calibre utiliza la siguiente expresión para la detección de capítulos: //*[((name()='h1' or name()='h2') and re:test(., 'chapter|book|section|part\s+', 'i ˓→')) or @class = 'chapter'] La expresión es algo compleja, porque intenta tener en cuenta distintos casos comunes simultáneamente. Lo que significa es que calibre supondrá que los capítulos empiezan en etiquetas

o

que contengan alguna de las palabras chapter, book, section o part o que tengan el atributo class=”chapter”. 66 Capítulo 1. Secciones