Manual de Calibre | Page 58

Manual de usuario de calibre, Publicación 2.73.0 lambda match: ''), ] eliminará todo lo que haya entre y . publication_type = ‘unknown’ Tipo de publicación. Establecer como «newspaper», «magazine» o «blog». Si se establece en None, no se escribirá el metadato de tipo de publicación en el archivo opf. recipe_disabled = None Establecer a un texto no vacío para desactivar esta fórmula. El texto se utilizará como el mensaje de desactivación. recursions = 0 Número de niveles de enlaces para seguir en las páginas de internet de los artículos remove_attributes = [] Lista de atributos para quitar de todas las etiquetas. Por ejemplo: remove_attributes = ['style', 'font'] remove_empty_feeds = False Si es True los canales vacíos se eliminan de la salida. Esta opción no tiene efecto si parse_index se reemplaza en la subclase. Está pensado sólo para las fórmulas que devuelven una lista de canales que utilizan feeds o get_feeds() (página 48). También se utiliza si se emplea la opción ignore_duplicate_articles. remove_javascript = True Opción útil para eliminar todas las etiquetas javascript del archivo HTML descargado remove_tags = [] Lista de etiquetas para ser eliminadas. Las etiquetas especificadas se eliminan del HTML descargado. Cada etiqueta se especifica como un diccionario de la forma: { name attrs : 'tag name', #e.g. 'div' : a dictionary, #e.g. {class: 'advertisment'} } Todas las claves son opcionales. Para una explicación completa de los criterios de búsqueda, véase Beautiful Soup22 (en inglés). Un ejemplo frecuente: remove_tags = [dict(name='div', attrs={'class':'advert'})] Esto eliminará todas las etiquetas
y todos sus elementos descendientes del HTML descargado. remove_tags_after = None Elimina todas las etiquetas que se aparecen después de la etiqueta especificada. La forma de especificar una etiqueta se muestra en BasicNewsRecipe.remove_tags (página 54). Por ejemplo: remove_tags_after = [dict(id='content')] eliminará todas las etiquetas después del primer elemento con id=”content”. remove_tags_before = None Elimina todas las etiquetas que aparecen antes de la etiqueta especificada. La forma de especificar una etiqueta se da en BasicNewsRecipe.remove_tags (página 54). Por ejemplo: 22 54 http://www.crummy.com/software/BeautifulSoup/bs3/documentation.html#Searching%20the%20Parse%20Tree Capítulo 1. Secciones