Manual de usuario de calibre, Publicación 2.73.0
lambda match: '
'),
]
eliminará todo lo que haya entre y .
publication_type = ‘unknown’
Tipo de publicación. Establecer como «newspaper», «magazine» o «blog». Si se establece en None, no se
escribirá el metadato de tipo de publicación en el archivo opf.
recipe_disabled = None
Establecer a un texto no vacío para desactivar esta fórmula. El texto se utilizará como el mensaje de
desactivación.
recursions = 0
Número de niveles de enlaces para seguir en las páginas de internet de los artículos
remove_attributes = []
Lista de atributos para quitar de todas las etiquetas. Por ejemplo:
remove_attributes = ['style', 'font']
remove_empty_feeds = False
Si es True los canales vacíos se eliminan de la salida. Esta opción no tiene efecto si parse_index se reemplaza en la subclase. Está pensado sólo para las fórmulas que devuelven una lista de canales que utilizan
feeds o get_feeds() (página 48). También se utiliza si se emplea la opción ignore_duplicate_articles.
remove_javascript = True
Opción útil para eliminar todas las etiquetas javascript del archivo HTML descargado
remove_tags = []
Lista de etiquetas para ser eliminadas. Las etiquetas especificadas se eliminan del HTML descargado. Cada
etiqueta se especifica como un diccionario de la forma:
{
name
attrs
: 'tag name',
#e.g. 'div'
: a dictionary, #e.g. {class: 'advertisment'}
}
Todas las claves son opcionales. Para una explicación completa de los criterios de búsqueda, véase Beautiful Soup22 (en inglés). Un ejemplo frecuente:
remove_tags = [dict(name='div', attrs={'class':'advert'})]
Esto eliminará todas las etiquetas
y todos sus elementos descendientes del HTML
descargado.
remove_tags_after = None
Elimina todas las etiquetas que se aparecen después de la etiqueta especificada. La forma de especificar
una etiqueta se muestra en BasicNewsRecipe.remove_tags (página 54). Por ejemplo:
remove_tags_after = [dict(id='content')]
eliminará todas las etiquetas después del primer elemento con id=”content”.
remove_tags_before = None
Elimina todas las etiquetas que aparecen antes de la etiqueta especificada. La forma de especificar una
etiqueta se da en BasicNewsRecipe.remove_tags (página 54). Por ejemplo:
22
54
http://www.crummy.com/software/BeautifulSoup/bs3/documentation.html#Searching%20the%20Parse%20Tree
Capítulo 1. Secciones