Manual de usuario de calibre, Publicación 2.73.0
ignore_duplicate_articles = {'url'}
Para hacer que coincida el título o URL, establézcalo como:
ignore_duplicate_articles = {'title', 'url'}
keep_only_tags = []
Mantiene sólo las etiquetas especificadas y sus descendientes. El formato para especificar una etiqueta
está definido en BasicNewsRecipe.remove_tags (página 54). Si la lista no está vacía, entonces la
etiqueta se vaciará y se volverá a llenar con las etiquetas que coincidan con las entradas en esta
lista. Por ejemplo:
keep_only_tags = [dict(id=['content', 'heading'])]
mantendrá sólo las etiquetas que posean un atributo id igual a “content” o “heading”.
language = ‘und’
El idioma en que están las noticias. Debe ser un código ISO-639 de dos o tres letras
masthead_url = None
De manera predeterminada, calibre usará la imagen predeterminada para la cabecera (sólo en Kindle). Dé
un valor a esta variable en la fórmula para proporcionar un URL para usar como cabecera.
match_regexps = []
Lista de expresiones regulares que determina qué enlaces seguir. Si está vacía, no se tiene en cuenta. Se
usa sól o si is_link_wanted no está implementado. Por ejemplo:
match_regexps = [r'page=[0-9]+']
coincidirá con todas las direcciones URLs que posean page=algún número.
Sólo
uno
de
entre
BasicNewsRecipe.match_regexps
BasicNewsRecipe.filter_regexps (página 52) deben definirse.
(página
53)
y
max_articles_per_feed = 100
Número máximo de artículos para descargar de cada canal. Esto es útil sobre todo para los
canales que no tienen fechas en los artículos. Para la mayoría de los canales, debe usar
BasicNewsRecipe.oldest_article (página 53)
needs_subscription = False
Si es True, la interfaz gráfica pedirá al usuario un nombre y una contraseña para utilizar en la descarga. Si
se establece en "optional" el nombre y contraseña serán opcionales.
no_stylesheets = False
Opción útil para desactivar la carga de hojas de estilo en los sitios de Internet que tienen hojas de estilo
excesivamente complejas, poco apropiadas para la conversión a formatos de libro electrónico. Si es True,
las hojas de estilo no se descargan ni procesan
oldest_article = 7.0
Artículo más antiguo para descargar desde la fuente de noticias. En días.
preprocess_regexps = []
Lista de reglas de sustitución regexp para ejecutar sobre los HTML descargados. Cada elemento de la
lista debe ser una tupla de dos elementos. El primer elemento de la tupla debe ser una expresión regular
compilada y el segundo un método ejecutable que toma un objeto de coincidencia único y devuelve un
texto para sustituir a la coincidencia. Por ejemplo:
preprocess_regexps = [
(re.compile(r'.*', re.DOTALL|re.IGNORECASE),
1.2. Añadir su sitio de noticias favorito
53