Manual de usuario de calibre, Publicación 2.73.0
url_or_raw: Un URL o la página de índice descargada como texto
is_link_wanted(url, tag)
Devuelve True si el enlace debe seguirse o False en caso contrario. De manera predeterminada, presenta
NotImplementedError, que hace que el programa de descarga lo ignore.
Parámetros
url – La dirección URL que debe seguirse
tag – La etiqueta de la que se extrajo la dirección URL
parse_feeds()
Crea una lista de artículos desde la lista de canales devuelta por BasicNewsRecipe.get_feeds()
(página 48). Devuelve una lista objetos Feed.
parse_index()
Este método debe implementarse en las fórmulas que analizan una página de Internet en lugar de canales
RSS para generar una lista de artículos. Normalmente se usa con fuentes de noticias que tienen una página
del tipo «edición impresa» que enumera todos los artículos de la edición impresa actual. Si se implementa
esta función, se usará con prioridad sobre BasicNewsRecipe.parse_feeds() (página 49).
Debe devolver una lista. Cada elemento de la lista debe ser una tupla de 2 elementos de la forma
('título del canal',lista de artículos).
Cada lista de artículos deben contener diccionarios del tipo:
{
'title'
'url'
'date'
'description'
'content'
:
:
:
:
:
article title,
URL of print version,
The publication date of the article as a string,
A summary of the article
The full article (can be an empty string). Obsolete
do not use, instead save the content to a temporary
file and pass a file:///path/to/temp/file.html as
the URL.
}
Como ejemplo, véase la fórmula para descargar The Atlantic. Además, puede añadir «author» para el autor
del artículo.
Si desea cancelar el proceso por alguna razón y hacer que calibre muestre al usuario un simple mensaje en
lugar de un error, use abort_recipe_processing() (página 46).
populate_article_metadata(article, soup, first)
Utilizada al descargar cada página HTML perteneciente al artículo. Pensada para obtener los metadatos del
artículo, como autor, resumen, etc. a partir del HTML analizado (el argumento soup). :param article: Un
objeto de la clase calibre.web.feeds.Article. Si cambia el resumen, recuerde que debe cambiar
también el text_summary :param soup: HTML analizado perteneciente a este artículo :param first: es True
si y sólo si el HTML analizado es la primera página del artículo.
postprocess_book(oeb, opts, log)
Ejecutar cualquier procesado posterior necesario sobre el libro electrónico descargado.
Parámetros
oeb – Un objeto OEBBook
opts – Opciones de conversión
postprocess_html(soup, first_fetch)
Este método se ejecuta con el código fuente de cada archivo HTML, después de analizar sus imágenes y
1.2. Añadir su sitio de noticias favorito
49