Manual de Calibre

Manual de usuario de calibre, Publicación 2.73.0 ignore_duplicate_articles = {'url'} Para hacer que coincida el título o URL, establézcalo como: ignore_duplicate_articles = {'title', 'url'} keep_only_tags = [] Mantiene sólo las etiquetas especificadas y sus descendientes. El formato para especificar una etiqueta está definido en BasicNewsRecipe.remove_tags (página 54). Si la lista no está vacía, entonces la etiqueta se vaciará y se volverá a llenar con las etiquetas que coincidan con las entradas en esta lista. Por ejemplo: keep_only_tags = [dict(id=['content', 'heading'])] mantendrá sólo las etiquetas que posean un atributo id igual a “content” o “heading”. language = ‘und’ El idioma en que están las noticias. Debe ser un código ISO-639 de dos o tres letras masthead_url = None De manera predeterminada, calibre usará la imagen predeterminada para la cabecera (sólo en Kindle). Dé un valor a esta variable en la fórmula para proporcionar un URL para usar como cabecera. match_regexps = [] Lista de expresiones regulares que determina qué enlaces seguir. Si está vacía, no se tiene en cuenta. Se usa sól o si is_link_wanted no está implementado. Por ejemplo: match_regexps = [r'page=[0-9]+'] coincidirá con todas las direcciones URLs que posean page=algún número. Sólo uno de entre BasicNewsRecipe.match_regexps BasicNewsRecipe.filter_regexps (página 52) deben definirse. (página 53) y max_articles_per_feed = 100 Número máximo de artículos para descargar de cada canal. Esto es útil sobre todo para los canales que no tienen fechas en los artículos. Para la mayoría de los canales, debe usar BasicNewsRecipe.oldest_article (página 53) needs_subscription = False Si es True, la interfaz gráfica pedirá al usuario un nombre y una contraseña para utilizar en la descarga. Si se establece en "optional" el nombre y contraseña serán opcionales. no_stylesheets = False Opción útil para desactivar la carga de hojas de estilo en los sitios de Internet que tienen hojas de estilo excesivamente complejas, poco apropiadas para la conversión a formatos de libro electrónico. Si es True, las hojas de estilo no se descargan ni procesan oldest_article = 7.0 Artículo más antiguo para descargar desde la fuente de noticias. En días. preprocess_regexps = [] Lista de reglas de sustitución regexp para ejecutar sobre los HTML descargados. Cada elemento de la lista debe ser una tupla de dos elementos. El primer elemento de la tupla debe ser una expresión regular compilada y el segundo un método ejecutable que toma un objeto de coincidencia único y devuelve un texto para sustituir a la coincidencia. Por ejemplo: preprocess_regexps = [ (re.compile(r'.*', re.DOTALL|re.IGNORECASE), 1.2. Añadir su sitio de noticias favorito 53

Manual de Calibre | Page 57