Extension:TextExtracts/fr

L'extension TextExtracts fournit une API qui permet d'extraire du texte brut ou du HTML restreint (HTML dont le contenu pour certaines classes CSS a été enlevé) du contenu d'une page.

Paramètres de configuration

 * est un tableau de &lt;tag>, &lt;tag>.class, .&lt;class>, et #&lt;id> qui sera exclus de l'extraction.
 * Par exemple,  supprime le texte indenté, souvent utilisé  pour les notes chapeau qui n'ont pas de modèle et qui ne sont pas souhaitées dans les résumés.
 * extension.json définit les valeurs par défaut, dont la classe noexcerpt fait partie - ceci peut être ajouté à n'importe quel modèle pour l'exclure.
 * indique si TextExtracts doit fournir ses extraits au module API Opensearch . Par défaut la valeur est.

Caveats
There are various things to be aware of when using the API


 * We do not recommend the usage of `exsentences`. It does not work for HTML extracts and there are many edge cases for which it doesn't exist. For example "Arm. gen. Ing. John Smith was a soldier." will be treated as 4 sentences. We do not plan to fix this.


 * Inline images are stripped from the response (even in HTML mode). This means if you are using the Math extension and using formulae in your lead section they may not appear in the summary output.


 * In HTML mode we cannot guarantee well formed HTML. Resulting HTML may be invalid or malformed.


 * In plaintext mode:
 * citations may not be stripped (see T197266)
 * if a paragraph ends with an HTML tag e.g. ref tag, new lines may be dropped (see T201946),
 * new lines may be dropped after lists T208132

How can I remove content from a page preview/extract?
TextExtracts will strip any element that is marked with the class noexcerpt. This is provided by the global wgExtractsRemoveClasses.

Voir aussi

 * Page Content Service
 * Page Content Service