Extension:TextExtracts/tr

TextExtracts uzantısı, düz metin veya sınırlı HTML (kaldırılan bazı CSS sınıfları için içerik içeren HTML) sayfa içeriğinin alınmasını sağlayan bir API sağlar.

Yapılandırma seçenekleri

 * 1, &lt;tag>, &lt;tag>.class, .&lt;class>, #&lt;id> dizisidir ve bu işlem ayıklanmaya dahil edilmeyecektir.
 * Örneğin,, genellikle özetlerde istenmeyen şablonlanmamış hatnotlar için kullanılan girintili metni kaldırır.
 * extension.json, "noexcerpt" sınıfının bir olduğu varsayılanları tanımlar. Bu, onu hariç tutmak için herhangi bir şablona eklenebilir.
 * , TextExtracts'ın alıntılarını Opensearch API modülüne sağlayıp sağlamayacağını tanımlar. Varsayılan  şeklindedir.

Caveatlar
API'yı kullanırken dikkat edilmesi gereken çeşitli şeyler vardır


 * `exsentences` kullanılmasını önermiyoruz. HTML özleri için çalışmaz ve mevcut olmadığı birçok kenar durumu vardır. Örneğin "Arm. Gen. Ing. John Smith bir askerdi." 4 cümle olarak değerlendirilecektir. Bunu düzeltmeyi planlamıyoruz.
 * Satır içi görüntüler yanıttan çıkarılır (HTML modunda bile). Bu, Matematik uzantısı kullanıyorsanız ve potansiyel istemci bölümünüzde formüller kullanıyorsanız, özet çıkışında görünmeyebilecekleri anlamına gelir.
 * HTML modunda iyi biçimlendirilmiş HTML'yi garanti edemeyiz. Sonuçta ortaya çıkan HTML geçersiz veya bozuk olabilir.
 * Düz metin modunda:
 * alıntılar çıkarılamaz (T197266 sayfasına bakın)
 * bir paragraf HTML etiketi ile bitiyorsa, ör. ref etiketi, yeni satırlar atılabilir (T201946 sayfasına bakın),
 * listelerden sonra yeni satırlar atılabilir T208132

Bir sayfa önizlemesinden/alıntısından içeriği nasıl kaldırabilirim?
TextExtracts, noexcerpt sınıfıyla işaretlenmiş herhangi bir öğeyi keser. Bu küresel wgExtractsRemoveClasses tarafından sağlanır.

Ayrıca bakınız

 * Page Content Service
 * Page Content Service