Extension:TextExtracts/tr

TextExtracts uzantısı, düz metin veya sınırlı HTML (kaldırılan bazı CSS sınıfları için içerik içeren HTML) sayfa içeriğinin alınmasını sağlayan bir API sağlar.

Yapılandırma ayarları

 * 1, &lt;tag>, &lt;tag>.class, .&lt;class>, #&lt;id> dizisidir ve bu işlem ayıklanmaya dahil edilmeyecektir.
 * Örneğin,, genellikle özetlerde istenmeyen şablonlanmamış hatnotlar için kullanılan girintili metni kaldırır.
 * extension.json, "noexcerpt" sınıfının bir olduğu varsayılanları tanımlar. Bu, onu hariç tutmak için herhangi bir şablona eklenebilir.
 * , TextExtracts'ın alıntılarını Opensearch API modülüne sağlayıp sağlamayacağını tanımlar. Varsayılan  şeklindedir.

Caveatlar
API'yı kullanırken dikkat edilmesi gereken çeşitli şeyler vardır


 * `exsentences` kullanılmasını önermiyoruz. HTML özleri için çalışmaz ve mevcut olmadığı birçok kenar durumu vardır. Örneğin "Arm. Gen. Ing. John Smith bir askerdi." 4 cümle olarak değerlendirilecektir. Bunu düzeltmeyi planlamıyoruz.
 * Satır içi görüntüler yanıttan çıkarılır (HTML modunda bile). Bu, Matematik uzantısı kullanıyorsanız ve potansiyel istemci bölümünüzde formüller kullanıyorsanız, özet çıkışında görünmeyebilecekleri anlamına gelir.
 * HTML modunda iyi biçimlendirilmiş HTML'yi garanti edemeyiz. Sonuçta ortaya çıkan HTML geçersiz veya bozuk olabilir.
 * Düz metin modunda:
 * kaynakça çıkarılamayabilir (T197266 sayfasına bakın)
 * bir paragraf HTML etiketi ile bitiyorsa, ör. ref etiketi, yeni satırlar atılabilir (T201946 sayfasına bakın)
 * T208132 listelerinden sonra yeni satırlar bırakılabilir

Bir sayfa önizlemesinden/alıntısından içeriği nasıl kaldırabilirim?
TextExtracts, sınıfıyla işaretlenmiş tüm ögeleri çıkarır. Bu, yapılandırma değişkeni tarafından sağlanır (bu,  de tanımlar).

Ayrıca bakınız

 * Page Content Service
 * Page Content Service