تنقيب في النصوص: الفرق بين النسختين

[مراجعة غير مفحوصة][نسخة منشورة]
تم حذف المحتوى تمت إضافة المحتوى
لا ملخص تعديل
Ciphers (نقاش | مساهمات)
طلا ملخص تعديل
سطر 1:
'''التنقيب في النصوص'''، وأحيانا يشار إليها بالتناوب باسم [[التنقيب في البيانات]] النصية، أي ما يعني تقريبا [[تحليلات النصوص]]، يشير إلى عملية استخلاص [[معلومات]] عالية الجودة من النص. واستخلاص المعلومات عالية الجودة يكون من خلال التقسيم للأنماط والاتجاهات من خلال وسائل مثل [[التعلم الإحصائي للانماط]]. وعادة ما يتطلب التنقيب في النصوص ال عملية هيكلة للنص المدخل (عادة تحليل، جنبا إلى جنب مع إضافة بعض المميزات اللغوية المشتقة وإزالة أخرى، ومن ثم الإدراج في [[قاعدة بيانات]])، واستخلاص الأنماط في البيانات المهيكلة، وأخيرا تقييم وتفسير للناتج. 'ذات جودة عالية' في مجال التنقيب في النصوص عادة ما يشير مزيج من [[الصلة]]، و[[الحداثة (براءة اختراع)|الحداثة]]، والاهتمام. المهام النموذجية للتنقيب في النصوص تشمل [[تصنيف النصوص]]، [[تجميع النص]]، و[[استخراج المفاهيم أوالكينونات]]، وإنتاج التصنيفات الحبيبية، و[[تحليل المشاعر]]، و[[تلخيص الوثائق]]، ونمذجة العلاقات بين الكيانات (أي تعلم العلاقات بين [[الكيانات المسماة]]).
 
== مثال : فهرسة النصوص ==