افتح القائمة الرئيسية

تغييرات

تم إضافة 21 بايت ، ‏ قبل 4 سنوات
لا يوجد ملخص تحرير
'''التنقيب في النصوص'''، وأحيانا يشار إليها بالتناوب باسم [[التنقيب في البيانات]] النصية، أي ما يعني تقريبا [[تحليلات النصوص]]، يشير إلى عملية استخلاص [[معلومات]] عالية الجودة من النص. واستخلاص المعلومات عالية الجودة يكون من خلال التقسيم للأنماط والاتجاهات من خلال وسائل مثل [[التعلم الإحصائي للانماط]]. وعادة ما يتطلب التنقيب في النصوص ال عملية هيكلة للنص المدخل (عادة تحليل، جنبا إلى جنب مع إضافة بعض المميزات اللغوية المشتقة وإزالة أخرى، ومن ثم الإدراج في [[قاعدة بيانات]])، واستخلاص الأنماط في البيانات المهيكلة، وأخيرا تقييم وتفسير للناتج. 'ذات جودة عالية' في مجال التنقيب في النصوص عادة ما يشير مزيج من [[الصلة]]، و[[الحداثة (براءة اختراع)|الحداثة]]، والاهتمام. المهام النموذجية للتنقيب في النصوص تشمل [[تصنيف النصوص]]، [[تجميع النص]]، و[[استخراج مفهوم/كيانالمفاهيم أوالكينونات]]، وإنتاج التصنيفات الحبيبية، و[[تحليل المشاعر]]، و[[تلخيص الوثيقةالوثائق]]، ونمذجة العلاقات بين الكيانات (أي تعلم العلاقات بين [[الكيانات المسماة]]).
 
== مثال : فهرسة النصوص ==
يمكن أن يتعلق التنقيب النصي ب[[فهرسة]] النصوص بالنسبة للكلمات التي تحتوي عليها وهذا هو ابسط تطبيق للتنقيب النصي. ويمكن بعد ذلك ان نسأل الفهرس عن طريق كلمات مفتاحية لمعرفة التشابه بينها وبين قائمة النصوص.
مستخدم مجهول