تنقيب في النصوص: الفرق بين النسختين

[مراجعة غير مفحوصة][مراجعة غير مفحوصة]
تم حذف المحتوى تمت إضافة المحتوى
إضافة سريعة للتصنيف "تنقيب البيانات" (باستخدام المصناف الفوري)
لا ملخص تعديل
سطر 1:
التنقيب في النصوص، وأحيانا يشار إليها بالتناوب باسم [[التنقيب في البيانات]] النصية، أي ما يعني تقريبا [[تحليلات النصوص،النصوص]]، يشير إلى عملية استخلاص [[معلومات]] عالية الجودة من النص. واستخلاص المعلومات عالية الجودة يكون من خلال التقسيم للأنماط والاتجاهات من خلال وسائل مثل [[التعلم الإحصائي للانماط]]. وعادة ما يتطلب التنقيب في النصوص ال عملية هيكلة للنص المدخل (عادة تحليل، جنبا إلى جنب مع إضافة بعض المميزات اللغوية المشتقة وإزالة أخرى، ومن ثم الإدراج في [[قاعدة بيانات]])، واستخلاص الأنماط في البيانات المهيكلة، وأخيرا تقييم وتفسير للناتج. 'ذات جودة عالية' في مجال التنقيب في النصوص عادة ما يشير مزيج من الصلة،[[الصلة]]، والحداثة،و[[الحداثة (براءة اختراع)|الحداثة]]، والإهتمام. مهام النموذجية للتنقيب في النصوص تشمل تصنيف النصوص، تجميع النص، واستخراج مفهوم/كيان، وانتاج التصنيفات الحبيبية، وتحليل المشاعر، وتلخيص الوثيقة، ونمذجة العلاقات بين الكيانات (أي تعلم العلاقات بين الكيانات المسماة).
 
[[تصنيف:تطبيقات الذكاء الاصطناعي]] [[تصنيف:لسانيات حاسوبية]]