تنقيب في النصوص: الفرق بين النسختين
[نسخة منشورة] | [نسخة منشورة] |
تم حذف المحتوى تمت إضافة المحتوى
ط بوت: طلب تحديث وصلات البوابة |
|||
سطر 1:
'''التنقيب في النصوص'''، وأحيانا يشار إليها بالتناوب باسم [[التنقيب في البيانات]] النصية، أي ما يعني تقريبا [[تحليلات النصوص]]، يشير إلى عملية استخلاص [[معلومات]] عالية الجودة من النص.<ref>{{cite journal |doi=10.1016/j.im.2008.01.005 |
|
| journal = Psychology Journal
|
| issue = 1
|
|
| volume = 2
}}</ref><ref>[http://intelligent-enterprise.informationweek.com/blog/archives/2007/02/defining_text_a.html ]{{webarchive |url=https://web.archive.org/web/20091129171151/http://intelligent-enterprise.informationweek.com/blog/archives/2007/02/defining_text_a.html |date=November 29, 2009 }}</ref> واستخلاص المعلومات عالية الجودة يكون من خلال التقسيم للأنماط والاتجاهات من خلال وسائل مثل [[التعلم الإحصائي للانماط]]. وعادة ما يتطلب التنقيب في النصوص ال عملية هيكلة للنص المدخل (عادة تحليل، جنبا إلى جنب مع إضافة بعض المميزات اللغوية المشتقة وإزالة أخرى، ومن ثم الإدراج في [[قاعدة بيانات]])، واستخلاص الأنماط في البيانات المهيكلة، وأخيرا تقييم وتفسير للناتج. 'ذات جودة عالية' في مجال التنقيب في النصوص عادة ما يشير مزيج من [[الصلة]]، و[[الحداثة (براءة اختراع)|الحداثة]]، والاهتمام. المهام النموذجية للتنقيب في النصوص تشمل [[تصنيف النصوص]]، [[تجميع النص]]، و[[استخراج المفاهيم]]، وإنتاج التصنيفات الحبيبية، و[[تحليل المشاعر]]، و[[تلخيص الوثائق]]، ونمذجة العلاقات بين الكيانات (أي تعلم العلاقات بين [[الكيانات المسماة]]).
سطر 22:
{{مراجع}}
{{شريط بوابات|معلوماتية|
{{تصنيف كومنز|Text mining}}
{{ضبط استنادي}}
{{بذرة حوسبة}}
[[تصنيف:تطبيقات الذكاء الاصطناعي]]
[[تصنيف:تنقيب البيانات]]
|