افتح القائمة الرئيسية

تغييرات

تم إضافة 114 بايت ، ‏ قبل 8 أشهر
ط
'''التنقيب في النصوص'''، وأحيانا يشار إليها بالتناوب باسم [[التنقيب في البيانات]] النصية، أي ما يعني تقريبا [[تحليلات النصوص]]، يشير إلى عملية استخلاص [[معلومات]] عالية الجودة من النص.<ref>{{cite journal |doi=10.1016/j.im.2008.01.005 |urlالمسار=http://EconPapers.repec.org/RePEc:rug:rugwps:08/502 |titleالعنوان=Integrating the voice of customers through call center emails into a decision support system for churn prediction |yearالسنة=2008 |last1الأخير1=Coussement |first1الأول1=Kristof |last2الأخير2=Van Den Poel |first2الأول2=Dirk |journal=Information & Management |volume=45 |issue=3 |pagesالصفحات=164–74}}</ref><ref>{{cite journal
|author1المؤلف1=Alessandro Valitutti |author2المؤلف2=Carlo Strapparava |author3المؤلف3=Oliviero Stock | titleالعنوان = Developing Affective Lexical Resources
| journal = Psychology Journal
| yearالسنة = 2005
| issue = 1
| pagesالصفحات = 61–83
| urlالمسار = http://www.psychnology.org/File/PSYCHNOLOGY_JOURNAL_2_1_VALITUTTI.pdf
| volume = 2
}}</ref><ref>[http://intelligent-enterprise.informationweek.com/blog/archives/2007/02/defining_text_a.html ]{{webarchive |url=https://web.archive.org/web/20091129171151/http://intelligent-enterprise.informationweek.com/blog/archives/2007/02/defining_text_a.html |date=November 29, 2009 }}</ref> واستخلاص المعلومات عالية الجودة يكون من خلال التقسيم للأنماط والاتجاهات من خلال وسائل مثل [[التعلم الإحصائي للانماط]]. وعادة ما يتطلب التنقيب في النصوص ال عملية هيكلة للنص المدخل (عادة تحليل، جنبا إلى جنب مع إضافة بعض المميزات اللغوية المشتقة وإزالة أخرى، ومن ثم الإدراج في [[قاعدة بيانات]])، واستخلاص الأنماط في البيانات المهيكلة، وأخيرا تقييم وتفسير للناتج. 'ذات جودة عالية' في مجال التنقيب في النصوص عادة ما يشير مزيج من [[الصلة]]، و[[الحداثة (براءة اختراع)|الحداثة]]، والاهتمام. المهام النموذجية للتنقيب في النصوص تشمل [[تصنيف النصوص]]، [[تجميع النص]]، و[[استخراج المفاهيم]]، وإنتاج التصنيفات الحبيبية، و[[تحليل المشاعر]]، و[[تلخيص الوثائق]]، ونمذجة العلاقات بين الكيانات (أي تعلم العلاقات بين [[الكيانات المسماة]]).
{{مراجع}}
 
{{شريط بوابات|معلوماتية|لغوياتلسانيات}}
{{تصنيف كومنز|Text mining}}
{{ضبط استنادي}}
 
{{بذرة حوسبة}}
 
[[تصنيف:تطبيقات الذكاء الاصطناعي]]
[[تصنيف:تنقيب البيانات]]
1٬131٬445

تعديل