افتح القائمة الرئيسية

تغييرات

تم إضافة 991 بايت ، ‏ قبل سنة واحدة
ط
بوت:إضافة مصدر من ويكي الإنجليزية أو الفرنسية (تجريبي)
'''التنقيب في النصوص'''، وأحيانا يشار إليها بالتناوب باسم [[التنقيب في البيانات]] النصية، أي ما يعني تقريبا [[تحليلات النصوص]]، يشير إلى عملية استخلاص [[معلومات]] عالية الجودة من النص.<ref>{{cite journal |doi=10.1016/j.im.2008.01.005 |url=http://EconPapers.repec.org/RePEc:rug:rugwps:08/502 |title=Integrating the voice of customers through call center emails into a decision support system for churn prediction |year=2008 |last1=Coussement |first1=Kristof |last2=Van Den Poel |first2=Dirk |journal=Information & Management |volume=45 |issue=3 |pages=164–74}}</ref><ref>{{cite journal
{{مصدر|تاريخ=فبراير 2016}}
|author1=Alessandro Valitutti |author2=Carlo Strapparava |author3=Oliviero Stock | title = Developing Affective Lexical Resources
'''التنقيب في النصوص'''، وأحيانا يشار إليها بالتناوب باسم [[التنقيب في البيانات]] النصية، أي ما يعني تقريبا [[تحليلات النصوص]]، يشير إلى عملية استخلاص [[معلومات]] عالية الجودة من النص. واستخلاص المعلومات عالية الجودة يكون من خلال التقسيم للأنماط والاتجاهات من خلال وسائل مثل [[التعلم الإحصائي للانماط]]. وعادة ما يتطلب التنقيب في النصوص ال عملية هيكلة للنص المدخل (عادة تحليل، جنبا إلى جنب مع إضافة بعض المميزات اللغوية المشتقة وإزالة أخرى، ومن ثم الإدراج في [[قاعدة بيانات]])، واستخلاص الأنماط في البيانات المهيكلة، وأخيرا تقييم وتفسير للناتج. 'ذات جودة عالية' في مجال التنقيب في النصوص عادة ما يشير مزيج من [[الصلة]]، و[[الحداثة (براءة اختراع)|الحداثة]]، والاهتمام. المهام النموذجية للتنقيب في النصوص تشمل [[تصنيف النصوص]]، [[تجميع النص]]، و[[استخراج المفاهيم]]، وإنتاج التصنيفات الحبيبية، و[[تحليل المشاعر]]، و[[تلخيص الوثائق]]، ونمذجة العلاقات بين الكيانات (أي تعلم العلاقات بين [[الكيانات المسماة]]).
| journal = Psychology Journal
| year = 2005
| issue = 1
| pages = 61–83
| url = http://www.psychnology.org/File/PSYCHNOLOGY_JOURNAL_2_1_VALITUTTI.pdf
| volume = 2
'''التنقيب في النصوص'''، وأحيانا يشار إليها بالتناوب باسم }}</ref><ref>[[التنقيب فيhttp://intelligent-enterprise.informationweek.com/blog/archives/2007/02/defining_text_a.html البيانات]]{{webarchive النصية،|url=https://web.archive.org/web/20091129171151/http://intelligent-enterprise.informationweek.com/blog/archives/2007/02/defining_text_a.html أي|date=November ما29, يعني2009 تقريبا [[تحليلات النصوص]]، يشير إلى عملية استخلاص [[معلومات]] عالية الجودة من النص.}}</ref> واستخلاص المعلومات عالية الجودة يكون من خلال التقسيم للأنماط والاتجاهات من خلال وسائل مثل [[التعلم الإحصائي للانماط]]. وعادة ما يتطلب التنقيب في النصوص ال عملية هيكلة للنص المدخل (عادة تحليل، جنبا إلى جنب مع إضافة بعض المميزات اللغوية المشتقة وإزالة أخرى، ومن ثم الإدراج في [[قاعدة بيانات]])، واستخلاص الأنماط في البيانات المهيكلة، وأخيرا تقييم وتفسير للناتج. 'ذات جودة عالية' في مجال التنقيب في النصوص عادة ما يشير مزيج من [[الصلة]]، و[[الحداثة (براءة اختراع)|الحداثة]]، والاهتمام. المهام النموذجية للتنقيب في النصوص تشمل [[تصنيف النصوص]]، [[تجميع النص]]، و[[استخراج المفاهيم]]، وإنتاج التصنيفات الحبيبية، و[[تحليل المشاعر]]، و[[تلخيص الوثائق]]، ونمذجة العلاقات بين الكيانات (أي تعلم العلاقات بين [[الكيانات المسماة]]).
 
== مثال : فهرسة النصوص ==
تطبيقات التنقيب النصي كثيرة تبدأ من الفهرسة بالنسبة ل[[محركات البحث]] إلى استخراج المعرفة من النصوص غير المنظمة.
هناك بعض التقنيات مثل تحويل الكلمات إلى جذوع تمكننا من تطوير الفهرسة مع ضياع بعض المعنى بالمقابل.
== مراجع ==
{{مراجع}}
 
{{شريط بوابات|معلوماتية|لغويات}}
{{تصنيف كومنز|Text mining}}