تنقيب في البيانات: الفرق بين النسختين

[مراجعة غير مفحوصة][نسخة منشورة]
تم حذف المحتوى تمت إضافة المحتوى
JarBot (نقاش | مساهمات)
ط بوت:الإبلاغ عن رابط معطوب أو مؤرشف V2.6
لا ملخص تعديل
سطر 1:
'''''التنقيب في البيانات'''''(ب<nowiki/>[[الانجليزية|الانجليزية: data mining]]) هي عملية بحث [[حاسوب|محوسب]] ويدوي عن معرفة من البيانات دون فرضيات مسبقة عما يمكن أن تكون هذه المعرفة.<ref>[http://www.okairp.org/documents/2005%20Fall/F05_ROMEDataQualityETC.pdf OKAIRP 2005 Fall Conference, Arizona State University][http://databases.about.com/od/datamining/a/datamining.htm About.com: Datamining] {{Webarchive|url=http://web.archive.org/web/20170101055848/http://databases.about.com:80/od/datamining/a/datamining.htm |date=01 يناير 2017}}</ref><ref>{{cite journal |author1= Mikut, Ralf |author2=Reischl, Markus |title=Data Mining Tools |journal=Wiley Interdisciplinary Reviews: Data Mining and Knowledge Discovery |volume=1 |number=5 |date=September–October 2011 |pages=431–445 |doi=10.1002/widm.24 |url=http://onlinelibrary.wiley.com/doi/10.1002/widm.24/abstract |accessdate=October 21, 2011 }}</ref><ref>{{cite web |last1=Hastie|first1=Trevor |authorlink1=Trevor Hastie|last2=Tibshirani|first2=Robert|authorlink2=Robert Tibshirani|last3=Friedman|first3=Jerome|authorlink3=Jerome H. Friedman |title=The Elements of Statistical Learning: Data Mining, Inference, and Prediction |year=2009 |url=http://www-stat.stanford.edu/~tibs/ElemStatLearn/ |accessdate=2012-08-07 | مسار الأرشيف = http://web.archive.org/web/20131027220938/http://www-stat.stanford.edu/%7Etibs/ElemStatLearn// | تاريخ الأرشيف = 27 أكتوبر 2013 | وصلة مكسورة = yes }}</ref>
كما ويعرف التنقيب في البيانات على أنه عملية تحليل كمية [[بيانات]] (عادة ما تكون كمية كبيرة)، لإيجاد علاقة منطقية تلخص البيانات بطريقة جديدة تكون مفهومة ومفيدة لصاحب البيانات. يطلق اسم "نماذج" models على العلاقات والبيانات الملخصة التي يتم الحصول عليها من التنقيب في البيانات. يتعامل تنقيب البيانات عادة مع بيانات يكون قد تم الحصول عليها بغرض غير غرض التنقيب في البيانات (مثلاً [[قاعدة بيانات]] التعاملات في [[مصرف]] ما) مما يعني أن طريقة التنقيب في البيانات لاتؤثر مطلقاً على طريقة تجميع البيانات ذاتها. هذه هي أحد النواحي التي يختلف فيها التنقيب في البيانات عن [[إحصاء|الإحصاء]]، ولهذا يشار إلى عملية التنقيب في البيانات على أنها عملية إحصائية ثانوية. يشير التعريف أيضاً إلى أن كمية البيانات تكون عادة كبيرة، أما في حال كون كمية البيانات صغيرة فيفضل استخدام الطرق الإحصائية العادية في تحليلها.
 
عند التعامل مع حجم كبير من البيانات تظهر مسائل جديدة مثل كيفية تحديد النقاط المميزة في البيانات، وكيفية تحليل البيانات في فترة زمنية معقولة وكيفية قرار ما إذا كانت أي علاقة ظاهرية تعكس حقيقة في طبيعة البيانات. عادة يتم التنقيب في بيانات تكون جزءاً من كامل البيانات حيث يكون الغرض عادة تعميم النتائج على كامل البيانات (مثلاً تحليل البيانات الحالية لمستهلكي منتج ما بغرض توقع طلبات المستهلكين المستقبلية). من أحد أهداف تنقيب البيانات أيضاً هو [[تفاعلات أكسدة-اختزال|اختزال]] كميات البيانات الكبيرة أو ضغطها بحيث تعبر بشكل بسيط عن كامل البيانات بدون تعميم.