تنقيب في البيانات: الفرق بين النسختين

[نسخة منشورة][نسخة منشورة]
تم حذف المحتوى تمت إضافة المحتوى
ط إضافة وصلة
JarBot (نقاش | مساهمات)
ط بوت:الإبلاغ عن رابط معطوب أو مؤرشف V4.2 (تجريبي)
سطر 1:
'''''التنقيب في البيانات'''''(ب<nowiki/>[[الانجليزيةلغة إنجليزية|الانجليزية: data mining]]) هي عملية بحث [[حاسوب|محوسب]] ويدوي عن معرفة من البيانات دون فرضيات مسبقة عما يمكن أن تكون هذه المعرفة.<ref>[http://www.okairp.org/documents/2005%20Fall/F05_ROMEDataQualityETC.pdf OKAIRP 2005 Fall Conference, Arizona State University][http://databases.about.com/od/datamining/a/datamining.htm About.com: Datamining] {{Webarchive|url=httphttps://web.archive.org/web/20170101055848/http://databases.about.com:80/od/datamining/a/datamining.htm |date=01 يناير 2017}}</ref><ref>{{cite journal |author1= Mikut, Ralf |author2=Reischl, Markus |title=Data Mining Tools |journal=Wiley Interdisciplinary Reviews: Data Mining and Knowledge Discovery |volume=1 |number=5 |date=September–October 2011 |pages=431–445 |doi=10.1002/widm.24 |url=http://onlinelibrary.wiley.com/doi/10.1002/widm.24/abstract |accessdate=October 21, 2011 }}</ref><ref>{{citeمرجع webويب |last1الأخير1=Hastie|first1الأول1=Trevor |authorlink1وصلة مؤلف1=Trevor Hastie|last2الأخير2=Tibshirani|first2الأول2=Robert|authorlink2وصلة مؤلف2=Robert Tibshirani|last3الأخير3=Friedman|first3الأول3=Jerome|authorlink3وصلة مؤلف3=Jerome H. Friedman |titleعنوان=The Elements of Statistical Learning: Data Mining, Inference, and Prediction |yearسنة=2009 |urlمسار=http://www-stat.stanford.edu/~tibs/ElemStatLearn/ |accessdateتاريخ الوصول=2012-08-07 | مسار الأرشيفأرشيف = http://web.archive.org/web/20131027220938/http://www-stat.stanford.edu/%7Etibs/ElemStatLearn// | تاريخ الأرشيفأرشيف = 27 أكتوبر 2013 | وصلة مكسورة = yes }}</ref>
كما ويعرف التنقيب في البيانات على أنه عملية تحليل كمية [[بيانات]] (عادة ما تكون كمية كبيرة)، لإيجاد علاقة منطقية تلخص البيانات بطريقة جديدة تكون مفهومة ومفيدة لصاحب البيانات. يطلق اسم "نماذج" models على العلاقات والبيانات الملخصة التي يتم الحصول عليها من التنقيب في البيانات. يتعامل تنقيب البيانات عادة مع بيانات يكون قد تم الحصول عليها بغرض غير غرض التنقيب في البيانات (مثلاً [[قاعدة بيانات]] التعاملات في [[مصرف (توضيح)|مصرف]] ما) مما يعني أن طريقة التنقيب في البيانات لاتؤثر مطلقاً على طريقة تجميع البيانات ذاتها. هذه هي أحد النواحي التي يختلف فيها التنقيب في البيانات عن [[إحصاء|الإحصاء]]، ولهذا يشار إلى عملية التنقيب في البيانات على أنها عملية إحصائية ثانوية. يشير التعريف أيضاً إلى أن كمية البيانات تكون عادة كبيرة، أما في حال كون كمية البيانات صغيرة فيفضل استخدام الطرق الإحصائية العادية في تحليلها.
 
عند التعامل مع حجم كبير من البيانات تظهر مسائل جديدة مثل كيفية تحديد النقاط المميزة في البيانات، وكيفية تحليل البيانات في فترة زمنية معقولة وكيفية قرار ما إذا كانت أي علاقة ظاهرية تعكس حقيقة في طبيعة البيانات. عادة يتم التنقيب في بيانات تكون جزءاً من كامل البيانات حيث يكون الغرض عادة تعميم النتائج على كامل البيانات (مثلاً تحليل البيانات الحالية لمستهلكي منتج ما بغرض توقع طلبات المستهلكين المستقبلية). من أحد أهداف تنقيب البيانات أيضاً هو [[تفاعلات أكسدة-اختزال|اختزال]] كميات البيانات الكبيرة أو ضغطها بحيث تعبر بشكل بسيط عن كامل البيانات بدون تعميم.
سطر 46:
- معالجة الإشارات Signal Processing: ايجاد الظواهر المتشابه مع بعضها البعض
 
- [[شبكة عصبونية حيوية|شبكات عصبونية]] Neural Nets: تطوير نماذج قابلة لتنبؤ النتائج. هذه النماذج تم تطويرها بناء على أسس تم استنباطها من عقل الإنسان.
 
- منحنيات غير ثابتة Fractals: تصغير البيانات الكبيرة من دون ضياع المعلومات