تحليل البيانات الاستكشافية

في الإحصاء، تحليل البيانات الاستكشافية (exploratory data analysis (EDA)) هو أسلوب لتحليل مجموعات البيانات لتلخيص خصائصها الرئيسية، وغالبًا ما يستخدم الرسومات الإحصائية وطرق تصور البيانات الأخرى. يمكن استخدام النموذج الإحصائي أم لا، ولكن الهدف الأساسي من EDA هو رؤية ما يمكن أن تخبرنا به البيانات بما يتجاوز النمذجة الرسمية وبالتالي يتمايز عن اختبار الفرضيات التقليدية.[1][2] تم الترويج لتحليل البيانات الاستكشافية من قبل جون توكي منذ عام 1970 لتشجيع الإحصائيين على استكشاف البيانات، وربما صياغة فرضيات يمكن أن تؤدي إلى جمع بيانات وتجارب جديدة. يختلف EDA عن تحليل البيانات الأولية (IDA)، والذي يركز بشكل أكثر تحديدًا على التحقق من الافتراضات المطلوبة لتركيب النموذج واختبار الفرضيات، والتعامل مع القيم المفقودة وإجراء تحويلات للمتغيرات حسب الحاجة. EDA يشمل المؤسسة الدولية للتنمية.

مثال على تحليل البيانات الاستكشافية

المراجع عدل

  1. ^ Baillie، Mark؛ le Cessie، Saskia؛ Schmidt، Carsten Oliver؛ Lusa، Lara؛ Huebner، Marianne (24 فبراير 2022). "Ten simple rules for initial data analysis". PLOS Computational Biology. ج. 18 ع. 2: e1009819. DOI:10.1371/journal.pcbi.1009819. ISSN:1553-7358. مؤرشف من الأصل في 2024-03-08.{{استشهاد بدورية محكمة}}: صيانة الاستشهاد: دوي مجاني غير معلم (link)
  2. ^ Coshall، Catherine (1996-12). "Book reviews : Chatfield C 1995: Problem solving: a statistician's guide, 2nd edn, Texts in statistical science. London: Chapman & Hall. 325 pp. UK £22.50. ISBN 0 412 60630 5". Statistical Methods in Medical Research. ج. 5 ع. 4: 391–392. DOI:10.1177/096228029600500405. ISSN:0962-2802. مؤرشف من الأصل في 2024-04-05. {{استشهاد بدورية محكمة}}: تحقق من التاريخ في: |تاريخ= (مساعدة)