المصنف بايز ساذج

المصنف البايزي الساذج (بالإنجليزية: naive Bayes classifier)‏ هي عائلة من المصنفات الاحتمالية البسيطة على أساس تطبيق نظرية بايز مع افتراضات استقلالية (ساذجة) قوية بين الميزات.^[1]^[2] هم من أبسط نماذج شبكة بايز. ولكن يمكن أن يقترن بتقدير كثافة النواة و تحقيق مستويات دقة أعلى.^[2] هذه الخوارزمية نموذج مصنف توليدي (بالإنجليزية: generative algorithm)‏.^[3]^[4] تمت دراسة بايز ساذج على نطاق واسع منذ الستينيات. تم إدخاله (على الرغم من أنه ليس تحت هذا الاسم) في مجتمع استرجاع المعلومات في أوائل الستينيات، ولا يزال طريقة شائعة لتصنيف النص.^[1]

نظرية

بشكل عام، خوارزمية بايز ساذج هي نموذج احتمال شرطي: افترض أننا نريد تصنيف مثال جديد يسمى $\mathbf {x} =(x_{1},\ldots ,x_{n})$ ، والذي يحتوي على n متغيرات (المتغيرات المستقلة). وافترض أن لدينا K تصنيفات. يتم احتساب احتمال أن ينتمي هذا المثال إلى تصنيف Ck على النحو التالي:

$p(C_{k}\mid x_{1},\ldots ,x_{n})\,$

باستخدام نظرية بايز ، يمكن إعادة كتابة الاحتمال الشرطي على النحو التالي:

$p(C_{k}\mid \mathbf {x} )={\frac {p(C_{k})\ p(\mathbf {x} \mid C_{k})}{p(\mathbf {x} )}}\,$

لقد افترضنا بالفعل أن المتغيرات مستقلة. لذا، يمكننا إعادة كتابة هذا الاحتمال بضرب n من الاحتمالات.

مراجع

^ ^ا ^ب Hastie, Trevor. (2001). The elements of statistical learning : data mining, inference, and prediction : with 200 full-color illustrations. Tibshirani, Robert., Friedman, J. H. (Jerome H.). New York: Springer. ISBN:0-387-95284-5. OCLC:46809224. مؤرشف من الأصل في 2020-04-15.
^ ^ا ^ب Piryonesi S. Madeh؛ El-Diraby Tamer E. (1 يونيو 2020). "Role of Data Analytics in Infrastructure Asset Management: Overcoming Data Size and Quality Problems". Journal of Transportation Engineering, Part B: Pavements. ج. 146 ع. 2: 04020022. DOI:10.1061/JPEODX.0000175. مؤرشف من الأصل في 2020-04-12.
^ Ng, A. Y., & Jordan, M. I. (2002). On discriminative vs. generative classifiers: A comparison of logistic regression and naive bayes. In Advances in neural information processing systems (pp. 841-848).
^ "Piryonesi, S. M. (2019). The Application of Data Analytics to Asset Management: Deterioration and Climate Change Adaptation in Ontario Roads (Doctoral dissertation)". مؤرشف من الأصل في 2019-12-02.

بوابة إحصاء

هذه بذرة مقالة عن علم الإحصاء/نظرية الاحتمالات بحاجة للتوسيع. فضلًا شارك في تحريرها.

[:1-1] ا ^ب Hastie, Trevor. (2001). The elements of statistical learning : data mining, inference, and prediction : with 200 full-color illustrations. Tibshirani, Robert., Friedman, J. H. (Jerome H.). New York: Springer. ISBN:0-387-95284-5. OCLC:46809224. مؤرشف من الأصل في 2020-04-15.

[:0-2] ا ^ب Piryonesi S. Madeh؛ El-Diraby Tamer E. (1 يونيو 2020). "Role of Data Analytics in Infrastructure Asset Management: Overcoming Data Size and Quality Problems". Journal of Transportation Engineering, Part B: Pavements. ج. 146 ع. 2: 04020022. DOI:10.1061/JPEODX.0000175. مؤرشف من الأصل في 2020-04-12.

[3] Ng, A. Y., & Jordan, M. I. (2002). On discriminative vs. generative classifiers: A comparison of logistic regression and naive bayes. In Advances in neural information processing systems (pp. 841-848).

[:3-4] "Piryonesi, S. M. (2019). The Application of Data Analytics to Asset Management: Deterioration and Climate Change Adaptation in Ontario Roads (Doctoral dissertation)". مؤرشف من الأصل في 2019-12-02.

[1]

[2]

[3]

[4]