الانحدار متعدد الحدود

الانحدار متعدد الحدود أو كثير الحدود هو نوع من الانحدار الخطي حيث تعتمد العلاقة بين المتغير x والمتغير y على عدد nth درجة متعدد الحدود. والانحدار متعدد الحدود يمثل علاقة غير خطية بين المتغير x و متوسط المتغير y المقابل، ويرمز ب E(y | x). ويستخدم لوصف الظاهرة غير الخطية مثل معدل نمو الأنسجة,[1] توزيع نظائر الكربون في رواسب البحيرات,[2] و تطور الأمراض الوبائية.[3] بالرغم من أن الانحدار متعدد الحدود يمثل علاقة غير خطية للبيانات، ولتقدير المشكلة الإحصائية الخطية، بمعنى إن دالة الانحدار الخطية في المتغيرات غير المعلومة التي تقدر وتحسب من البيانات. لذلك فإن الانحدار متعدد الحدود يعتبر نوع خاص من الانحدار الخطي المتعدد. ونتائج توسع متعدد الحدود للمتنبئات الأساسية تعرف بمميزات التفاعل. حيث تستخدم تلك المميزات أيضا في اعداد التصنيفات.[4]

التاريخعدل

الانحدار متعدد الحدود تمثل نماذجه باستخدام طريقه اقل فرق مربع للقيم للقيم.تلك الطريقة تقلل من التباين لمميزات التفاعل المشاركة من المعاملات، في ظل ظروف نظرية جاوس-ماركوف.تم نشر طريقه أقل فرق مربع للقيم بواسطه ليجندر عام 1805 و جاوس عام 1809.وظهر أول تصميم لتجربه الانحدار متعدد الحدود في البحث العلمي لجيرموني عام 1815.[5][6] في القرن العشرين، الانحدار متعدد الحدود كان له دورهام في تحليل الانحدار مع مزيد من التركيز علي التصميم و الاستنتاج.[7] وفي الفترة الأخيره، تم استكمال نماذج متعدده الحدود عن طريق وسائل أخرى، مع نماذج غير متعدد الحدود لها مميزات لبعض أنواع المشاكل.

تعريف و مثالعدل

 
الانحدار متعدد الحدود المكعب يناسب مجموعه البيانات. النطاق الموثق يمثل 95% منه باستخدام طريقه Scheffé

.

هدف تحليل الانحدار هو عرض القيمة المتوقعه للمتغير Y بدلاله المتغيرات الغير معتمده X.في الانحدار الخطي البسيط، النموذج:   هوالمستخدم، حيث ƹ خطأ عشوائي غير ملموس حقيقيا مع متوسط الصفر مشروطا برقم مفرد المتغير X.في هذا النموذج، لكل وحده زياده لقيمه المتغير X,القيمة المتوقعه للمتغير Y تزيد ب a1 وحده.في العديد من الحالات، مثل وجود علاقة خطية قد لا تصمد. على سبيل المثال، إذا كنا نصمم العائد من التركيب الكيميائي من حيث درجه الحرارة التي يحدث بها التركيب.قد نجد أن العائد يحسن من خلال زياده المبالغ المخصصه لكل وحده زياده في درجه الحرارة.في هذه الحالة، نحن نقترح نموذجا من الدرجة الثانية من النموذج:  في هذا النموذج، عندما تزداد درجه الحرارة من X الي X+1 وحده، العائد المتوقع يتغير بمعدل a1 + 2a2x.حقيقه ان تغيير العائد يعتمد علي المتغير X هي من تجعل العلاقة غير خطيه(هذا لا يجب الخلط بينه و بين القول أن هذا الانحدار غير خطي، بل علي العكس، مازالت حاله من الانحدار الخطي). في العموم، يمكن تصميم القيمة المتوقعه للمتغير Y كمتعددالحدود من الدرجة n,محققا نموذج الانحدار متعدد الحدود العام.

 .

للتوضيح، كل النماذج خطيه من حيث نظريه الاستنتاج حيث أن داله الانحدار خطيه بدلاله المعاملات الغير معلومه ao, a1 لذلك، لتحليل أقل فرق مربع للقيم، المشاكل الحسابية والاستنتاجيه من الانحدار متعدد الحدود يمكن التعامل معه بشكل كامل باستخدام طريقه الانحدار المتعدد. يتم ذلك عن طريق علاج x,x2 باعتبارها متغيرات مستقلة متميزة في نموذج الانحدار المتعدد.

شكل مصفوفة وحساب التقديراتعدل

نموذج الانحدار متعدد الحدود:  يمكن التعبير عنها بشكل مصفوفة من حيث مصفوفة تصميم  , متجه الاستجابة   ,ومتجه المعلمة   , ومتجه  من الاخطاء عشوائية.الصف ithمن   و   يحتوي على قيم X,Y للحصول على نموذج بيانات ith. ثم يمكن أن تكون مكتوبة في النموذج كنظام المعادلات الخطية.

 

وعند استخدام تدوين المصفوفة النقية كما هو مكتوب:   تقدير المتجه لمعاملات الانحدار متعدد الحدود (باستخدام تقدير المربعات الصغرى) هو:   هذا هو الحل الوحيد لمربعات الصغيرة حيث ان   لديها أعمدة خطيا مستقلة.حيث ان   هي مصفوفة Vandermonde و هذا يضمن لعقد المقدمة التي على الأقل m + 1 من xi ان تكون مميزة ( بشرط ان m < n).

التفسيرعدل

على الرغم من أن الانحدار متعدد الحدود هو حالة خاصة من الانحدار الخطي المتعدد من الناحية الفنية، إلا أن تفسير نموذج الانحدار متعدد الحدود المجهزة يتطلب منظورا مختلفا إلى حد ما. غالباً ما يصعب تناسب تفسير المعاملات الفردية في انحدار متعدد الحدود، بما إن Monomials الاساسية يمكن أن تكون مرتبطة إلى حد كبير.على سبيل المثال، x,x2 يكون الارتباط بينهما حول0.97 .عندما يتم X توزيعها بشكل موحد على الفاصل الزمني (0, 1). على الرغم من أن العلاقة يمكن أن تخفض باستخدام كثيرات الحدود المتعامدة، فهو عموما أكثر غنى بالمعلومات للنظر في وظيفة الانحدار المجهزة ككل. ثم يمكن استخدام النقطة الحكيمة أو نطاقات الثقة في وقت واحد لتوفير شعور من عدم اليقين في تقدير دالة الانحدار.

النهج البديلةعدل

الانحدار متعدد الحدود هو أحد الأمثلة على تحليل الانحدار باستخدام دالات أساسية لنموذج علاقة وظيفية بين كميتين. وبشكل أكثر تحديدا فإنه يستبدل   في الانحدار الخطي مع أساس متعدد الحدود  على سبيل المثال  . و من عيوب قواعد تعدد الحدود أن المهام الأساسية "غير محلية " مما يعني أن قيمة المجهزة y عند قيمة معينة x = x0 تعتمد بقوة على قيم البيانات مع x أبعد ما تكون عن x0[8]

في الإحصاءات الحديثة، تستخدم دالات تعدد الحدود جنبا إلى جنب مع دالات أساسية جديدة مثل منحنيات، وظائف القاعدة الشعاعية،والمويجات. وتوفر هذه العوائل من الدالات كل على حدة تناسب أكثر شحيح جداً للعديد من أنواع البيانات الهدف من الانحدار متعدد الحدود هو في تصميم نموذج لعلاقة غير خطية بين المتغيرات المستقلة وغير المستقلة (من الناحية الفنية، بين المتغير المستقل والمتوسط الشرطي للمتغير التابع). هذا مماثل للهدف المتمثل في النهج الغير حدودي الانحدار، الذي يهدف إلى التقاط علاقات الانحدار الغير خطية. ولذلك يمكن أن تكون النهج الغير حدودي الانحدار مثل التجانس بدائل مفيدة لانحدار متعدد الحدود. تستخدم بعض هذه الأساليب استخدام النموذج المحلي من الانحدار متعدد الحدود الكلاسيكية [9] و من مميزات الانحدار متعدد الحدود التقليدية أنه يمكن استخدام إطار استنتاجي الانحدار المتعدد (وهذا حاصل أيضا عند استخدام العوائل الأخرى من الدالات كل على حدة مثل المنحنيات).

والبديل الأخير هو استخدام نماذج kernelized مثل دعم متجه الانحدار مع نواة متعدد الحدود

ملاحظاتعدل

مايكروسوفت اكسل يستخدم الانحدار متعدد الحدود عند توصيل خط اتجاه لنقاط البيانات على رسم مبعثر XY.[10]

مراجععدل

  1. ^ Shaw, P et al. (2006). "Intellectual ability and cortical development in children and adolescents". Nature 440 (7084): 676–679. doi:10.1038/nature04513. ببمد 16572172.
  2. ^ Barker, PA; Street-Perrott, FA; Leng, MJ; Greenwood, PB; Swain, DL; Perrott, RA; Telford, RJ; Ficken, KJ (2001). "A 14,000-Year Oxygen Isotope Record from Diatom Silica in Two Alpine Lakes on Mt. Kenya". Science 292 (5525): 2307–2310. doi:10.1126/science.1059612. ببمد 11423656.
  3. ^ Greenland, Sander (1995). "Dose-Response and Trend Analysis in Epidemiology: Alternatives to Categorical Analysis". Epidemiology (Lippincott Williams & Wilkins) 6 (4): 356–365. doi:10.1097/00001648-199507000-00005. JSTOR 3702080. ببمد 7548341.
  4. ^ Yin-Wen Chang; Cho-Jui Hsieh; Kai-Wei Chang; Michael Ringgaard; Chih-Jen Lin (2010). "Training and testing low-degree polynomial data mappings via linear SVM". Journal of Machine Learning Research 11: 1471–1490.
  5. ^ Gergonne, J. D. (November 1974) [1815]. "The application of the method of least squares to the interpolation of sequences". Historia Mathematica (Translated by Ralph St. John and S. M. Stigler from the 1815 French ed.) 1 (4): 439–447. doi:10.1016/0315-0860(74)90034-2.
  6. ^ Stigler, Stephen M. (November 1974). "Gergonne's 1815 paper on the design and analysis of polynomial regression experiments". Historia Mathematica 1 (4): 431–439. doi:10.1016/0315-0860(74)90033-0.
  7. ^ Smith, Kirstine (1918). "On the Standard Deviations of Adjusted and Interpolated Values of an Observed Polynomial Function and its Constants and the Guidance They Give Towards a Proper Choice of the Distribution of the Observations". Biometrika 12 (1/2): 1–85. JSTOR 2331929.
  8. ^ Such "non-local" behavior is a property of دالة تحليليةs that are not constant (everywhere). Such "non-local" behavior has been widely discussed in statistics:
    • Magee, Lonnie (1998). "Nonlocal Behavior in Polynomial Regressions". The American Statistician. American Statistical Association. 52 (1): 20–22. doi:10.2307/2685560. JSTOR 2685560. الوسيط |CitationClass= تم تجاهله (مساعدة)
  9. ^ Fan, Jianqing (1996). "Local Polynomial Modelling and Its Applications". Chapman & Hall/CRC. ISBN 0-412-98321-4. الوسيط |CitationClass= تم تجاهله (مساعدة); Cite journal requires |journal= (مساعدة); |chapter= تم تجاهله (مساعدة)
  10. ^ [Tutorial: Data Analysis with Excel https://facultystaff.richmond.edu/~cstevens/301/Excel4.html] نسخة محفوظة 02 يونيو 2013 على موقع واي باك مشين.