مقارنة بعض الطرائق التمهيدية لتحليل التمييز اللبي المتعدد المتغيرات ( مع تطبيق عملي )

أ. م. د. مهدي وهاب نصر الله 1                                           أ. م. د ايناس عبد الحافظ محمد2

جامعة كربلاء-كلية الادارة والاحصاء- قسم الاحصاء           جامعة كربلاء-كلية الادارة والاحصاء- قسم الاحصاء

enas.albasri@uokerbala.edu.iq                              Mehdi.wahab@uokerbala.edu.iq

م. سكينة شامل جاسم3

جامعة كربلاء-كلية الادارة والاحصاء- قسم الاحصاء

Sackineh.sh@s.uokerbala.edu.iq

المستخلص

من اوسع الاساليب الاحصائيه استخداما في مجال تحليل البيانات هو اسلوب التحليل التمييزي (Discriminant Analysis ) و ان استخدام التحليل التمييزي يشترط توفر عدد من الأفتراضات من اهمها ان تكون بيانات المتغيرات التوضيحيه ذات توزيع طبيعي متعدد المتغيرات.ان التحليل التمييزي غالباً ما يعاني من مشكلة صغر حجم العينة ( SSS ) Small Simple Size  خاصة عندما يتم تطبيقها لتصنيف عدة ابعاد فاننا نتعامل مع هذه المشكله من خلال استعمال اسلوب التحليل التمييز اللبي ( Kernel Discriminant Analysis) .في هذا البحث نقوم بتكوين دالة التقدير الكثافة اللبي مع تطبيق في التحليل التمييزي ليكون مقارنة في التقدير الكثافة .اذ تعتمد مقدرات الكثافة بشكل عام على اختيار عرض الحزمة ( Bandwidth ) والتي تسيطر على تمهيد التقدير و على اختيار دالة Kernel . وفي هذا البحث تم استعمال بعض الطرائق لتقدير معلمة عرض الحزمة وهي :-

–  (Smoothing  Cross validation ) method  

 –  (Biased cross validation ) method        

ان تقدير الكثافة اللبية مهم في تحليل البيانات المتعددة المتغيرات و تعتمد بشكل كبير على الأختيار المناسب لمصفوفة عرض الحزمة (H) التي تقلل من متوسط تكامل مربع الخطأ (MISE)  و معدل خطا التصنيف ((MR) ̂ ) من خلال القاعدة المشتركة للمجموعات وهي قاعدة التمييز اللبي KDR)).  واخيراً تم اعتماد على بيانات حقيقية من مرض (سرطان الدم العام) والعوامل 6 (المتغيرات) التي تؤثر على الاصابة بالمرض.