قام الدكتور جاسم ناصر حسين عبعوب من كلية الادارة والاقتصاد في قسم الاحصاء بجامعة كربلاء بنشر دراسة علمية بعنوان “تحديات البيانات الكبيرة في تقدير الانحدار الخطي المتعدد” “High dimensional data challenges in estimating multiple linear regression.” في مجلة “Journal of Physics: Conference Series – United Kingdom” ” مجلة الفيزياء : سلسلة المؤتمرات – المملكة المتحدة” وتعد هذه المجلة من المجلات الرصينة.
بينت الدراسة ازدياد ظهور البيانات عالية الحدود هذه الايام في العديد من المجالات بسبب تطور التقنيات الحديثة والتي تساعد على جمع كميات كبيرة من البيانات لمختلف المتغيرات لغرض فهم افضل للظواهر محل الدراسة. من جانب اخر يعتبر الانحدار المتعدد الخطي من اشهر الاساليب الاحصائية في مجال دراسة وتحديد العلاقات بين المتغير المعتمد وعدد من المتغيرات التوضيحية وكذلك تحليل تاثيرها. تقدير هذا النموذج يتطلب عدد من الفرضيات واحدة منها هي العينة يجب ان تكون بحجم كبير. البيانات عالية الحدود لاتحقق هذه الفرضية لان حجم العينة قد يكون صغير مقارنة بعدد المتغيرات التوضيحية.
وبالتالي فان النتائج للطرق التقليدية في تقدير النموذج قد تكون مظللة.
وتم اقتراح استخدام الطرق الجزائية مثل (طريقة لاسو) وكذلك تم اقتراح الطرق اللامعلمية لتقدير النموذج في مثل هذه الحالات.
وتم استخدام معدل متوسط مربعات الخطأ والجذر التربيعي لمتوسط مربعات الخطأ لغرض تقييم طرق التقدير اللامعلمية وطريقة لاسو وطريقة المربعات الصغرى في حالة المحاكاة وعند تحليل البيانات الحقيقية.
اظهرت نتائج تحليل دراسة المحاكاة وتحليل البينات الحقيقية تفوق الطرق اللامعلمية في تقدير النموذج على طرائق لاسو والمربعات الصغرى في حالة البيانات عالية الحدود.