You are currently viewing رسالة في جامعة كربلاء تناقش استعمال البيانات الضخمة للتنبؤ بسلوك المستخدمين في الشبكات التواصل الاجتماعي من خلال الانحدار اللوجستي

رسالة في جامعة كربلاء تناقش استعمال البيانات الضخمة للتنبؤ بسلوك المستخدمين في الشبكات التواصل الاجتماعي من خلال الانحدار اللوجستي

ناقشت دراسة  في كلية الإدارة والاقتصاد بجامعة كربلاء ” استعمال البيانات الضخمة للتنبؤ بسلوك المستخدمين في الشبكات التواصل الاجتماعي من خلال الانحدار اللوجستي” للطالبة «  زهراء هلال حمود »

هدفت الدراسة الى توظيف طريقة ذكية ( الخوارزمية الجينية) لتقدير أنموذج الانحدار اللوجستي الثنائي باستعمال البيانات الضخمة ومقارنتها مع الطرائق الكلاسيكية ( الإمكان الأعظم , المربعات الصغرى الموزونة) و تطوير أنموذج تنبؤي باستعمال الانحدار اللوجستي في الجانب التطبيقي فضلاً عن بيان اهم العوامل التي تسهم في معرفة الحساب الأصلي ( الحقيقي) أو المزيف ( غير حقيقي) في احد مواقع التواصل الاجتماعي (الانستغرام).

توصلت الدراسة إلى المحاكاة لتقدير المعلمات عن طريق عدد النماذج وأحجام العينات الضخمة والمختلفة إلى أن طريقة الإمكان الأعظم المحسنة هي الطريقة الفضلى بين جميع الطرائق المحسنة بالخوارزمية الجينية، وأن طريقة الإمكان الأعظم الاعتيادية هي الفضلى بين طرائق التقدير الاعتيادية لتقدير أنموذج الانحدار اللوجستي الثنائي، وذلك لأنَّ كلتا الطريقتين تمتلكان أقل مربعات الخطأ (MSE) هذا فيما يخص الجانب التجريبي أما في الجانب التطبيقي، تم استعمال بيانات حقيقية من شبكة التواصل الاجتماعي (إنستغرام) بلغ عددها (58000) مستخدم تم سحبة عينة عشوائية يبلع عددها (50000). تم نمذجة البيانات، اذ تبين مدى ملائمة أنموذج اللوجستي الثنائي في نمذجة هذه البيانات بحث تم توصل إلى ان نسبة التصنيف الصحيح بلغ 84%. يعني ان النموذج كان دقيقا بنسبة 84% في تصنيف جميع الحسابات سواء حساب حقيقي أو مزيفة وبلغت قيمة منحنى (ROC) 0.08 ان الاختبار قادر تميز بين النتائج الإيجابية والسلبية باحتمال 0.08 وكذلك, المشاركة العوامل التي لها تأثير معنوي في الأنموذج وهي (عدد الأشخاص أو الصفحات التي يتابعها المستخدم, طول السيرة الذاتية, توفر صورة لحساب المستخدم, توفر الرابط, نسبة غير الصورة نسبة مئوية(0.0 إلى 1.0) للوسائط غير الصور هناك ثلاثة أنوع من الوسائط في الانستغرام هي (الصور, الفيديو, العرض الدائري),المشاركة يشبه نسبة التفاعل ولكنه مخصص للتعليقات ,نسبة علامة الموقع النسبة المئوية (0.0 الى1.0) للمشاركات الموسومة بالموقع, متوسط عدد الهاشتاج, متوسط الفاصل الزمني بين المشاركات (بالساعات) .

أوصت الدراسة باستعمال أنموذج الانحدار اللوجستي المتعدد أو الانحدار اللوجستي الرتبي يوجد العديد من الخوارزميات مثل خوارزمية مستعمرة النمل و الخوارزمية الشبكات العصبية بحيث يمكن استعمالها مع الطرائق الاعتيادية للتحسين وللتوصل إلى افضل الطرائق في التقدير معلمات النماذج.

تألفت اللجنة من
أ.د شروق عبد الرضا سعيد رئيساً
أ.د جاسم ناصر حسين عضواً

أ.م.د ايناس عبد الحافظ محمد عضواً
أ.م.د مشتاق كريم عبد الرحيم عضواً ومشرفاً