نظام التنبؤ بتغيب الموظفين (Employee Attrition)
توقع احتمالية ترك الموظف للشركة باستخدام HR Analytics
مقدمة المشروع
في هذا المشروع العملي، ستتعلم كيفية توقع احتمالية ترك الموظف للشركة باستخدام hr analytics. هذا المشروع مصمم خصيصاً لمستوى متوسطويستغرق تقريباً 2-3 أسابيع لإكماله بشكل كامل.
سنتبع منهجية CRISP-DM (Cross-Industry Standard Process for Data Mining) المعترف بها عالمياً، والتي تضمن بناء مشروع احترافي قابل للتطبيق في بيئة الإنتاج.
ماذا ستتعلم؟
خطوات العمل التفصيلية
اتبع هذه الخطوات الست لبناء مشروع احترافي
Business Understanding
فهم المشكلة
تحديد الأهداف والمتطلبات من منظور الأعمال
الخطوات العملية:
تحديد تكلفة استبدال موظف - تصل إلى 150-200% من راتبه السنوي. تحليل معدل التغيب الحالي وتأثيره على الإنتاجية. تحديد أهداف النموذج: التنبؤ المبكر بالموظفين المعرضين للمغادرة. دراسة العوامل المحتملة: الراتب، الرضا الوظيفي، المسافة، ساعات العمل الإضافية، الترقيات.
Data Understanding
فهم البيانات
جمع البيانات الأولية والتعرف عليها وتحديد جودتها
الخطوات العملية:
تحميل IBM HR Analytics Dataset (1,470 موظف، 35 ميزة). استكشاف Attrition Rate: 16.1%. تحليل المتغيرات: Age, Department, JobRole, MonthlyIncome, YearsAtCompany, JobSatisfaction. رسم Distribution plots لكل متغير حسب Attrition. تحليل Correlation: هل الراتب المنخفض يرتبط بالتغيب؟ دراسة التوزيعات الديموغرافية.
Data Preparation
تحضير البيانات
تنظيف وتحويل البيانات لتكون جاهزة للنمذجة
الخطوات العملية:
معالجة Class Imbalance (84% stayed vs 16% left). تحويل المتغيرات الفئوية: Department, JobRole, MaritalStatus باستخدام One-Hot Encoding. Feature Engineering: Years Since Last Promotion, Income to Age Ratio, Total Satisfaction Score. تطبيع المتغيرات الرقمية. إنشاء ميزات تفاعلية: OverTime × Distance, JobSatisfaction × YearsAtCompany. تقسيم البيانات 80/20 مع Stratification.
Modeling
بناء النموذج
اختيار وتطبيق تقنيات النمذجة المناسبة
الخطوات العملية:
بناء Baseline مع Logistic Regression. تطبيق Decision Tree لفهم القرارات. بناء Random Forest مع Feature Importance. تطبيق XGBoost للأداء الأفضل. استخدام SMOTE لمعالجة Imbalance. تطبيق GridSearchCV و RandomizedSearchCV. Ensemble: Voting Classifier يجمع أفضل النماذج.
Evaluation
التقييم
تقييم النموذج والتأكد من تحقيق الأهداف
الخطوات العملية:
حساب Recall (مهم لعدم تفويت موظفين معرضين للمغادرة) و Precision. رسم ROC Curve و حساب AUC. تحليل Feature Importance: أهم 10 عوامل. تطبيق SHAP Values لتفسير تنبؤات النموذج لكل موظف. Confusion Matrix: كم موظف سنتوقع مغادرته خطأً؟ Cost-Benefit Analysis للنموذج.
Deployment
النشر
نشر النموذج في بيئة الإنتاج
الخطوات العملية:
بناء Dashboard تفاعلي بـ Streamlit/Dash لفريق HR. عرض Employee Risk Scores مرتبة من الأعلى للأقل. إنشاء تقارير مخصصة لكل موظف مع العوامل المؤثرة. تقديم توصيات: زيادة راتب، تقليل ساعات إضافية، ترقية. نظام تنبيهات عند ارتفاع Risk Score. توثيق وتدريب فريق HR على استخدام النظام.