طارق بن جعبل طعيمان

مهندس ذكاء اصطناعي

0%

الرئيسيةالمشاريعتعلم الآلةنظام التنبؤ بتغيب الموظفين (Employee Attrition)
تعلم الآلة
مشروع عملي احترافي

نظام التنبؤ بتغيب الموظفين (Employee Attrition)

توقع احتمالية ترك الموظف للشركة باستخدام HR Analytics

متوسط
2-3 أسابيع
4 مهارات

مقدمة المشروع

في هذا المشروع العملي، ستتعلم كيفية توقع احتمالية ترك الموظف للشركة باستخدام hr analytics. هذا المشروع مصمم خصيصاً لمستوى متوسطويستغرق تقريباً 2-3 أسابيع لإكماله بشكل كامل.

سنتبع منهجية CRISP-DM (Cross-Industry Standard Process for Data Mining) المعترف بها عالمياً، والتي تضمن بناء مشروع احترافي قابل للتطبيق في بيئة الإنتاج.

ماذا ستتعلم؟

التعامل مع بيانات HR Analytics
فهم Feature Importance و SHAP Values
معالجة Class Imbalance
تقديم توصيات قابلة للتنفيذ للإدارة
منهجية CRISP-DM

خطوات العمل التفصيلية

اتبع هذه الخطوات الست لبناء مشروع احترافي

1
📊

Business Understanding

فهم المشكلة

تحديد الأهداف والمتطلبات من منظور الأعمال

الخطوات العملية:

تحديد تكلفة استبدال موظف - تصل إلى 150-200% من راتبه السنوي. تحليل معدل التغيب الحالي وتأثيره على الإنتاجية. تحديد أهداف النموذج: التنبؤ المبكر بالموظفين المعرضين للمغادرة. دراسة العوامل المحتملة: الراتب، الرضا الوظيفي، المسافة، ساعات العمل الإضافية، الترقيات.

2
🔍

Data Understanding

فهم البيانات

جمع البيانات الأولية والتعرف عليها وتحديد جودتها

الخطوات العملية:

تحميل IBM HR Analytics Dataset (1,470 موظف، 35 ميزة). استكشاف Attrition Rate: 16.1%. تحليل المتغيرات: Age, Department, JobRole, MonthlyIncome, YearsAtCompany, JobSatisfaction. رسم Distribution plots لكل متغير حسب Attrition. تحليل Correlation: هل الراتب المنخفض يرتبط بالتغيب؟ دراسة التوزيعات الديموغرافية.

3
🧹

Data Preparation

تحضير البيانات

تنظيف وتحويل البيانات لتكون جاهزة للنمذجة

الخطوات العملية:

معالجة Class Imbalance (84% stayed vs 16% left). تحويل المتغيرات الفئوية: Department, JobRole, MaritalStatus باستخدام One-Hot Encoding. Feature Engineering: Years Since Last Promotion, Income to Age Ratio, Total Satisfaction Score. تطبيع المتغيرات الرقمية. إنشاء ميزات تفاعلية: OverTime × Distance, JobSatisfaction × YearsAtCompany. تقسيم البيانات 80/20 مع Stratification.

4
⚙️

Modeling

بناء النموذج

اختيار وتطبيق تقنيات النمذجة المناسبة

الخطوات العملية:

بناء Baseline مع Logistic Regression. تطبيق Decision Tree لفهم القرارات. بناء Random Forest مع Feature Importance. تطبيق XGBoost للأداء الأفضل. استخدام SMOTE لمعالجة Imbalance. تطبيق GridSearchCV و RandomizedSearchCV. Ensemble: Voting Classifier يجمع أفضل النماذج.

5

Evaluation

التقييم

تقييم النموذج والتأكد من تحقيق الأهداف

الخطوات العملية:

حساب Recall (مهم لعدم تفويت موظفين معرضين للمغادرة) و Precision. رسم ROC Curve و حساب AUC. تحليل Feature Importance: أهم 10 عوامل. تطبيق SHAP Values لتفسير تنبؤات النموذج لكل موظف. Confusion Matrix: كم موظف سنتوقع مغادرته خطأً؟ Cost-Benefit Analysis للنموذج.

6
🚀

Deployment

النشر

نشر النموذج في بيئة الإنتاج

الخطوات العملية:

بناء Dashboard تفاعلي بـ Streamlit/Dash لفريق HR. عرض Employee Risk Scores مرتبة من الأعلى للأقل. إنشاء تقارير مخصصة لكل موظف مع العوامل المؤثرة. تقديم توصيات: زيادة راتب، تقليل ساعات إضافية، ترقية. نظام تنبيهات عند ارتفاع Risk Score. توثيق وتدريب فريق HR على استخدام النظام.

المصادر والأدوات

IBM HR Analytics Dataset - Kaggle
SHAP Documentation
XGBoost for HR Analytics

المهارات المطلوبة

ClassificationFeature ImportanceXGBoostSHAP

إحصائيات سريعة

المستوىمتوسط
المدة2-3 أسابيع
المهارات4
الخطوات6
العودة للمشاريع