تعلم الآلة
نظام توصية المنتجات للتجارة الإلكترونية
بناء نظام توصية ذكي يقترح منتجات مناسبة للمستخدمين بناءً على سلوكهم الشرائي
المهارات المطلوبة:
Collaborative FilteringPandasScikit-LearnMatrix FactorizationContent-Based Filtering
ماذا ستتعلم:
- •فهم وتطبيق خوارزميات Collaborative Filtering
- •بناء نظام Content-Based Filtering
- •تطبيق تقنيات Matrix Factorization و SVD
- + 3 أهداف أخرى...
الخطوات العملية (CRISP-DM):
📊 فهم المشكلة: تحديد أهداف نظام التوصيات - زيادة المبيعات بنسبة 15-20% من خلال توصيات دقيقة. دراسة سلوك المستخدمين الحالي وأنماط الشراء. تحديد KPIs مثل Click-Through Rate و Conversion Rate. تحليل احتياجات العمل من منصات تجارة إلكترونية ناجحة مثل Amazon و Noon.
🔍 فهم البيانات: تحميل dataset تجارة إلكترونية (مثل Amazon Product Reviews أو Retail Transaction Data). استكشاف المتغيرات: User ID, Product ID, Ratings, Categories, Purchase History. تحليل إحصائي شامل: توزيع التقييمات، المنتجات الأكثر شعبية، المستخدمين الأكثر نشاطاً. رسم Heatmaps و Distribution Plots لفهم الأنماط.
🧹 تحضير البيانات: تنظيف البيانات من القيم المفقودة والتقييمات المكررة. معالجة Cold Start Problem للمستخدمين والمنتجات الجديدة. بناء User-Item Interaction Matrix. تقسيم البيانات 80/20 مع الحفاظ على التسلسل الزمني. Feature Engineering: استخراج ميزات مثل متوسط التقييم، عدد المشتريات السابقة.
+ 3 خطوات إضافية
المصادر:
📚 Amazon Product Reviews Dataset📚 Surprise Library Documentation📚 Recommender Systems Handbook📚 Microsoft Recommenders GitHub📚 FastAPI Documentation
تعلم الآلة
كشف الاحتيال في المعاملات المالية
نموذج يكتشف المعاملات الاحتيالية في بيانات البطاقات الائتمانية
المهارات المطلوبة:
Imbalanced DataRandom ForestXGBoostFeature Engineering
ماذا ستتعلم:
- •التعامل مع البيانات غير المتوازنة
- •تطبيق SMOTE و Under-sampling
- •استخدام Ensemble Methods
- + 1 أهداف أخرى...
الخطوات العملية (CRISP-DM):
📊 فهم المشكلة: تحديد تكلفة الاحتيال - تخسر البنوك 28 مليار دولار سنوياً عالمياً. تحليل أنواع الاحتيال: سرقة بطاقات، معاملات مشبوهة، اختراقات. تحديد أهداف النموذج: اكتشاف 95%+ من الاحتيال مع تقليل False Positives لعدم إزعاج العملاء. دراسة التوازن بين الأمان وتجربة المستخدم. فهم العواقب: كل False Negative = خسارة مالية، كل False Positive = عميل غاضب.
🔍 فهم البيانات: تحميل Credit Card Fraud Dataset من Kaggle (284,807 معاملة). استكشاف البيانات: 99.83% طبيعية، 0.17% احتيالية - imbalance شديد! تحليل المتغيرات: V1-V28 (PCA-transformed features)، Amount، Time. دراسة أنماط الاحتيال: متوسط مبلغ المعاملات الاحتيالية أقل من الطبيعية. رسم Time Series للمعاملات عبر اليوم. تحليل توزيع Amount للفئتين.
🧹 تحضير البيانات: معالجة Class Imbalance الشديد (492 fraud من 284,807). تقسيم البيانات قبل أي معالجة لتجنب Data Leakage. تطبيع Amount و Time باستخدام StandardScaler. تجربة استراتيجيات Imbalance: SMOTE (Synthetic Minority Oversampling)، Random Under-sampling، SMOTE + Tomek Links. Feature Engineering: Hour of Day، Amount_per_Hour، Transaction_Frequency. إنشاء Stratified splits للحفاظ على نسبة Fraud في Train/Test.
+ 3 خطوات إضافية
المصادر:
📚 Kaggle Credit Card Fraud Dataset📚 Imbalanced-learn Documentation📚 XGBoost Documentation
تعلم الآلة
التنبؤ بأسعار المنازل (House Price Prediction)
نموذج يتنبأ بأسعار المنازل بناءً على خصائصها - مثالي للمبتدئين
المهارات المطلوبة:
RegressionFeature EngineeringPandasScikit-Learn
ماذا ستتعلم:
- •فهم Business Understanding في مجال العقارات
- •تطبيق Linear و Polynomial Regression
- •إتقان Feature Engineering والتعامل مع البيانات الحقيقية
- + 1 أهداف أخرى...
الخطوات العملية (CRISP-DM):
📊 فهم المشكلة: تحديد هدف النموذج - مساعدة وكلاء العقارات والمشترين على تقييم الأسعار بدقة عالية. دراسة العوامل المؤثرة: المساحة، عدد الغرف، الموقع، عمر البناء، المرافق القريبة. تحديد مقياس النجاح: RMSE أقل من 50,000 ريال. فهم احتياجات السوق العقاري المحلي وتوقعات المستخدمين.
🔍 فهم البيانات: تحميل California/Ames Housing Dataset. استكشاف المتغيرات: 79 ميزة تشمل المساحة، الغرف، الحمامات، الموقع، السنة، الحالة. تحليل إحصائي: متوسط السعر، التوزيع، القيم الشاذة. رسم Scatter plots للعلاقة بين السعر والمساحة. تحليل Correlation Matrix لأهم الميزات.
🧹 تحضير البيانات: معالجة القيم المفقودة (47 ميزة بها missing values) - استخدام Mean/Median/Mode حسب نوع البيانات. تحويل المتغيرات الفئوية (Neighborhood, Building Type) إلى Numeric باستخدام One-Hot Encoding. Feature Engineering: إنشاء ميزات جديدة مثل TotalSF (مجموع المساحات)، Age (عمر البناء). إزالة القيم الشاذة باستخدام IQR Method. تطبيع البيانات باستخدام StandardScaler للميزات الرقمية.
+ 3 خطوات إضافية
المصادر:
📚 Kaggle House Prices Dataset📚 Scikit-Learn Regression Guide📚 Feature Engineering Tutorial
تعلم الآلة
تصنيف العملاء (Customer Segmentation)
تجميع العملاء إلى فئات متشابهة لاستهداف تسويقي أفضل
المهارات المطلوبة:
ClusteringK-MeansPCAUnsupervised Learning
ماذا ستتعلم:
- •فهم Unsupervised Learning و Clustering
- •تطبيق K-Means, DBSCAN, Hierarchical Clustering
- •استخدام PCA لتقليل الأبعاد
- + 1 أهداف أخرى...
الخطوات العملية (CRISP-DM):
📊 فهم المشكلة: تحديد أهداف تجزئة العملاء - زيادة ROI للحملات التسويقية بنسبة 30%. فهم القطاعات المتوقعة: VIP Customers, Frequent Buyers, Occasional Shoppers, At-Risk Customers. تحديد استراتيجية مختلفة لكل segment. دراسة حالات ناجحة من شركات التجزئة الكبرى.
🔍 فهم البيانات: تحميل Online Retail/Mall Customers Dataset. استكشاف المتغيرات: Customer ID, Purchase History, Spending Amount, Frequency, Recency, Demographics. تحليل RFM (Recency-Frequency-Monetary). رسم Distribution plots للإنفاق والتردد. تحديد الأنماط الشرائية الموسمية.
🧹 تحضير البيانات: حساب متغيرات RFM لكل عميل. معالجة القيم المفقودة والشاذة. Feature Engineering: Average Order Value, Days Since Last Purchase, Purchase Categories. تطبيق Feature Scaling باستخدام StandardScaler أو MinMaxScaler. إزالة الـ outliers الشديدة التي قد تشوه النتائج.
+ 3 خطوات إضافية
المصادر:
📚 Mall Customer Segmentation Dataset - Kaggle📚 K-Means Clustering Tutorial📚 PCA Explained
تعلم الآلة
كشف البريد المزعج (Spam Detection)
نموذج يميز بين البريد الطبيعي والمزعج باستخدام NLP و ML
المهارات المطلوبة:
Text ClassificationNLPNaive BayesTF-IDF
ماذا ستتعلم:
- •تطبيق Text Preprocessing (Tokenization, Stopwords)
- •فهم TF-IDF و Bag of Words
- •استخدام Naive Bayes للتصنيف النصي
- + 1 أهداف أخرى...
الخطوات العملية (CRISP-DM):
📊 فهم المشكلة: تحديد تأثير البريد المزعج - 45% من emails عالمياً spam. تكلفة معالجة spam تصل لمليارات سنوياً. تحديد أهداف النموذج: Precision عالي (تجنب False Positives)، Recall جيد (التقاط أكبر عدد من spam). دراسة خصائص البريد المزعج: الكلمات المشبوهة، الروابط، الأرقام، الـ urgency.
🔍 فهم البيانات: تحميل SMS Spam Collection Dataset (5,574 رسالة). استكشاف التوزيع: 87% ham, 13% spam - بيانات غير متوازنة. تحليل طول الرسائل: spam عادة أطول. استخراج الكلمات الأكثر تكراراً في كل فئة. رسم Word Clouds لـ spam و ham.
🧹 تحضير البيانات: تنظيف النص: إزالة HTML tags، URLs، أرقام الهواتف. تحويل النص إلى lowercase. Tokenization باستخدام NLTK. إزالة Stop Words العربية والإنجليزية. تطبيق Stemming/Lemmatization. تحويل النص إلى vectors باستخدام TF-IDF و Bag of Words. معالجة Class Imbalance باستخدام SMOTE أو Class Weights.
+ 3 خطوات إضافية
المصادر:
📚 SMS Spam Collection Dataset📚 NLTK Documentation📚 Text Classification Guide
تعلم الآلة
نظام التنبؤ بتغيب الموظفين (Employee Attrition)
توقع احتمالية ترك الموظف للشركة باستخدام HR Analytics
المهارات المطلوبة:
ClassificationFeature ImportanceXGBoostSHAP
ماذا ستتعلم:
- •التعامل مع بيانات HR Analytics
- •فهم Feature Importance و SHAP Values
- •معالجة Class Imbalance
- + 1 أهداف أخرى...
الخطوات العملية (CRISP-DM):
📊 فهم المشكلة: تحديد تكلفة استبدال موظف - تصل إلى 150-200% من راتبه السنوي. تحليل معدل التغيب الحالي وتأثيره على الإنتاجية. تحديد أهداف النموذج: التنبؤ المبكر بالموظفين المعرضين للمغادرة. دراسة العوامل المحتملة: الراتب، الرضا الوظيفي، المسافة، ساعات العمل الإضافية، الترقيات.
🔍 فهم البيانات: تحميل IBM HR Analytics Dataset (1,470 موظف، 35 ميزة). استكشاف Attrition Rate: 16.1%. تحليل المتغيرات: Age, Department, JobRole, MonthlyIncome, YearsAtCompany, JobSatisfaction. رسم Distribution plots لكل متغير حسب Attrition. تحليل Correlation: هل الراتب المنخفض يرتبط بالتغيب؟ دراسة التوزيعات الديموغرافية.
🧹 تحضير البيانات: معالجة Class Imbalance (84% stayed vs 16% left). تحويل المتغيرات الفئوية: Department, JobRole, MaritalStatus باستخدام One-Hot Encoding. Feature Engineering: Years Since Last Promotion, Income to Age Ratio, Total Satisfaction Score. تطبيع المتغيرات الرقمية. إنشاء ميزات تفاعلية: OverTime × Distance, JobSatisfaction × YearsAtCompany. تقسيم البيانات 80/20 مع Stratification.
+ 3 خطوات إضافية
المصادر:
📚 IBM HR Analytics Dataset - Kaggle📚 SHAP Documentation📚 XGBoost for HR Analytics
تعلم الآلة
نظام تقييم جودة الهواء والتنبؤ بالتلوث
نموذج ذكي لتصنيف جودة الهواء والتنبؤ بمستويات التلوث بناءً على القياسات البيئية
المهارات المطلوبة:
Multi-class ClassificationTime SeriesFeature EngineeringScikit-LearnXGBoost
ماذا ستتعلم:
- •فهم وتطبيق Multi-class Classification
- •التعامل مع البيانات البيئية والزمنية
- •تطبيق Feature Selection و Engineering
- + 3 أهداف أخرى...
الخطوات العملية (CRISP-DM):
📊 فهم المشكلة: تحديد أهمية مراقبة جودة الهواء للصحة العامة - تقليل أمراض الجهاز التنفسي. دراسة معايير منظمة الصحة العالمية لجودة الهواء (PM2.5, PM10, NO2, SO2, CO, O3). تحديد الفئات: جيد، متوسط، غير صحي، خطر. فهم احتياجات البلديات والجهات البيئية.
🔍 فهم البيانات: تحميل Air Quality Dataset من مدن مختلفة. استكشاف المتغيرات: PM2.5, PM10, NO2, SO2, CO, O3, Temperature, Humidity, Wind Speed. تحليل التوزيعات والقيم الشاذة. دراسة الارتباطات بين الملوثات. رسم Time Series للتلوث عبر الزمن والمواسم.
🧹 تحضير البيانات: معالجة القيم المفقودة بطرق ذكية (Interpolation, Forward Fill). تحويل Timestamp إلى ميزات زمنية (Hour, Day, Month, Season). حساب Moving Averages للملوثات. Feature Engineering: نسب الملوثات، التفاعلات بين المتغيرات. تطبيع البيانات باستخدام StandardScaler. معالجة Class Imbalance إذا وجدت.
+ 3 خطوات إضافية
المصادر:
📚 Air Quality Dataset - UCI/Kaggle📚 WHO Air Quality Guidelines📚 Scikit-Learn Multi-class Guide📚 XGBoost Documentation📚 Environmental Data Analysis
تعلم الآلة
نظام توقع الإقراض (Loan Approval Prediction)
نموذج يقرر قبول أو رفض طلب القرض بناءً على معلومات المتقدم
المهارات المطلوبة:
ClassificationFeature EngineeringModel InterpretationFairness
ماذا ستتعلم:
- •بناء نموذج تصنيف للقرارات المالية
- •التعامل مع البيانات المالية الحساسة
- •فهم Fairness و Bias في نماذج ML
- + 1 أهداف أخرى...
الخطوات العملية (CRISP-DM):
📊 فهم المشكلة: دراسة معايير اتخاذ قرار الإقراض - تقليل Default Rate من 8% إلى 3%. تحليل المخاطر المالية وتكلفة القروض الفاشلة. فهم العوامل المؤثرة: الدخل، تاريخ الائتمان، نسبة الدين للدخل، مدة التوظيف. دراسة القوانين والأنظمة المتعلقة بـ Fair Lending و Anti-Discrimination.
🔍 فهم البيانات: تحميل Loan Prediction Dataset (614 طلب قرض، 13 متغير). استكشاف المتغيرات: Gender, Married, Dependents, Education, Self_Employed, ApplicantIncome, LoanAmount, Credit_History. تحليل Approval Rate: 69% approved. دراسة توزيع الدخل والقروض. تحليل تأثير Credit History على القبول. رسم Correlation Matrix للعوامل المالية.
🧹 تحضير البيانات: معالجة 22% قيم مفقودة في متغيرات مختلفة - استخدام Mode للفئوية و Median للرقمية. تحويل المتغيرات الفئوية: Gender, Married, Education بـ Label Encoding. Feature Engineering: Total Income (Applicant + Coapplicant), EMI (قسط شهري متوقع), Loan to Income Ratio. معالجة Outliers في الدخل والقروض. Log Transformation للمتغيرات المائلة. Standardization للمتغيرات الرقمية.
+ 3 خطوات إضافية
المصادر:
📚 Loan Prediction Dataset - Kaggle📚 Fairness in ML - Google📚 Model Interpretability Guide
الرؤية الحاسوبية
نظام كشف العيوب الصناعية بالرؤية الحاسوبية
بناء نظام AI يكتشف العيوب في خطوط الإنتاج باستخدام YOLOv8
المهارات المطلوبة:
YOLOv8OpenCVPyTorchImage Processing
ماذا ستتعلم:
- •تطبيق Object Detection في بيئة صناعية حقيقية
- •تجميع وتصنيف بيانات العيوب
- •تدريب YOLO على dataset مخصص
- + 2 أهداف أخرى...
الخطوات العملية (CRISP-DM):
📊 فهم المشكلة: تحديد أهمية كشف العيوب في خطوط الإنتاج - منع وصول منتجات معيبة للعملاء. تحليل نسبة العيوب الحالية: 2-5%. تحديد أهداف النظام: كشف 95%+ من العيوب، سرعة 50+ FPS. دراسة أنواع العيوب: خدوش، شقوق، لطخات، أخطاء طباعة. فهم بيئة العمل: إضاءة، سرعة الإنتاج، متطلبات الأجهزة.
🔍 فهم البيانات: جمع صور من خط الإنتاج - 500+ صورة لمنتجات سليمة، 300+ لمعيبة. استكشاف أنماط العيوب المختلفة. تحليل شروط التصوير: الإضاءة، الزوايا، الدقة. دراسة توزيع أحجام العيوب. استخدام مجموعات بيانات عامة: MVTec AD Dataset كمرجع.
🧹 تحضير البيانات: استخدام Roboflow لتوسيم العيوب بـ Bounding Boxes. تصنيف العيوب إلى فئات (scratch, crack, stain, print_error). تطبيق Data Augmentation: تدوير، flip، brightness، تغيير السطوع. تقسيم 80/10/10 (train/val/test). تطبيع الصور لحجم موحد 640x640. معالجة Class Imbalance إذا وجدت.
+ 3 خطوات إضافية
المصادر:
📚 Roboflow: https://roboflow.com📚 YOLOv8 Docs: https://docs.ultralytics.com📚 Industrial Defect Dataset
الرؤية الحاسوبية
نظام مراقبة ذكي مع تتبع الأشخاص
بناء نظام يكتشف ويتتبع الأشخاص في الفيديو مع إحصائيات
المهارات المطلوبة:
YOLODeepSORTOpenCVTracking
ماذا ستتعلم:
- •فهم Object Tracking Algorithms
- •دمج YOLO مع DeepSORT
- •معالجة فيديوهات في Real-time
- + 1 أهداف أخرى...
الخطوات العملية (CRISP-DM):
📊 فهم المشكلة: تحديد احتياجات نظام المراقبة - عد الأشخاص، تتبع الحركة، كشف السلوكيات المشبوهة. تحليل تطبيقات النظام: مراكز تجارية، مدارس، مكاتب. تحديد متطلبات الأداء: 25+ FPS، دقة 95%+. فهم التحديات: Occlusion، تغير الإضاءة، ازدحام الناس. دراسة متطلبات الخصوصية.
🔍 فهم البيانات: جمع فيديوهات من زوايا مختلفة. تحليل أنماط الحركة المختلفة. دراسة تروط التصوير: إضاءة، دقة، زاوية. استكشاف تحديات: occlusions, crowded scenes. استخدام MOT Challenge Dataset للتقييم.
🧹 تحضير البيانات: إعداد YOLOv8 للكشف عن الأشخاص (person class). معايرة النموذج للدقة والسرعة. ضبط Confidence Threshold لتقليل False Positives. معالجة الفيديو: تحسين الجودة، تقليل التشويش. تطبيق Background Subtraction لتحسين الكشف.
+ 3 خطوات إضافية
المصادر:
📚 DeepSORT Paper📚 OpenCV Video Processing
الرؤية الحاسوبية
نظام التعرف على الوجوه (Face Recognition System)
بناء نظام يتعرف على الأشخاص من الوجوه باستخدام Deep Learning
المهارات المطلوبة:
Face RecognitionFaceNetOpenCVdlib
ماذا ستتعلم:
- •📊 فهم مشكلة Face Recognition وتطبيقاتها الأمنية
- •🔍 استكشاف datasets الوجوه المتاحة
- •🧹 معالجة الصور وتطبيع الوجوه
- + 3 أهداف أخرى...
الخطوات العملية (CRISP-DM):
📊 Business Understanding: تحديد متطلبات نظام الأمان والدقة المطلوبة
🔍 Data Understanding: جمع صور للأشخاص المستهدفين
🧹 Data Preparation: كشف الوجوه باستخدام MTCNN وتطبيع الصور
+ 3 خطوات إضافية
المصادر:
📚 LFW (Labeled Faces in the Wild) Dataset📚 FaceNet Paper📚 DeepFace Library
الرؤية الحاسوبية
نظام عد المركبات في الشوارع (Vehicle Counter)
كشف وعد المركبات في فيديوهات المرور مع تصنيف الأنواع
المهارات المطلوبة:
Object DetectionYOLOv8TrackingOpenCV
ماذا ستتعلم:
- •📊 فهم تطبيقات المرور الذكي
- •🔍 تحليل فيديوهات المرور
- •🧹 معالجة الفيديو وتحسين الجودة
- + 3 أهداف أخرى...
الخطوات العملية (CRISP-DM):
📊 Business Understanding: احتياجات إدارة المرور للبيانات
🔍 Data Understanding: الحصول على فيديوهات مرور متنوعة
🧹 Data Preparation: تحسين جودة الفيديو ومعالجة الإضاءة
+ 3 خطوات إضافية
المصادر:
📚 UA-DETRAC Dataset📚 YOLOv8 Vehicle Detection📚 OpenCV Vehicle Tracking
الرؤية الحاسوبية
تصنيف الأمراض الجلدية (Skin Disease Classification)
نموذج يشخص الأمراض الجلدية من صور الجلد - تطبيق طبي
المهارات المطلوبة:
Medical ImagingCNNTransfer LearningData Augmentation
ماذا ستتعلم:
- •📊 فهم التحديات الطبية في تشخيص الأمراض
- •🔍 التعامل مع Medical Datasets
- •🧹 Data Augmentation للبيانات الطبية
- + 3 أهداف أخرى...
الخطوات العملية (CRISP-DM):
📊 Business Understanding: أهمية التشخيص المبكر للأمراض الجلدية
🔍 Data Understanding: استكشاف HAM10000 Skin Lesion Dataset
🧹 Data Preparation: معالجة Class Imbalance و Augmentation
+ 3 خطوات إضافية
المصادر:
📚 HAM10000 Dataset - Kaggle📚 Medical Image Classification Guide📚 EfficientNet Paper
الرؤية الحاسوبية
كشف لوحات السيارات (License Plate Detection)
نظام ALPR لكشف وقراءة لوحات السيارات تلقائياً
المهارات المطلوبة:
OCRYOLOTesseractImage Processing
ماذا ستتعلم:
- •📊 فهم أنظمة ALPR وتطبيقاتها
- •🔍 تحليل تحديات لوحات السيارات
- •🧹 معالجة الصور وتحسين الوضوح
- + 3 أهداف أخرى...
الخطوات العملية (CRISP-DM):
📊 Business Understanding: احتياجات الأمن والمواقف
🔍 Data Understanding: جمع صور لوحات متنوعة
🧹 Data Preparation: تصنيف وتحسين جودة الصور
+ 3 خطوات إضافية
المصادر:
📚 OpenALPR📚 Car License Plate Dataset📚 Tesseract OCR
الرؤية الحاسوبية
كشف الحرائق في الوقت الفعلي (Fire Detection)
نظام يكتشف الحرائق والدخان من كاميرات المراقبة
المهارات المطلوبة:
Computer VisionReal-time DetectionColor-based DetectionCNN
ماذا ستتعلم:
- •📊 فهم أهمية الإنذار المبكر للحرائق
- •🔍 تحليل خصائص النار والدخان البصرية
- •🧹 تحضير dataset للحرائق
- + 3 أهداف أخرى...
الخطوات العملية (CRISP-DM):
📊 Business Understanding: تطبيقات السلامة والإنقاذ المبكر
🔍 Data Understanding: جمع صور/فيديوهات للحرائق والدخان
🧹 Data Preparation: Augmentation وتوسيم الحرائق
+ 3 خطوات إضافية
المصادر:
📚 Fire Detection Dataset - Kaggle📚 Real-time Fire Detection Paper📚 YOLOv8 Custom Training
الرؤية الحاسوبية
نظام قياس المسافات الاجتماعية (Social Distance Monitor)
كشف انتهاكات المسافة الاجتماعية في الأماكن العامة
المهارات المطلوبة:
YOLODistance CalculationPerspective TransformOpenCV
ماذا ستتعلم:
- •📊 فهم تطبيقات الصحة العامة
- •🔍 تحليل المسافات في الفيديو
- •🧹 معالجة زوايا الكاميرا
- + 3 أهداف أخرى...
الخطوات العملية (CRISP-DM):
📊 Business Understanding: أهمية المسافة الاجتماعية للوقاية
🔍 Data Understanding: فيديوهات الأماكن المزدحمة
🧹 Data Preparation: تطبيق Perspective Transform
+ 3 خطوات إضافية
المصادر:
📚 Social Distancing Detection GitHub📚 Perspective Transform Tutorial📚 Distance Calculation in CV
التعلم العميق
بناء CNN من الصفر لتصنيف CIFAR-10
بناء شبكة عصبية تلافيفية من الصفر لتصنيف 10 فئات من الصور
المهارات المطلوبة:
CNNPyTorchData AugmentationBatch Normalization
ماذا ستتعلم:
- •📊 فهم معمارية CNNs وكيفية عملها
- •🔍 استكشاف CIFAR-10 dataset الشهير
- •🧹 تطبيق Data Augmentation لتحسين التعميم
- + 3 أهداف أخرى...
الخطوات العملية (CRISP-DM):
📊 Business Understanding: أهمية تصنيف الصور التلقائي
🔍 Data Understanding: تحليل CIFAR-10 (60K صورة، 10 فئات)
🧹 Data Preparation: Data Augmentation (Rotation, Flip, Crop)
+ 3 خطوات إضافية
المصادر:
📚 CIFAR-10 Dataset📚 PyTorch CNN Tutorial📚 Deep Learning Book - Goodfellow
التعلم العميق
Transfer Learning مع ResNet لتصنيف الحيوانات
استخدام نموذج ResNet50 المُدرب مسبقاً لتصنيف صور الحيوانات
المهارات المطلوبة:
Transfer LearningResNetFine-tuningPyTorch
ماذا ستتعلم:
- •📊 فهم Transfer Learning وفوائده
- •🔍 استخدام نماذج pre-trained
- •🧹 تجهيز dataset مخصص
- + 3 أهداف أخرى...
الخطوات العملية (CRISP-DM):
📊 Business Understanding: توفير الوقت باستخدام النماذج المُدربة
🔍 Data Understanding: جمع dataset حيوانات (Cats, Dogs, Birds)
🧹 Data Preparation: تغيير حجم الصور للمتطلبات المطلوبة
+ 3 خطوات إضافية
المصادر:
📚 Animals-10 Dataset - Kaggle📚 Transfer Learning Guide - PyTorch📚 ResNet Paper
التعلم العميق
LSTM للتنبؤ بالسلاسل الزمنية (Time Series)
بناء LSTM للتنبؤ بأسعار الأسهم أو استهلاك الطاقة
المهارات المطلوبة:
LSTMRNNTime SeriesSequence Modeling
ماذا ستتعلم:
- •📊 فهم السلاسل الزمنية وتحدياتها
- •🔍 تحليل أنماط البيانات التسلسلية
- •🧹 تحضير البيانات بطريقة sliding window
- + 3 أهداف أخرى...
الخطوات العملية (CRISP-DM):
📊 Business Understanding: أهمية التنبؤ للتخطيط
🔍 Data Understanding: استكشاف بيانات الأسهم التاريخية
🧹 Data Preparation: تطبيع وتحويل لـ sequences
+ 3 خطوات إضافية
المصادر:
📚 Yahoo Finance Data📚 LSTM for Time Series - Tutorial📚 Understanding LSTM Networks
التعلم العميق
Autoencoder لضغط وإعادة بناء الصور
بناء Autoencoder لضغط الصور وإزالة التشويش منها
المهارات المطلوبة:
AutoencoderDimensionality ReductionDenoisingLatent Space
ماذا ستتعلم:
- •📊 فهم Autoencoders وتطبيقاتها
- •🔍 استكشاف Encoder-Decoder Architecture
- •🧹 إضافة تشويش للبيانات
- + 3 أهداف أخرى...
الخطوات العملية (CRISP-DM):
📊 Business Understanding: ضغط البيانات وإزالة التشويش
🔍 Data Understanding: استخدام MNIST أو Fashion-MNIST
🧹 Data Preparation: إضافة Gaussian Noise للصور
+ 3 خطوات إضافية
المصادر:
📚 Autoencoder Tutorial - Keras📚 Denoising Autoencoder Paper📚 Variational Autoencoder Explained
التعلم العميق
GAN لتوليد صور وجوه واقعية
بناء Generative Adversarial Network لتوليد وجوه بشرية
المهارات المطلوبة:
GANGeneratorDiscriminatorAdversarial Training
ماذا ستتعلم:
- •📊 فهم آلية عمل GANs
- •🔍 تحليل معمارية Generator و Discriminator
- •🧹 تحضير dataset وجوه
- + 3 أهداف أخرى...
الخطوات العملية (CRISP-DM):
📊 Business Understanding: تطبيقات توليد المحتوى
🔍 Data Understanding: استخدام CelebA أو FFHQ dataset
🧹 Data Preparation: تغيير الحجم وتطبيع [-1, 1]
+ 3 خطوات إضافية
المصادر:
📚 CelebA Dataset📚 DCGAN Paper📚 GAN Training Tips
التعلم العميق
تصنيف النصوص باستخدام RNN
بناء RNN لتصنيف تعليقات IMDb (إيجابية/سلبية)
المهارات المطلوبة:
RNNLSTMText ClassificationEmbedding
ماذا ستتعلم:
- •📊 فهم معالجة النصوص بـ RNN
- •🔍 استكشاف datasets النصية
- •🧹 تحويل النص لـ sequences
- + 3 أهداف أخرى...
الخطوات العملية (CRISP-DM):
📊 Business Understanding: تحليل آراء العملاء
🔍 Data Understanding: استكشاف IMDb Reviews Dataset
🧹 Data Preparation: Tokenization + Padding + Embedding
+ 3 خطوات إضافية
المصادر:
📚 IMDB Reviews Dataset📚 Text Classification with RNN📚 Word Embeddings Guide
التعلم العميق
تصنيف صور الأشعة السينية لـ COVID-19
نموذج DL لتشخيص COVID-19 من صور الرئة
المهارات المطلوبة:
Medical ImagingTransfer LearningClass ImbalanceGrad-CAM
ماذا ستتعلم:
- •📊 فهم التطبيقات الطبية للـ DL
- •🔍 التعامل مع البيانات الطبية الحساسة
- •🧹 معالجة Class Imbalance
- + 3 أهداف أخرى...
الخطوات العملية (CRISP-DM):
📊 Business Understanding: أهمية التشخيص المبكر
🔍 Data Understanding: COVID-19 X-Ray Dataset
🧹 Data Preparation: Augmentation + Class Weighting
+ 3 خطوات إضافية
المصادر:
📚 COVID-19 Radiography Database📚 Grad-CAM for Interpretability📚 Medical AI Best Practices
التعلم العميق
نموذج Seq2Seq للترجمة الآلية
بناء نموذج Encoder-Decoder مع Attention للترجمة
المهارات المطلوبة:
Seq2SeqAttention MechanismLSTMMachine Translation
ماذا ستتعلم:
- •📊 فهم Sequence-to-Sequence Models
- •🔍 استكشاف الترجمة الآلية
- •🧹 تحضير parallel corpus
- + 3 أهداف أخرى...
الخطوات العملية (CRISP-DM):
📊 Business Understanding: الحاجة للترجمة الفورية
🔍 Data Understanding: Multi30k (إنجليزي-ألماني)
🧹 Data Preparation: Tokenization + Vocabulary Building
+ 3 خطوات إضافية
المصادر:
📚 Multi30k Dataset📚 Seq2Seq with Attention Paper📚 Neural Machine Translation Tutorial
معالجة اللغة الطبيعية
نظام تحليل المشاعر متعدد اللغات
بناء نموذج يحلل المشاعر (إيجابي/سلبي/محايد) بالعربية والإنجليزية
المهارات المطلوبة:
BERTTransformersMultilingual NLPHugging Face
ماذا ستتعلم:
- •📊 فهم Sentiment Analysis وأهميته التجارية
- •🔍 استكشاف multilingual models
- •🧹 معالجة النصوص العربية والإنجليزية
- + 3 أهداف أخرى...
الخطوات العملية (CRISP-DM):
📊 Business Understanding: تحليل آراء العملاء لتحسين المنتجات
🔍 Data Understanding: استخدام Arabic Sentiment Dataset + IMDB
🧹 Data Preparation: تنظيف النصوص والتوحيد
+ 3 خطوات إضافية
المصادر:
📚 ArSentD-LEV Arabic Sentiment Dataset📚 Hugging Face Transformers📚 mBERT Documentation
معالجة اللغة الطبيعية
نظام استخلاص الكيانات المسماة (NER)
بناء نموذج لاستخلاص الأسماء، الأماكن، المنظمات من النصوص
المهارات المطلوبة:
NERSpaCyBERTToken Classification
ماذا ستتعلم:
- •📊 فهم Named Entity Recognition وتطبيقاته
- •🔍 استكشاف NER datasets
- •🧹 تحضير البيانات لـ Token Classification
- + 3 أهداف أخرى...
الخطوات العملية (CRISP-DM):
📊 Business Understanding: استخراج معلومات من المستندات
🔍 Data Understanding: CoNLL-2003 أو ANERcorp (عربي)
🧹 Data Preparation: تحويل لـ BIO tagging format
+ 3 خطوات إضافية
المصادر:
📚 CoNLL-2003 Dataset📚 SpaCy NER Tutorial📚 BERT for Token Classification
معالجة اللغة الطبيعية
نظام تلخيص النصوص التلقائي
بناء نموذج يلخص مقالات طويلة إلى نقاط رئيسية
المهارات المطلوبة:
Text SummarizationT5BARTSeq2Seq
ماذا ستتعلم:
- •📊 فهم Extractive vs Abstractive Summarization
- •🔍 تحليل datasets التلخيص
- •🧹 تحضير مقالات طويلة
- + 3 أهداف أخرى...
الخطوات العملية (CRISP-DM):
📊 Business Understanding: توفير وقت القراءة للمستخدمين
🔍 Data Understanding: CNN/DailyMail Dataset أو XL-Sum (عربي)
🧹 Data Preparation: تقسيم لـ article-summary pairs
+ 3 خطوات إضافية
المصادر:
📚 XL-Sum Dataset (Multilingual)📚 Hugging Face Summarization📚 ROUGE Score Explained
معالجة اللغة الطبيعية
نظام الأسئلة والأجوبة (Question Answering)
بناء نموذج يجيب على أسئلة من سياق معطى
المهارات المطلوبة:
Question AnsweringBERTSQuADContext Understanding
ماذا ستتعلم:
- •📊 فهم Reading Comprehension
- •🔍 استكشاف QA datasets
- •🧹 تحضير context-question-answer triplets
- + 3 أهداف أخرى...
الخطوات العملية (CRISP-DM):
📊 Business Understanding: تحسين محركات البحث والمساعدات
🔍 Data Understanding: SQuAD 2.0 أو ARCD (عربي)
🧹 Data Preparation: تحديد start و end positions
+ 3 خطوات إضافية
المصادر:
📚 SQuAD Dataset📚 ARCD Arabic QA Dataset📚 Hugging Face QA Pipeline
معالجة اللغة الطبيعية
نظام الترجمة الآلية العصبية
بناء نموذج ترجمة عربي-إنجليزي باستخدام Transformers
المهارات المطلوبة:
Machine TranslationMarianMTSeq2SeqBLEU Score
ماذا ستتعلم:
- •📊 فهم Neural Machine Translation
- •🔍 استكشاف parallel corpora
- •🧹 معالجة أزواج الترجمة
- + 3 أهداف أخرى...
الخطوات العملية (CRISP-DM):
📊 Business Understanding: الحاجة للترجمة في التواصل العالمي
🔍 Data Understanding: OPUS Arabic-English Corpus
🧹 Data Preparation: تنظيف وموازنة أزواج الجمل
+ 3 خطوات إضافية
المصادر:
📚 OPUS Parallel Corpus📚 MarianNMT📚 sacrebleu for Evaluation
معالجة اللغة الطبيعية
كشف الأخبار المزيفة (Fake News Detection)
نموذج يحدد مصداقية الأخبار باستخدام NLP
المهارات المطلوبة:
Text ClassificationBERTMisinformation DetectionFeature Engineering
ماذا ستتعلم:
- •📊 فهم مشكلة Misinformation
- •🔍 تحليل patterns الأخبار المزيفة
- •🧹 Feature Engineering للنصوص الإخبارية
- + 3 أهداف أخرى...
الخطوات العملية (CRISP-DM):
📊 Business Understanding: مكافحة المعلومات المضللة
🔍 Data Understanding: LIAR Dataset أو FakeNewsNet
🧹 Data Preparation: استخلاص features (source, headline, body)
+ 3 خطوات إضافية
المصادر:
📚 LIAR Dataset📚 FakeNewsNet📚 Misinformation Detection Papers
معالجة اللغة الطبيعية
تصحيح الأخطاء الإملائية والنحوية
نموذج يصحح الأخطاء في النصوص تلقائياً
المهارات المطلوبة:
Grammar CorrectionT5Error DetectionSeq2Seq
ماذا ستتعلم:
- •📊 فهم Grammar Correction كمهمة Seq2Seq
- •🔍 تحليل أنواع الأخطاء الشائعة
- •🧹 إنشاء synthetic errors
- + 3 أهداف أخرى...
الخطوات العملية (CRISP-DM):
📊 Business Understanding: تحسين جودة الكتابة
🔍 Data Understanding: C4_200M Dataset أو QALB (عربي)
🧹 Data Preparation: إضافة أخطاء صناعية للنصوص الصحيحة
+ 3 خطوات إضافية
المصادر:
📚 QALB Arabic Grammar Dataset📚 Grammarly Research📚 T5 for Grammar Correction
معالجة اللغة الطبيعية
نظام توليد النصوص الإبداعية
نموذج يولد قصص أو شعر بناءً على بداية معطاة
المهارات المطلوبة:
Text GenerationGPT-2Creative WritingFine-tuning
ماذا ستتعلم:
- •📊 فهم Language Modeling للتوليد
- •🔍 جمع نصوص إبداعية
- •🧹 تحضير corpus للتدريب
- + 3 أهداف أخرى...
الخطوات العملية (CRISP-DM):
📊 Business Understanding: توليد محتوى إبداعي
🔍 Data Understanding: جمع قصص/شعر عربي أو إنجليزي
🧹 Data Preparation: تنسيق النصوص للتدريب
+ 3 خطوات إضافية
المصادر:
📚 WritingPrompts Dataset📚 GPT-2 Fine-tuning Guide📚 AraBERT-GPT للعربية
النماذج اللغوية الضخمة
بناء Chatbot ذكي مع RAG
مساعد ذكي يجيب من مستنداتك الخاصة باستخدام Retrieval Augmented Generation
المهارات المطلوبة:
RAGLangChainVector DBOpenAI APIEmbeddings
ماذا ستتعلم:
- •📊 فهم RAG وأهميته في LLMs
- •🔍 استكشاف Vector Databases
- •🧹 تحضير المستندات للتضمين
- + 3 أهداف أخرى...
الخطوات العملية (CRISP-DM):
📊 Business Understanding: الحاجة لـ chatbot يعرف معلومات خاصة
🔍 Data Understanding: جمع مستندات الشركة/المجال
🧹 Data Preparation: تقسيم لـ chunks + إنشاء embeddings
+ 3 خطوات إضافية
المصادر:
📚 LangChain Documentation📚 Pinecone/ChromaDB📚 OpenAI Embeddings Guide
النماذج اللغوية الضخمة
Fine-tuning GPT على نمط كتابة معين
تخصيص GPT ليكتب بأسلوب معين (رسمي، تقني، إبداعي)
المهارات المطلوبة:
Fine-tuningGPT-3.5OpenAI APIPrompt Engineering
ماذا ستتعلم:
- •📊 فهم Fine-tuning للـ LLMs
- •🔍 جمع بيانات التدريب
- •🧹 تنسيق البيانات لـ OpenAI
- + 3 أهداف أخرى...
الخطوات العملية (CRISP-DM):
📊 Business Understanding: الحاجة لأسلوب كتابة موحد
🔍 Data Understanding: جمع 100+ مثال للأسلوب المطلوب
🧹 Data Preparation: تحويل لـ JSONL format
+ 3 خطوات إضافية
المصادر:
📚 OpenAI Fine-tuning Guide📚 Best Practices for Fine-tuning📚 Example Datasets
النماذج اللغوية الضخمة
LLM Agent مع Tools
بناء Agent يستخدم أدوات خارجية (بحث، حسابات، API)
المهارات المطلوبة:
LangChain AgentsFunction CallingTool IntegrationReAct Pattern
ماذا ستتعلم:
- •📊 فهم LLM Agents
- •🔍 استكشاف Function Calling
- •🧹 تصميم Tools مفيدة
- + 3 أهداف أخرى...
الخطوات العملية (CRISP-DM):
📊 Business Understanding: Agent يؤدي مهام معقدة
🔍 Data Understanding: تحديد الأدوات المطلوبة
🧹 Data Preparation: إنشاء tool descriptions واضحة
+ 3 خطوات إضافية
المصادر:
📚 LangChain Agents Documentation📚 OpenAI Function Calling📚 ReAct Paper
النماذج اللغوية الضخمة
نظام تلخيص المستندات الطويلة
تلخيص PDFs ومستندات طويلة باستخدام LLMs
المهارات المطلوبة:
Document ProcessingMap-ReduceLangChainPDF Parsing
ماذا ستتعلم:
- •📊 فهم Document Summarization
- •🔍 معالجة PDFs والمستندات
- •🧹 تقسيم المستندات الطويلة
- + 3 أهداف أخرى...
الخطوات العملية (CRISP-DM):
📊 Business Understanding: توفير الوقت في قراءة التقارير
🔍 Data Understanding: جمع PDFs متنوعة
🧹 Data Preparation: استخراج النص وتقسيمه
+ 3 خطوات إضافية
المصادر:
📚 PyPDF2/LangChain📚 Map-Reduce Pattern📚 Document Summarization Techniques
النماذج اللغوية الضخمة
بناء LLM Evaluator
نظام لتقييم جودة إجابات LLMs تلقائياً
المهارات المطلوبة:
LLM EvaluationPrompt EngineeringMetricsTesting
ماذا ستتعلم:
- •📊 فهم تحديات تقييم LLMs
- •🔍 استكشاف evaluation metrics
- •🧹 إنشاء test sets
- + 3 أهداف أخرى...
الخطوات العملية (CRISP-DM):
📊 Business Understanding: ضمان جودة LLM outputs
🔍 Data Understanding: إنشاء golden dataset
🧹 Data Preparation: تحديد معايير الجودة
+ 3 خطوات إضافية
المصادر:
📚 LangSmith📚 RAGAS Framework📚 LLM Evaluation Best Practices
النماذج اللغوية الضخمة
Multi-modal LLM Application
تطبيق يعالج النصوص والصور معاً (GPT-4 Vision)
المهارات المطلوبة:
Multi-modal AIGPT-4 VisionImage UnderstandingLangChain
ماذا ستتعلم:
- •📊 فهم Multi-modal LLMs
- •🔍 استكشاف GPT-4 Vision capabilities
- •🧹 تحضير بيانات متعددة الوسائط
- + 3 أهداف أخرى...
الخطوات العملية (CRISP-DM):
📊 Business Understanding: تطبيقات تفهم الصور والنصوص
🔍 Data Understanding: جمع صور مع أوصاف
🧹 Data Preparation: ترميز الصور لـ base64
+ 3 خطوات إضافية
المصادر:
📚 GPT-4 Vision Documentation📚 LangChain Multi-modal📚 Vision Use Cases
النماذج اللغوية الضخمة
نظام Code Assistant مع LLMs
مساعد برمجة يساعد في كتابة وشرح الكود
المهارات المطلوبة:
Code GenerationGPT-4Code UnderstandingGitHub Copilot Patterns
ماذا ستتعلم:
- •📊 فهم Code LLMs
- •🔍 استكشاف code generation patterns
- •🧹 معالجة code context
- + 3 أهداف أخرى...
الخطوات العملية (CRISP-DM):
📊 Business Understanding: تسريع التطوير
🔍 Data Understanding: جمع أمثلة code
🧹 Data Preparation: contextual code retrieval
+ 3 خطوات إضافية
المصادر:
📚 OpenAI Code Examples📚 VS Code Extension API📚 Code Generation Best Practices
النماذج اللغوية الضخمة
Prompt Engineering Framework
بناء نظام لإدارة واختبار prompts
المهارات المطلوبة:
Prompt EngineeringTemplate ManagementA/B TestingVersioning
ماذا ستتعلم:
- •📊 فهم أهمية Prompt Management
- •🔍 استكشاف prompt patterns
- •🧹 تنظيم prompt templates
- + 3 أهداف أخرى...
الخطوات العملية (CRISP-DM):
📊 Business Understanding: تحسين نتائج LLMs
🔍 Data Understanding: جمع prompts فعالة
🧹 Data Preparation: categorize و template prompts
+ 3 خطوات إضافية
المصادر:
📚 Prompt Engineering Guide📚 LangChain PromptTemplate📚 Best Practices