معرض المشاريع التفصيلية

أكثر من 40 مشروع عملي

مشاريع تفصيلية احترافية في الذكاء الاصطناعي وفق منهجية CRISP-DM
من المبتدئين إلى المتقدمين

خطوات واضحة

أمثلة GitHub

مسارات تعليمية

التصنيف:

المستوى:

عرض 40 من أصل 40 مشروع

تعلم الآلة

نظام توصية المنتجات للتجارة الإلكترونية

بناء نظام توصية ذكي يقترح منتجات مناسبة للمستخدمين بناءً على سلوكهم الشرائي

متوسط2-3 أسابيع

المهارات المطلوبة:

Collaborative FilteringPandasScikit-LearnMatrix FactorizationContent-Based Filtering

ماذا ستتعلم:

•فهم وتطبيق خوارزميات Collaborative Filtering
•بناء نظام Content-Based Filtering
•تطبيق تقنيات Matrix Factorization و SVD
+ 3 أهداف أخرى...

الخطوات العملية (CRISP-DM):

📊 فهم المشكلة: تحديد أهداف نظام التوصيات - زيادة المبيعات بنسبة 15-20% من خلال توصيات دقيقة. دراسة سلوك المستخدمين الحالي وأنماط الشراء. تحديد KPIs مثل Click-Through Rate و Conversion Rate. تحليل احتياجات العمل من منصات تجارة إلكترونية ناجحة مثل Amazon و Noon.

🔍 فهم البيانات: تحميل dataset تجارة إلكترونية (مثل Amazon Product Reviews أو Retail Transaction Data). استكشاف المتغيرات: User ID, Product ID, Ratings, Categories, Purchase History. تحليل إحصائي شامل: توزيع التقييمات، المنتجات الأكثر شعبية، المستخدمين الأكثر نشاطاً. رسم Heatmaps و Distribution Plots لفهم الأنماط.

🧹 تحضير البيانات: تنظيف البيانات من القيم المفقودة والتقييمات المكررة. معالجة Cold Start Problem للمستخدمين والمنتجات الجديدة. بناء User-Item Interaction Matrix. تقسيم البيانات 80/20 مع الحفاظ على التسلسل الزمني. Feature Engineering: استخراج ميزات مثل متوسط التقييم، عدد المشتريات السابقة.

+ 3 خطوات إضافية

المصادر:

📚 Amazon Product Reviews Dataset📚 Surprise Library Documentation📚 Recommender Systems Handbook📚 Microsoft Recommenders GitHub📚 FastAPI Documentation

GitHub ابدأ التعلم

تعلم الآلة

كشف الاحتيال في المعاملات المالية

نموذج يكتشف المعاملات الاحتيالية في بيانات البطاقات الائتمانية

متقدم3-4 أسابيع

المهارات المطلوبة:

Imbalanced DataRandom ForestXGBoostFeature Engineering

ماذا ستتعلم:

•التعامل مع البيانات غير المتوازنة
•تطبيق SMOTE و Under-sampling
•استخدام Ensemble Methods
+ 1 أهداف أخرى...

الخطوات العملية (CRISP-DM):

📊 فهم المشكلة: تحديد تكلفة الاحتيال - تخسر البنوك 28 مليار دولار سنوياً عالمياً. تحليل أنواع الاحتيال: سرقة بطاقات، معاملات مشبوهة، اختراقات. تحديد أهداف النموذج: اكتشاف 95%+ من الاحتيال مع تقليل False Positives لعدم إزعاج العملاء. دراسة التوازن بين الأمان وتجربة المستخدم. فهم العواقب: كل False Negative = خسارة مالية، كل False Positive = عميل غاضب.

🔍 فهم البيانات: تحميل Credit Card Fraud Dataset من Kaggle (284,807 معاملة). استكشاف البيانات: 99.83% طبيعية، 0.17% احتيالية - imbalance شديد! تحليل المتغيرات: V1-V28 (PCA-transformed features)، Amount، Time. دراسة أنماط الاحتيال: متوسط مبلغ المعاملات الاحتيالية أقل من الطبيعية. رسم Time Series للمعاملات عبر اليوم. تحليل توزيع Amount للفئتين.

🧹 تحضير البيانات: معالجة Class Imbalance الشديد (492 fraud من 284,807). تقسيم البيانات قبل أي معالجة لتجنب Data Leakage. تطبيع Amount و Time باستخدام StandardScaler. تجربة استراتيجيات Imbalance: SMOTE (Synthetic Minority Oversampling)، Random Under-sampling، SMOTE + Tomek Links. Feature Engineering: Hour of Day، Amount_per_Hour، Transaction_Frequency. إنشاء Stratified splits للحفاظ على نسبة Fraud في Train/Test.

+ 3 خطوات إضافية

المصادر:

📚 Kaggle Credit Card Fraud Dataset📚 Imbalanced-learn Documentation📚 XGBoost Documentation

GitHub ابدأ التعلم

تعلم الآلة

التنبؤ بأسعار المنازل (House Price Prediction)

نموذج يتنبأ بأسعار المنازل بناءً على خصائصها - مثالي للمبتدئين

مبتدئ1-2 أسبوع

المهارات المطلوبة:

RegressionFeature EngineeringPandasScikit-Learn

ماذا ستتعلم:

•فهم Business Understanding في مجال العقارات
•تطبيق Linear و Polynomial Regression
•إتقان Feature Engineering والتعامل مع البيانات الحقيقية
+ 1 أهداف أخرى...

الخطوات العملية (CRISP-DM):

📊 فهم المشكلة: تحديد هدف النموذج - مساعدة وكلاء العقارات والمشترين على تقييم الأسعار بدقة عالية. دراسة العوامل المؤثرة: المساحة، عدد الغرف، الموقع، عمر البناء، المرافق القريبة. تحديد مقياس النجاح: RMSE أقل من 50,000 ريال. فهم احتياجات السوق العقاري المحلي وتوقعات المستخدمين.

🔍 فهم البيانات: تحميل California/Ames Housing Dataset. استكشاف المتغيرات: 79 ميزة تشمل المساحة، الغرف، الحمامات، الموقع، السنة، الحالة. تحليل إحصائي: متوسط السعر، التوزيع، القيم الشاذة. رسم Scatter plots للعلاقة بين السعر والمساحة. تحليل Correlation Matrix لأهم الميزات.

🧹 تحضير البيانات: معالجة القيم المفقودة (47 ميزة بها missing values) - استخدام Mean/Median/Mode حسب نوع البيانات. تحويل المتغيرات الفئوية (Neighborhood, Building Type) إلى Numeric باستخدام One-Hot Encoding. Feature Engineering: إنشاء ميزات جديدة مثل TotalSF (مجموع المساحات)، Age (عمر البناء). إزالة القيم الشاذة باستخدام IQR Method. تطبيع البيانات باستخدام StandardScaler للميزات الرقمية.

+ 3 خطوات إضافية

المصادر:

📚 Kaggle House Prices Dataset📚 Scikit-Learn Regression Guide📚 Feature Engineering Tutorial

GitHub ابدأ التعلم

تعلم الآلة

تصنيف العملاء (Customer Segmentation)

تجميع العملاء إلى فئات متشابهة لاستهداف تسويقي أفضل

متوسط2-3 أسابيع

المهارات المطلوبة:

ClusteringK-MeansPCAUnsupervised Learning

ماذا ستتعلم:

•فهم Unsupervised Learning و Clustering
•تطبيق K-Means, DBSCAN, Hierarchical Clustering
•استخدام PCA لتقليل الأبعاد
+ 1 أهداف أخرى...

الخطوات العملية (CRISP-DM):

📊 فهم المشكلة: تحديد أهداف تجزئة العملاء - زيادة ROI للحملات التسويقية بنسبة 30%. فهم القطاعات المتوقعة: VIP Customers, Frequent Buyers, Occasional Shoppers, At-Risk Customers. تحديد استراتيجية مختلفة لكل segment. دراسة حالات ناجحة من شركات التجزئة الكبرى.

🔍 فهم البيانات: تحميل Online Retail/Mall Customers Dataset. استكشاف المتغيرات: Customer ID, Purchase History, Spending Amount, Frequency, Recency, Demographics. تحليل RFM (Recency-Frequency-Monetary). رسم Distribution plots للإنفاق والتردد. تحديد الأنماط الشرائية الموسمية.

🧹 تحضير البيانات: حساب متغيرات RFM لكل عميل. معالجة القيم المفقودة والشاذة. Feature Engineering: Average Order Value, Days Since Last Purchase, Purchase Categories. تطبيق Feature Scaling باستخدام StandardScaler أو MinMaxScaler. إزالة الـ outliers الشديدة التي قد تشوه النتائج.

+ 3 خطوات إضافية

المصادر:

📚 Mall Customer Segmentation Dataset - Kaggle📚 K-Means Clustering Tutorial📚 PCA Explained

GitHub ابدأ التعلم

تعلم الآلة

كشف البريد المزعج (Spam Detection)

نموذج يميز بين البريد الطبيعي والمزعج باستخدام NLP و ML

مبتدئ1-2 أسبوع

المهارات المطلوبة:

Text ClassificationNLPNaive BayesTF-IDF

ماذا ستتعلم:

•تطبيق Text Preprocessing (Tokenization, Stopwords)
•فهم TF-IDF و Bag of Words
•استخدام Naive Bayes للتصنيف النصي
+ 1 أهداف أخرى...

الخطوات العملية (CRISP-DM):

📊 فهم المشكلة: تحديد تأثير البريد المزعج - 45% من emails عالمياً spam. تكلفة معالجة spam تصل لمليارات سنوياً. تحديد أهداف النموذج: Precision عالي (تجنب False Positives)، Recall جيد (التقاط أكبر عدد من spam). دراسة خصائص البريد المزعج: الكلمات المشبوهة، الروابط، الأرقام، الـ urgency.

🔍 فهم البيانات: تحميل SMS Spam Collection Dataset (5,574 رسالة). استكشاف التوزيع: 87% ham, 13% spam - بيانات غير متوازنة. تحليل طول الرسائل: spam عادة أطول. استخراج الكلمات الأكثر تكراراً في كل فئة. رسم Word Clouds لـ spam و ham.

🧹 تحضير البيانات: تنظيف النص: إزالة HTML tags، URLs، أرقام الهواتف. تحويل النص إلى lowercase. Tokenization باستخدام NLTK. إزالة Stop Words العربية والإنجليزية. تطبيق Stemming/Lemmatization. تحويل النص إلى vectors باستخدام TF-IDF و Bag of Words. معالجة Class Imbalance باستخدام SMOTE أو Class Weights.

+ 3 خطوات إضافية

المصادر:

📚 SMS Spam Collection Dataset📚 NLTK Documentation📚 Text Classification Guide

GitHub ابدأ التعلم

تعلم الآلة

نظام التنبؤ بتغيب الموظفين (Employee Attrition)

توقع احتمالية ترك الموظف للشركة باستخدام HR Analytics

متوسط2-3 أسابيع

المهارات المطلوبة:

ClassificationFeature ImportanceXGBoostSHAP

ماذا ستتعلم:

•التعامل مع بيانات HR Analytics
•فهم Feature Importance و SHAP Values
•معالجة Class Imbalance
+ 1 أهداف أخرى...

الخطوات العملية (CRISP-DM):

📊 فهم المشكلة: تحديد تكلفة استبدال موظف - تصل إلى 150-200% من راتبه السنوي. تحليل معدل التغيب الحالي وتأثيره على الإنتاجية. تحديد أهداف النموذج: التنبؤ المبكر بالموظفين المعرضين للمغادرة. دراسة العوامل المحتملة: الراتب، الرضا الوظيفي، المسافة، ساعات العمل الإضافية، الترقيات.

🔍 فهم البيانات: تحميل IBM HR Analytics Dataset (1,470 موظف، 35 ميزة). استكشاف Attrition Rate: 16.1%. تحليل المتغيرات: Age, Department, JobRole, MonthlyIncome, YearsAtCompany, JobSatisfaction. رسم Distribution plots لكل متغير حسب Attrition. تحليل Correlation: هل الراتب المنخفض يرتبط بالتغيب؟ دراسة التوزيعات الديموغرافية.

🧹 تحضير البيانات: معالجة Class Imbalance (84% stayed vs 16% left). تحويل المتغيرات الفئوية: Department, JobRole, MaritalStatus باستخدام One-Hot Encoding. Feature Engineering: Years Since Last Promotion, Income to Age Ratio, Total Satisfaction Score. تطبيع المتغيرات الرقمية. إنشاء ميزات تفاعلية: OverTime × Distance, JobSatisfaction × YearsAtCompany. تقسيم البيانات 80/20 مع Stratification.

+ 3 خطوات إضافية

المصادر:

📚 IBM HR Analytics Dataset - Kaggle📚 SHAP Documentation📚 XGBoost for HR Analytics

GitHub ابدأ التعلم

تعلم الآلة

نظام تقييم جودة الهواء والتنبؤ بالتلوث

نموذج ذكي لتصنيف جودة الهواء والتنبؤ بمستويات التلوث بناءً على القياسات البيئية

مبتدئ1-2 أسبوع

المهارات المطلوبة:

Multi-class ClassificationTime SeriesFeature EngineeringScikit-LearnXGBoost

ماذا ستتعلم:

•فهم وتطبيق Multi-class Classification
•التعامل مع البيانات البيئية والزمنية
•تطبيق Feature Selection و Engineering
+ 3 أهداف أخرى...

الخطوات العملية (CRISP-DM):

📊 فهم المشكلة: تحديد أهمية مراقبة جودة الهواء للصحة العامة - تقليل أمراض الجهاز التنفسي. دراسة معايير منظمة الصحة العالمية لجودة الهواء (PM2.5, PM10, NO2, SO2, CO, O3). تحديد الفئات: جيد، متوسط، غير صحي، خطر. فهم احتياجات البلديات والجهات البيئية.

🔍 فهم البيانات: تحميل Air Quality Dataset من مدن مختلفة. استكشاف المتغيرات: PM2.5, PM10, NO2, SO2, CO, O3, Temperature, Humidity, Wind Speed. تحليل التوزيعات والقيم الشاذة. دراسة الارتباطات بين الملوثات. رسم Time Series للتلوث عبر الزمن والمواسم.

🧹 تحضير البيانات: معالجة القيم المفقودة بطرق ذكية (Interpolation, Forward Fill). تحويل Timestamp إلى ميزات زمنية (Hour, Day, Month, Season). حساب Moving Averages للملوثات. Feature Engineering: نسب الملوثات، التفاعلات بين المتغيرات. تطبيع البيانات باستخدام StandardScaler. معالجة Class Imbalance إذا وجدت.

+ 3 خطوات إضافية

المصادر:

📚 Air Quality Dataset - UCI/Kaggle📚 WHO Air Quality Guidelines📚 Scikit-Learn Multi-class Guide📚 XGBoost Documentation📚 Environmental Data Analysis

GitHub ابدأ التعلم

تعلم الآلة

نظام توقع الإقراض (Loan Approval Prediction)

نموذج يقرر قبول أو رفض طلب القرض بناءً على معلومات المتقدم

متوسط2-3 أسابيع

المهارات المطلوبة:

ClassificationFeature EngineeringModel InterpretationFairness

ماذا ستتعلم:

•بناء نموذج تصنيف للقرارات المالية
•التعامل مع البيانات المالية الحساسة
•فهم Fairness و Bias في نماذج ML
+ 1 أهداف أخرى...

الخطوات العملية (CRISP-DM):

📊 فهم المشكلة: دراسة معايير اتخاذ قرار الإقراض - تقليل Default Rate من 8% إلى 3%. تحليل المخاطر المالية وتكلفة القروض الفاشلة. فهم العوامل المؤثرة: الدخل، تاريخ الائتمان، نسبة الدين للدخل، مدة التوظيف. دراسة القوانين والأنظمة المتعلقة بـ Fair Lending و Anti-Discrimination.

🔍 فهم البيانات: تحميل Loan Prediction Dataset (614 طلب قرض، 13 متغير). استكشاف المتغيرات: Gender, Married, Dependents, Education, Self_Employed, ApplicantIncome, LoanAmount, Credit_History. تحليل Approval Rate: 69% approved. دراسة توزيع الدخل والقروض. تحليل تأثير Credit History على القبول. رسم Correlation Matrix للعوامل المالية.

🧹 تحضير البيانات: معالجة 22% قيم مفقودة في متغيرات مختلفة - استخدام Mode للفئوية و Median للرقمية. تحويل المتغيرات الفئوية: Gender, Married, Education بـ Label Encoding. Feature Engineering: Total Income (Applicant + Coapplicant), EMI (قسط شهري متوقع), Loan to Income Ratio. معالجة Outliers في الدخل والقروض. Log Transformation للمتغيرات المائلة. Standardization للمتغيرات الرقمية.

+ 3 خطوات إضافية

المصادر:

📚 Loan Prediction Dataset - Kaggle📚 Fairness in ML - Google📚 Model Interpretability Guide

GitHub ابدأ التعلم

الرؤية الحاسوبية

نظام كشف العيوب الصناعية بالرؤية الحاسوبية

بناء نظام AI يكتشف العيوب في خطوط الإنتاج باستخدام YOLOv8

متقدم3-4 أسابيع

المهارات المطلوبة:

YOLOv8OpenCVPyTorchImage Processing

ماذا ستتعلم:

•تطبيق Object Detection في بيئة صناعية حقيقية
•تجميع وتصنيف بيانات العيوب
•تدريب YOLO على dataset مخصص
+ 2 أهداف أخرى...

الخطوات العملية (CRISP-DM):

📊 فهم المشكلة: تحديد أهمية كشف العيوب في خطوط الإنتاج - منع وصول منتجات معيبة للعملاء. تحليل نسبة العيوب الحالية: 2-5%. تحديد أهداف النظام: كشف 95%+ من العيوب، سرعة 50+ FPS. دراسة أنواع العيوب: خدوش، شقوق، لطخات، أخطاء طباعة. فهم بيئة العمل: إضاءة، سرعة الإنتاج، متطلبات الأجهزة.

🔍 فهم البيانات: جمع صور من خط الإنتاج - 500+ صورة لمنتجات سليمة، 300+ لمعيبة. استكشاف أنماط العيوب المختلفة. تحليل شروط التصوير: الإضاءة، الزوايا، الدقة. دراسة توزيع أحجام العيوب. استخدام مجموعات بيانات عامة: MVTec AD Dataset كمرجع.

🧹 تحضير البيانات: استخدام Roboflow لتوسيم العيوب بـ Bounding Boxes. تصنيف العيوب إلى فئات (scratch, crack, stain, print_error). تطبيق Data Augmentation: تدوير، flip، brightness، تغيير السطوع. تقسيم 80/10/10 (train/val/test). تطبيع الصور لحجم موحد 640x640. معالجة Class Imbalance إذا وجدت.

+ 3 خطوات إضافية

المصادر:

📚 Roboflow: https://roboflow.com📚 YOLOv8 Docs: https://docs.ultralytics.com📚 Industrial Defect Dataset

GitHub ابدأ التعلم

الرؤية الحاسوبية

نظام مراقبة ذكي مع تتبع الأشخاص

بناء نظام يكتشف ويتتبع الأشخاص في الفيديو مع إحصائيات

متوسط2-3 أسابيع

المهارات المطلوبة:

YOLODeepSORTOpenCVTracking

ماذا ستتعلم:

•فهم Object Tracking Algorithms
•دمج YOLO مع DeepSORT
•معالجة فيديوهات في Real-time
+ 1 أهداف أخرى...

الخطوات العملية (CRISP-DM):

📊 فهم المشكلة: تحديد احتياجات نظام المراقبة - عد الأشخاص، تتبع الحركة، كشف السلوكيات المشبوهة. تحليل تطبيقات النظام: مراكز تجارية، مدارس، مكاتب. تحديد متطلبات الأداء: 25+ FPS، دقة 95%+. فهم التحديات: Occlusion، تغير الإضاءة، ازدحام الناس. دراسة متطلبات الخصوصية.

🔍 فهم البيانات: جمع فيديوهات من زوايا مختلفة. تحليل أنماط الحركة المختلفة. دراسة تروط التصوير: إضاءة، دقة، زاوية. استكشاف تحديات: occlusions, crowded scenes. استخدام MOT Challenge Dataset للتقييم.

🧹 تحضير البيانات: إعداد YOLOv8 للكشف عن الأشخاص (person class). معايرة النموذج للدقة والسرعة. ضبط Confidence Threshold لتقليل False Positives. معالجة الفيديو: تحسين الجودة، تقليل التشويش. تطبيق Background Subtraction لتحسين الكشف.

+ 3 خطوات إضافية

المصادر:

📚 DeepSORT Paper📚 OpenCV Video Processing

GitHub ابدأ التعلم

الرؤية الحاسوبية

نظام التعرف على الوجوه (Face Recognition System)

بناء نظام يتعرف على الأشخاص من الوجوه باستخدام Deep Learning

متوسط2-3 أسابيع

المهارات المطلوبة:

Face RecognitionFaceNetOpenCVdlib

ماذا ستتعلم:

•📊 فهم مشكلة Face Recognition وتطبيقاتها الأمنية
•🔍 استكشاف datasets الوجوه المتاحة
•🧹 معالجة الصور وتطبيع الوجوه
+ 3 أهداف أخرى...

الخطوات العملية (CRISP-DM):

📊 Business Understanding: تحديد متطلبات نظام الأمان والدقة المطلوبة

🔍 Data Understanding: جمع صور للأشخاص المستهدفين

🧹 Data Preparation: كشف الوجوه باستخدام MTCNN وتطبيع الصور

+ 3 خطوات إضافية

المصادر:

📚 LFW (Labeled Faces in the Wild) Dataset📚 FaceNet Paper📚 DeepFace Library

GitHub ابدأ التعلم

الرؤية الحاسوبية

نظام عد المركبات في الشوارع (Vehicle Counter)

كشف وعد المركبات في فيديوهات المرور مع تصنيف الأنواع

متوسط2-3 أسابيع

المهارات المطلوبة:

Object DetectionYOLOv8TrackingOpenCV

ماذا ستتعلم:

•📊 فهم تطبيقات المرور الذكي
•🔍 تحليل فيديوهات المرور
•🧹 معالجة الفيديو وتحسين الجودة
+ 3 أهداف أخرى...

الخطوات العملية (CRISP-DM):

📊 Business Understanding: احتياجات إدارة المرور للبيانات

🔍 Data Understanding: الحصول على فيديوهات مرور متنوعة

🧹 Data Preparation: تحسين جودة الفيديو ومعالجة الإضاءة

+ 3 خطوات إضافية

المصادر:

📚 UA-DETRAC Dataset📚 YOLOv8 Vehicle Detection📚 OpenCV Vehicle Tracking

GitHub ابدأ التعلم

الرؤية الحاسوبية

تصنيف الأمراض الجلدية (Skin Disease Classification)

نموذج يشخص الأمراض الجلدية من صور الجلد - تطبيق طبي

متقدم3-4 أسابيع

المهارات المطلوبة:

Medical ImagingCNNTransfer LearningData Augmentation

ماذا ستتعلم:

•📊 فهم التحديات الطبية في تشخيص الأمراض
•🔍 التعامل مع Medical Datasets
•🧹 Data Augmentation للبيانات الطبية
+ 3 أهداف أخرى...

الخطوات العملية (CRISP-DM):

📊 Business Understanding: أهمية التشخيص المبكر للأمراض الجلدية

🔍 Data Understanding: استكشاف HAM10000 Skin Lesion Dataset

🧹 Data Preparation: معالجة Class Imbalance و Augmentation

+ 3 خطوات إضافية

المصادر:

📚 HAM10000 Dataset - Kaggle📚 Medical Image Classification Guide📚 EfficientNet Paper

GitHub ابدأ التعلم

الرؤية الحاسوبية

كشف لوحات السيارات (License Plate Detection)

نظام ALPR لكشف وقراءة لوحات السيارات تلقائياً

متقدم3-4 أسابيع

المهارات المطلوبة:

OCRYOLOTesseractImage Processing

ماذا ستتعلم:

•📊 فهم أنظمة ALPR وتطبيقاتها
•🔍 تحليل تحديات لوحات السيارات
•🧹 معالجة الصور وتحسين الوضوح
+ 3 أهداف أخرى...

الخطوات العملية (CRISP-DM):

📊 Business Understanding: احتياجات الأمن والمواقف

🔍 Data Understanding: جمع صور لوحات متنوعة

🧹 Data Preparation: تصنيف وتحسين جودة الصور

+ 3 خطوات إضافية

المصادر:

📚 OpenALPR📚 Car License Plate Dataset📚 Tesseract OCR

GitHub ابدأ التعلم

الرؤية الحاسوبية

كشف الحرائق في الوقت الفعلي (Fire Detection)

نظام يكتشف الحرائق والدخان من كاميرات المراقبة

متوسط2-3 أسابيع

المهارات المطلوبة:

Computer VisionReal-time DetectionColor-based DetectionCNN

ماذا ستتعلم:

•📊 فهم أهمية الإنذار المبكر للحرائق
•🔍 تحليل خصائص النار والدخان البصرية
•🧹 تحضير dataset للحرائق
+ 3 أهداف أخرى...

الخطوات العملية (CRISP-DM):

📊 Business Understanding: تطبيقات السلامة والإنقاذ المبكر

🔍 Data Understanding: جمع صور/فيديوهات للحرائق والدخان

🧹 Data Preparation: Augmentation وتوسيم الحرائق

+ 3 خطوات إضافية

المصادر:

📚 Fire Detection Dataset - Kaggle📚 Real-time Fire Detection Paper📚 YOLOv8 Custom Training

GitHub ابدأ التعلم

الرؤية الحاسوبية

نظام قياس المسافات الاجتماعية (Social Distance Monitor)

كشف انتهاكات المسافة الاجتماعية في الأماكن العامة

متقدم2-3 أسابيع

المهارات المطلوبة:

YOLODistance CalculationPerspective TransformOpenCV

ماذا ستتعلم:

•📊 فهم تطبيقات الصحة العامة
•🔍 تحليل المسافات في الفيديو
•🧹 معالجة زوايا الكاميرا
+ 3 أهداف أخرى...

الخطوات العملية (CRISP-DM):

📊 Business Understanding: أهمية المسافة الاجتماعية للوقاية

🔍 Data Understanding: فيديوهات الأماكن المزدحمة

🧹 Data Preparation: تطبيق Perspective Transform

+ 3 خطوات إضافية

المصادر:

📚 Social Distancing Detection GitHub📚 Perspective Transform Tutorial📚 Distance Calculation in CV

GitHub ابدأ التعلم

التعلم العميق

بناء CNN من الصفر لتصنيف CIFAR-10

بناء شبكة عصبية تلافيفية من الصفر لتصنيف 10 فئات من الصور

متوسط2-3 أسابيع

المهارات المطلوبة:

CNNPyTorchData AugmentationBatch Normalization

ماذا ستتعلم:

•📊 فهم معمارية CNNs وكيفية عملها
•🔍 استكشاف CIFAR-10 dataset الشهير
•🧹 تطبيق Data Augmentation لتحسين التعميم
+ 3 أهداف أخرى...

الخطوات العملية (CRISP-DM):

📊 Business Understanding: أهمية تصنيف الصور التلقائي

🔍 Data Understanding: تحليل CIFAR-10 (60K صورة، 10 فئات)

🧹 Data Preparation: Data Augmentation (Rotation, Flip, Crop)

+ 3 خطوات إضافية

المصادر:

📚 CIFAR-10 Dataset📚 PyTorch CNN Tutorial📚 Deep Learning Book - Goodfellow

GitHub ابدأ التعلم

التعلم العميق

Transfer Learning مع ResNet لتصنيف الحيوانات

استخدام نموذج ResNet50 المُدرب مسبقاً لتصنيف صور الحيوانات

متوسط1-2 أسبوع

المهارات المطلوبة:

Transfer LearningResNetFine-tuningPyTorch

ماذا ستتعلم:

•📊 فهم Transfer Learning وفوائده
•🔍 استخدام نماذج pre-trained
•🧹 تجهيز dataset مخصص
+ 3 أهداف أخرى...

الخطوات العملية (CRISP-DM):

📊 Business Understanding: توفير الوقت باستخدام النماذج المُدربة

🔍 Data Understanding: جمع dataset حيوانات (Cats, Dogs, Birds)

🧹 Data Preparation: تغيير حجم الصور للمتطلبات المطلوبة

+ 3 خطوات إضافية

المصادر:

📚 Animals-10 Dataset - Kaggle📚 Transfer Learning Guide - PyTorch📚 ResNet Paper

GitHub ابدأ التعلم

التعلم العميق

LSTM للتنبؤ بالسلاسل الزمنية (Time Series)

بناء LSTM للتنبؤ بأسعار الأسهم أو استهلاك الطاقة

متقدم2-3 أسابيع

المهارات المطلوبة:

LSTMRNNTime SeriesSequence Modeling

ماذا ستتعلم:

•📊 فهم السلاسل الزمنية وتحدياتها
•🔍 تحليل أنماط البيانات التسلسلية
•🧹 تحضير البيانات بطريقة sliding window
+ 3 أهداف أخرى...

الخطوات العملية (CRISP-DM):

📊 Business Understanding: أهمية التنبؤ للتخطيط

🔍 Data Understanding: استكشاف بيانات الأسهم التاريخية

🧹 Data Preparation: تطبيع وتحويل لـ sequences

+ 3 خطوات إضافية

المصادر:

📚 Yahoo Finance Data📚 LSTM for Time Series - Tutorial📚 Understanding LSTM Networks

GitHub ابدأ التعلم

التعلم العميق

Autoencoder لضغط وإعادة بناء الصور

بناء Autoencoder لضغط الصور وإزالة التشويش منها

متوسط2 أسبوع

المهارات المطلوبة:

AutoencoderDimensionality ReductionDenoisingLatent Space

ماذا ستتعلم:

•📊 فهم Autoencoders وتطبيقاتها
•🔍 استكشاف Encoder-Decoder Architecture
•🧹 إضافة تشويش للبيانات
+ 3 أهداف أخرى...

الخطوات العملية (CRISP-DM):

📊 Business Understanding: ضغط البيانات وإزالة التشويش

🔍 Data Understanding: استخدام MNIST أو Fashion-MNIST

🧹 Data Preparation: إضافة Gaussian Noise للصور

+ 3 خطوات إضافية

المصادر:

📚 Autoencoder Tutorial - Keras📚 Denoising Autoencoder Paper📚 Variational Autoencoder Explained

GitHub ابدأ التعلم

التعلم العميق

GAN لتوليد صور وجوه واقعية

بناء Generative Adversarial Network لتوليد وجوه بشرية

متقدم3-4 أسابيع

المهارات المطلوبة:

GANGeneratorDiscriminatorAdversarial Training

ماذا ستتعلم:

•📊 فهم آلية عمل GANs
•🔍 تحليل معمارية Generator و Discriminator
•🧹 تحضير dataset وجوه
+ 3 أهداف أخرى...

الخطوات العملية (CRISP-DM):

📊 Business Understanding: تطبيقات توليد المحتوى

🔍 Data Understanding: استخدام CelebA أو FFHQ dataset

🧹 Data Preparation: تغيير الحجم وتطبيع [-1, 1]

+ 3 خطوات إضافية

المصادر:

📚 CelebA Dataset📚 DCGAN Paper📚 GAN Training Tips

GitHub ابدأ التعلم

التعلم العميق

تصنيف النصوص باستخدام RNN

بناء RNN لتصنيف تعليقات IMDb (إيجابية/سلبية)

متوسط2 أسبوع

المهارات المطلوبة:

RNNLSTMText ClassificationEmbedding

ماذا ستتعلم:

•📊 فهم معالجة النصوص بـ RNN
•🔍 استكشاف datasets النصية
•🧹 تحويل النص لـ sequences
+ 3 أهداف أخرى...

الخطوات العملية (CRISP-DM):

📊 Business Understanding: تحليل آراء العملاء

🔍 Data Understanding: استكشاف IMDb Reviews Dataset

🧹 Data Preparation: Tokenization + Padding + Embedding

+ 3 خطوات إضافية

المصادر:

📚 IMDB Reviews Dataset📚 Text Classification with RNN📚 Word Embeddings Guide

GitHub ابدأ التعلم

التعلم العميق

تصنيف صور الأشعة السينية لـ COVID-19

نموذج DL لتشخيص COVID-19 من صور الرئة

متقدم3 أسبوع

المهارات المطلوبة:

Medical ImagingTransfer LearningClass ImbalanceGrad-CAM

ماذا ستتعلم:

•📊 فهم التطبيقات الطبية للـ DL
•🔍 التعامل مع البيانات الطبية الحساسة
•🧹 معالجة Class Imbalance
+ 3 أهداف أخرى...

الخطوات العملية (CRISP-DM):

📊 Business Understanding: أهمية التشخيص المبكر

🔍 Data Understanding: COVID-19 X-Ray Dataset

🧹 Data Preparation: Augmentation + Class Weighting

+ 3 خطوات إضافية

المصادر:

📚 COVID-19 Radiography Database📚 Grad-CAM for Interpretability📚 Medical AI Best Practices

GitHub ابدأ التعلم

التعلم العميق

نموذج Seq2Seq للترجمة الآلية

بناء نموذج Encoder-Decoder مع Attention للترجمة

متقدم3-4 أسابيع

المهارات المطلوبة:

Seq2SeqAttention MechanismLSTMMachine Translation

ماذا ستتعلم:

•📊 فهم Sequence-to-Sequence Models
•🔍 استكشاف الترجمة الآلية
•🧹 تحضير parallel corpus
+ 3 أهداف أخرى...

الخطوات العملية (CRISP-DM):

📊 Business Understanding: الحاجة للترجمة الفورية

🔍 Data Understanding: Multi30k (إنجليزي-ألماني)

🧹 Data Preparation: Tokenization + Vocabulary Building

+ 3 خطوات إضافية

المصادر:

📚 Multi30k Dataset📚 Seq2Seq with Attention Paper📚 Neural Machine Translation Tutorial

GitHub ابدأ التعلم

معالجة اللغة الطبيعية

نظام تحليل المشاعر متعدد اللغات

بناء نموذج يحلل المشاعر (إيجابي/سلبي/محايد) بالعربية والإنجليزية

متوسط2-3 أسابيع

المهارات المطلوبة:

BERTTransformersMultilingual NLPHugging Face

ماذا ستتعلم:

•📊 فهم Sentiment Analysis وأهميته التجارية
•🔍 استكشاف multilingual models
•🧹 معالجة النصوص العربية والإنجليزية
+ 3 أهداف أخرى...

الخطوات العملية (CRISP-DM):

📊 Business Understanding: تحليل آراء العملاء لتحسين المنتجات

🔍 Data Understanding: استخدام Arabic Sentiment Dataset + IMDB

🧹 Data Preparation: تنظيف النصوص والتوحيد

+ 3 خطوات إضافية

المصادر:

📚 ArSentD-LEV Arabic Sentiment Dataset📚 Hugging Face Transformers📚 mBERT Documentation

GitHub ابدأ التعلم

معالجة اللغة الطبيعية

نظام استخلاص الكيانات المسماة (NER)

بناء نموذج لاستخلاص الأسماء، الأماكن، المنظمات من النصوص

متقدم3 أسابيع

المهارات المطلوبة:

NERSpaCyBERTToken Classification

ماذا ستتعلم:

•📊 فهم Named Entity Recognition وتطبيقاته
•🔍 استكشاف NER datasets
•🧹 تحضير البيانات لـ Token Classification
+ 3 أهداف أخرى...

الخطوات العملية (CRISP-DM):

📊 Business Understanding: استخراج معلومات من المستندات

🔍 Data Understanding: CoNLL-2003 أو ANERcorp (عربي)

🧹 Data Preparation: تحويل لـ BIO tagging format

+ 3 خطوات إضافية

المصادر:

📚 CoNLL-2003 Dataset📚 SpaCy NER Tutorial📚 BERT for Token Classification

GitHub ابدأ التعلم

معالجة اللغة الطبيعية

نظام تلخيص النصوص التلقائي

بناء نموذج يلخص مقالات طويلة إلى نقاط رئيسية

متقدم3-4 أسابيع

المهارات المطلوبة:

Text SummarizationT5BARTSeq2Seq

ماذا ستتعلم:

•📊 فهم Extractive vs Abstractive Summarization
•🔍 تحليل datasets التلخيص
•🧹 تحضير مقالات طويلة
+ 3 أهداف أخرى...

الخطوات العملية (CRISP-DM):

📊 Business Understanding: توفير وقت القراءة للمستخدمين

🔍 Data Understanding: CNN/DailyMail Dataset أو XL-Sum (عربي)

🧹 Data Preparation: تقسيم لـ article-summary pairs

+ 3 خطوات إضافية

المصادر:

📚 XL-Sum Dataset (Multilingual)📚 Hugging Face Summarization📚 ROUGE Score Explained

GitHub ابدأ التعلم

معالجة اللغة الطبيعية

نظام الأسئلة والأجوبة (Question Answering)

بناء نموذج يجيب على أسئلة من سياق معطى

متقدم2-3 أسابيع

المهارات المطلوبة:

Question AnsweringBERTSQuADContext Understanding

ماذا ستتعلم:

•📊 فهم Reading Comprehension
•🔍 استكشاف QA datasets
•🧹 تحضير context-question-answer triplets
+ 3 أهداف أخرى...

الخطوات العملية (CRISP-DM):

📊 Business Understanding: تحسين محركات البحث والمساعدات

🔍 Data Understanding: SQuAD 2.0 أو ARCD (عربي)

🧹 Data Preparation: تحديد start و end positions

+ 3 خطوات إضافية

المصادر:

📚 SQuAD Dataset📚 ARCD Arabic QA Dataset📚 Hugging Face QA Pipeline

GitHub ابدأ التعلم

معالجة اللغة الطبيعية

نظام الترجمة الآلية العصبية

بناء نموذج ترجمة عربي-إنجليزي باستخدام Transformers

متقدم3-4 أسابيع

المهارات المطلوبة:

Machine TranslationMarianMTSeq2SeqBLEU Score

ماذا ستتعلم:

•📊 فهم Neural Machine Translation
•🔍 استكشاف parallel corpora
•🧹 معالجة أزواج الترجمة
+ 3 أهداف أخرى...

الخطوات العملية (CRISP-DM):

📊 Business Understanding: الحاجة للترجمة في التواصل العالمي

🔍 Data Understanding: OPUS Arabic-English Corpus

🧹 Data Preparation: تنظيف وموازنة أزواج الجمل

+ 3 خطوات إضافية

المصادر:

📚 OPUS Parallel Corpus📚 MarianNMT📚 sacrebleu for Evaluation

GitHub ابدأ التعلم

معالجة اللغة الطبيعية

كشف الأخبار المزيفة (Fake News Detection)

نموذج يحدد مصداقية الأخبار باستخدام NLP

متوسط2-3 أسابيع

المهارات المطلوبة:

Text ClassificationBERTMisinformation DetectionFeature Engineering

ماذا ستتعلم:

•📊 فهم مشكلة Misinformation
•🔍 تحليل patterns الأخبار المزيفة
•🧹 Feature Engineering للنصوص الإخبارية
+ 3 أهداف أخرى...

الخطوات العملية (CRISP-DM):

📊 Business Understanding: مكافحة المعلومات المضللة

🔍 Data Understanding: LIAR Dataset أو FakeNewsNet

🧹 Data Preparation: استخلاص features (source, headline, body)

+ 3 خطوات إضافية

المصادر:

📚 LIAR Dataset📚 FakeNewsNet📚 Misinformation Detection Papers

GitHub ابدأ التعلم

معالجة اللغة الطبيعية

تصحيح الأخطاء الإملائية والنحوية

نموذج يصحح الأخطاء في النصوص تلقائياً

متوسط2 أسبوع

المهارات المطلوبة:

Grammar CorrectionT5Error DetectionSeq2Seq

ماذا ستتعلم:

•📊 فهم Grammar Correction كمهمة Seq2Seq
•🔍 تحليل أنواع الأخطاء الشائعة
•🧹 إنشاء synthetic errors
+ 3 أهداف أخرى...

الخطوات العملية (CRISP-DM):

📊 Business Understanding: تحسين جودة الكتابة

🔍 Data Understanding: C4_200M Dataset أو QALB (عربي)

🧹 Data Preparation: إضافة أخطاء صناعية للنصوص الصحيحة

+ 3 خطوات إضافية

المصادر:

📚 QALB Arabic Grammar Dataset📚 Grammarly Research📚 T5 for Grammar Correction

GitHub ابدأ التعلم

معالجة اللغة الطبيعية

نظام توليد النصوص الإبداعية

نموذج يولد قصص أو شعر بناءً على بداية معطاة

متقدم3 أسابيع

المهارات المطلوبة:

Text GenerationGPT-2Creative WritingFine-tuning

ماذا ستتعلم:

•📊 فهم Language Modeling للتوليد
•🔍 جمع نصوص إبداعية
•🧹 تحضير corpus للتدريب
+ 3 أهداف أخرى...

الخطوات العملية (CRISP-DM):

📊 Business Understanding: توليد محتوى إبداعي

🔍 Data Understanding: جمع قصص/شعر عربي أو إنجليزي

🧹 Data Preparation: تنسيق النصوص للتدريب

+ 3 خطوات إضافية

المصادر:

📚 WritingPrompts Dataset📚 GPT-2 Fine-tuning Guide📚 AraBERT-GPT للعربية

GitHub ابدأ التعلم

النماذج اللغوية الضخمة

بناء Chatbot ذكي مع RAG

مساعد ذكي يجيب من مستنداتك الخاصة باستخدام Retrieval Augmented Generation

متوسط2-3 أسابيع

المهارات المطلوبة:

RAGLangChainVector DBOpenAI APIEmbeddings

ماذا ستتعلم:

•📊 فهم RAG وأهميته في LLMs
•🔍 استكشاف Vector Databases
•🧹 تحضير المستندات للتضمين
+ 3 أهداف أخرى...

الخطوات العملية (CRISP-DM):

📊 Business Understanding: الحاجة لـ chatbot يعرف معلومات خاصة

🔍 Data Understanding: جمع مستندات الشركة/المجال

🧹 Data Preparation: تقسيم لـ chunks + إنشاء embeddings

+ 3 خطوات إضافية

المصادر:

📚 LangChain Documentation📚 Pinecone/ChromaDB📚 OpenAI Embeddings Guide

GitHub ابدأ التعلم

النماذج اللغوية الضخمة

Fine-tuning GPT على نمط كتابة معين

تخصيص GPT ليكتب بأسلوب معين (رسمي، تقني، إبداعي)

متوسط2 أسبوع

المهارات المطلوبة:

Fine-tuningGPT-3.5OpenAI APIPrompt Engineering

ماذا ستتعلم:

•📊 فهم Fine-tuning للـ LLMs
•🔍 جمع بيانات التدريب
•🧹 تنسيق البيانات لـ OpenAI
+ 3 أهداف أخرى...

الخطوات العملية (CRISP-DM):

📊 Business Understanding: الحاجة لأسلوب كتابة موحد

🔍 Data Understanding: جمع 100+ مثال للأسلوب المطلوب

🧹 Data Preparation: تحويل لـ JSONL format

+ 3 خطوات إضافية

المصادر:

📚 OpenAI Fine-tuning Guide📚 Best Practices for Fine-tuning📚 Example Datasets

GitHub ابدأ التعلم

النماذج اللغوية الضخمة

LLM Agent مع Tools

بناء Agent يستخدم أدوات خارجية (بحث، حسابات، API)

متقدم3-4 أسابيع

المهارات المطلوبة:

LangChain AgentsFunction CallingTool IntegrationReAct Pattern

ماذا ستتعلم:

•📊 فهم LLM Agents
•🔍 استكشاف Function Calling
•🧹 تصميم Tools مفيدة
+ 3 أهداف أخرى...

الخطوات العملية (CRISP-DM):

📊 Business Understanding: Agent يؤدي مهام معقدة

🔍 Data Understanding: تحديد الأدوات المطلوبة

🧹 Data Preparation: إنشاء tool descriptions واضحة

+ 3 خطوات إضافية

المصادر:

📚 LangChain Agents Documentation📚 OpenAI Function Calling📚 ReAct Paper

GitHub ابدأ التعلم

النماذج اللغوية الضخمة

نظام تلخيص المستندات الطويلة

تلخيص PDFs ومستندات طويلة باستخدام LLMs

متوسط2 أسبوع

المهارات المطلوبة:

Document ProcessingMap-ReduceLangChainPDF Parsing

ماذا ستتعلم:

•📊 فهم Document Summarization
•🔍 معالجة PDFs والمستندات
•🧹 تقسيم المستندات الطويلة
+ 3 أهداف أخرى...

الخطوات العملية (CRISP-DM):

📊 Business Understanding: توفير الوقت في قراءة التقارير

🔍 Data Understanding: جمع PDFs متنوعة

🧹 Data Preparation: استخراج النص وتقسيمه

+ 3 خطوات إضافية

المصادر:

📚 PyPDF2/LangChain📚 Map-Reduce Pattern📚 Document Summarization Techniques

GitHub ابدأ التعلم

النماذج اللغوية الضخمة

بناء LLM Evaluator

نظام لتقييم جودة إجابات LLMs تلقائياً

متقدم2-3 أسابيع

المهارات المطلوبة:

LLM EvaluationPrompt EngineeringMetricsTesting

ماذا ستتعلم:

•📊 فهم تحديات تقييم LLMs
•🔍 استكشاف evaluation metrics
•🧹 إنشاء test sets
+ 3 أهداف أخرى...

الخطوات العملية (CRISP-DM):

📊 Business Understanding: ضمان جودة LLM outputs

🔍 Data Understanding: إنشاء golden dataset

🧹 Data Preparation: تحديد معايير الجودة

+ 3 خطوات إضافية

المصادر:

📚 LangSmith📚 RAGAS Framework📚 LLM Evaluation Best Practices

GitHub ابدأ التعلم

النماذج اللغوية الضخمة

Multi-modal LLM Application

تطبيق يعالج النصوص والصور معاً (GPT-4 Vision)

متقدم3 أسابيع

المهارات المطلوبة:

Multi-modal AIGPT-4 VisionImage UnderstandingLangChain

ماذا ستتعلم:

•📊 فهم Multi-modal LLMs
•🔍 استكشاف GPT-4 Vision capabilities
•🧹 تحضير بيانات متعددة الوسائط
+ 3 أهداف أخرى...

الخطوات العملية (CRISP-DM):

📊 Business Understanding: تطبيقات تفهم الصور والنصوص

🔍 Data Understanding: جمع صور مع أوصاف

🧹 Data Preparation: ترميز الصور لـ base64

+ 3 خطوات إضافية

المصادر:

📚 GPT-4 Vision Documentation📚 LangChain Multi-modal📚 Vision Use Cases

GitHub ابدأ التعلم

النماذج اللغوية الضخمة

نظام Code Assistant مع LLMs

مساعد برمجة يساعد في كتابة وشرح الكود

متقدم3-4 أسابيع

المهارات المطلوبة:

Code GenerationGPT-4Code UnderstandingGitHub Copilot Patterns

ماذا ستتعلم:

•📊 فهم Code LLMs
•🔍 استكشاف code generation patterns
•🧹 معالجة code context
+ 3 أهداف أخرى...

الخطوات العملية (CRISP-DM):

📊 Business Understanding: تسريع التطوير

🔍 Data Understanding: جمع أمثلة code

🧹 Data Preparation: contextual code retrieval

+ 3 خطوات إضافية

المصادر:

📚 OpenAI Code Examples📚 VS Code Extension API📚 Code Generation Best Practices

GitHub ابدأ التعلم

النماذج اللغوية الضخمة

Prompt Engineering Framework

بناء نظام لإدارة واختبار prompts

متوسط2 أسبوع

المهارات المطلوبة:

Prompt EngineeringTemplate ManagementA/B TestingVersioning

ماذا ستتعلم:

•📊 فهم أهمية Prompt Management
•🔍 استكشاف prompt patterns
•🧹 تنظيم prompt templates
+ 3 أهداف أخرى...

الخطوات العملية (CRISP-DM):

📊 Business Understanding: تحسين نتائج LLMs

🔍 Data Understanding: جمع prompts فعالة

🧹 Data Preparation: categorize و template prompts

+ 3 خطوات إضافية

المصادر:

📚 Prompt Engineering Guide📚 LangChain PromptTemplate📚 Best Practices

GitHub ابدأ التعلم

جاهز لبدء رحلتك؟

اختر مساراً تعليمياً واستكشف المشاريع التفصيلية مع خطوات واضحة وموارد شاملة

استكشف المسارات التعليمية