طارق بن جعبل طعيمان

مهندس ذكاء اصطناعي

0%

معرض المشاريع التفصيلية

أكثر من 40 مشروع عملي

مشاريع تفصيلية احترافية في الذكاء الاصطناعي وفق منهجية CRISP-DM
من المبتدئين إلى المتقدمين

خطوات واضحة
أمثلة GitHub
مسارات تعليمية
عرض 40 من أصل 40 مشروع
تعلم الآلة

نظام توصية المنتجات للتجارة الإلكترونية

بناء نظام توصية ذكي يقترح منتجات مناسبة للمستخدمين بناءً على سلوكهم الشرائي

متوسط2-3 أسابيع

المهارات المطلوبة:

Collaborative FilteringPandasScikit-LearnMatrix FactorizationContent-Based Filtering

ماذا ستتعلم:

  • فهم وتطبيق خوارزميات Collaborative Filtering
  • بناء نظام Content-Based Filtering
  • تطبيق تقنيات Matrix Factorization و SVD
  • + 3 أهداف أخرى...

الخطوات العملية (CRISP-DM):

📊 فهم المشكلة: تحديد أهداف نظام التوصيات - زيادة المبيعات بنسبة 15-20% من خلال توصيات دقيقة. دراسة سلوك المستخدمين الحالي وأنماط الشراء. تحديد KPIs مثل Click-Through Rate و Conversion Rate. تحليل احتياجات العمل من منصات تجارة إلكترونية ناجحة مثل Amazon و Noon.
🔍 فهم البيانات: تحميل dataset تجارة إلكترونية (مثل Amazon Product Reviews أو Retail Transaction Data). استكشاف المتغيرات: User ID, Product ID, Ratings, Categories, Purchase History. تحليل إحصائي شامل: توزيع التقييمات، المنتجات الأكثر شعبية، المستخدمين الأكثر نشاطاً. رسم Heatmaps و Distribution Plots لفهم الأنماط.
🧹 تحضير البيانات: تنظيف البيانات من القيم المفقودة والتقييمات المكررة. معالجة Cold Start Problem للمستخدمين والمنتجات الجديدة. بناء User-Item Interaction Matrix. تقسيم البيانات 80/20 مع الحفاظ على التسلسل الزمني. Feature Engineering: استخراج ميزات مثل متوسط التقييم، عدد المشتريات السابقة.
+ 3 خطوات إضافية

المصادر:

📚 Amazon Product Reviews Dataset📚 Surprise Library Documentation📚 Recommender Systems Handbook📚 Microsoft Recommenders GitHub📚 FastAPI Documentation
تعلم الآلة

كشف الاحتيال في المعاملات المالية

نموذج يكتشف المعاملات الاحتيالية في بيانات البطاقات الائتمانية

متقدم3-4 أسابيع

المهارات المطلوبة:

Imbalanced DataRandom ForestXGBoostFeature Engineering

ماذا ستتعلم:

  • التعامل مع البيانات غير المتوازنة
  • تطبيق SMOTE و Under-sampling
  • استخدام Ensemble Methods
  • + 1 أهداف أخرى...

الخطوات العملية (CRISP-DM):

📊 فهم المشكلة: تحديد تكلفة الاحتيال - تخسر البنوك 28 مليار دولار سنوياً عالمياً. تحليل أنواع الاحتيال: سرقة بطاقات، معاملات مشبوهة، اختراقات. تحديد أهداف النموذج: اكتشاف 95%+ من الاحتيال مع تقليل False Positives لعدم إزعاج العملاء. دراسة التوازن بين الأمان وتجربة المستخدم. فهم العواقب: كل False Negative = خسارة مالية، كل False Positive = عميل غاضب.
🔍 فهم البيانات: تحميل Credit Card Fraud Dataset من Kaggle (284,807 معاملة). استكشاف البيانات: 99.83% طبيعية، 0.17% احتيالية - imbalance شديد! تحليل المتغيرات: V1-V28 (PCA-transformed features)، Amount، Time. دراسة أنماط الاحتيال: متوسط مبلغ المعاملات الاحتيالية أقل من الطبيعية. رسم Time Series للمعاملات عبر اليوم. تحليل توزيع Amount للفئتين.
🧹 تحضير البيانات: معالجة Class Imbalance الشديد (492 fraud من 284,807). تقسيم البيانات قبل أي معالجة لتجنب Data Leakage. تطبيع Amount و Time باستخدام StandardScaler. تجربة استراتيجيات Imbalance: SMOTE (Synthetic Minority Oversampling)، Random Under-sampling، SMOTE + Tomek Links. Feature Engineering: Hour of Day، Amount_per_Hour، Transaction_Frequency. إنشاء Stratified splits للحفاظ على نسبة Fraud في Train/Test.
+ 3 خطوات إضافية

المصادر:

📚 Kaggle Credit Card Fraud Dataset📚 Imbalanced-learn Documentation📚 XGBoost Documentation
تعلم الآلة

التنبؤ بأسعار المنازل (House Price Prediction)

نموذج يتنبأ بأسعار المنازل بناءً على خصائصها - مثالي للمبتدئين

مبتدئ1-2 أسبوع

المهارات المطلوبة:

RegressionFeature EngineeringPandasScikit-Learn

ماذا ستتعلم:

  • فهم Business Understanding في مجال العقارات
  • تطبيق Linear و Polynomial Regression
  • إتقان Feature Engineering والتعامل مع البيانات الحقيقية
  • + 1 أهداف أخرى...

الخطوات العملية (CRISP-DM):

📊 فهم المشكلة: تحديد هدف النموذج - مساعدة وكلاء العقارات والمشترين على تقييم الأسعار بدقة عالية. دراسة العوامل المؤثرة: المساحة، عدد الغرف، الموقع، عمر البناء، المرافق القريبة. تحديد مقياس النجاح: RMSE أقل من 50,000 ريال. فهم احتياجات السوق العقاري المحلي وتوقعات المستخدمين.
🔍 فهم البيانات: تحميل California/Ames Housing Dataset. استكشاف المتغيرات: 79 ميزة تشمل المساحة، الغرف، الحمامات، الموقع، السنة، الحالة. تحليل إحصائي: متوسط السعر، التوزيع، القيم الشاذة. رسم Scatter plots للعلاقة بين السعر والمساحة. تحليل Correlation Matrix لأهم الميزات.
🧹 تحضير البيانات: معالجة القيم المفقودة (47 ميزة بها missing values) - استخدام Mean/Median/Mode حسب نوع البيانات. تحويل المتغيرات الفئوية (Neighborhood, Building Type) إلى Numeric باستخدام One-Hot Encoding. Feature Engineering: إنشاء ميزات جديدة مثل TotalSF (مجموع المساحات)، Age (عمر البناء). إزالة القيم الشاذة باستخدام IQR Method. تطبيع البيانات باستخدام StandardScaler للميزات الرقمية.
+ 3 خطوات إضافية

المصادر:

📚 Kaggle House Prices Dataset📚 Scikit-Learn Regression Guide📚 Feature Engineering Tutorial
تعلم الآلة

تصنيف العملاء (Customer Segmentation)

تجميع العملاء إلى فئات متشابهة لاستهداف تسويقي أفضل

متوسط2-3 أسابيع

المهارات المطلوبة:

ClusteringK-MeansPCAUnsupervised Learning

ماذا ستتعلم:

  • فهم Unsupervised Learning و Clustering
  • تطبيق K-Means, DBSCAN, Hierarchical Clustering
  • استخدام PCA لتقليل الأبعاد
  • + 1 أهداف أخرى...

الخطوات العملية (CRISP-DM):

📊 فهم المشكلة: تحديد أهداف تجزئة العملاء - زيادة ROI للحملات التسويقية بنسبة 30%. فهم القطاعات المتوقعة: VIP Customers, Frequent Buyers, Occasional Shoppers, At-Risk Customers. تحديد استراتيجية مختلفة لكل segment. دراسة حالات ناجحة من شركات التجزئة الكبرى.
🔍 فهم البيانات: تحميل Online Retail/Mall Customers Dataset. استكشاف المتغيرات: Customer ID, Purchase History, Spending Amount, Frequency, Recency, Demographics. تحليل RFM (Recency-Frequency-Monetary). رسم Distribution plots للإنفاق والتردد. تحديد الأنماط الشرائية الموسمية.
🧹 تحضير البيانات: حساب متغيرات RFM لكل عميل. معالجة القيم المفقودة والشاذة. Feature Engineering: Average Order Value, Days Since Last Purchase, Purchase Categories. تطبيق Feature Scaling باستخدام StandardScaler أو MinMaxScaler. إزالة الـ outliers الشديدة التي قد تشوه النتائج.
+ 3 خطوات إضافية

المصادر:

📚 Mall Customer Segmentation Dataset - Kaggle📚 K-Means Clustering Tutorial📚 PCA Explained
تعلم الآلة

كشف البريد المزعج (Spam Detection)

نموذج يميز بين البريد الطبيعي والمزعج باستخدام NLP و ML

مبتدئ1-2 أسبوع

المهارات المطلوبة:

Text ClassificationNLPNaive BayesTF-IDF

ماذا ستتعلم:

  • تطبيق Text Preprocessing (Tokenization, Stopwords)
  • فهم TF-IDF و Bag of Words
  • استخدام Naive Bayes للتصنيف النصي
  • + 1 أهداف أخرى...

الخطوات العملية (CRISP-DM):

📊 فهم المشكلة: تحديد تأثير البريد المزعج - 45% من emails عالمياً spam. تكلفة معالجة spam تصل لمليارات سنوياً. تحديد أهداف النموذج: Precision عالي (تجنب False Positives)، Recall جيد (التقاط أكبر عدد من spam). دراسة خصائص البريد المزعج: الكلمات المشبوهة، الروابط، الأرقام، الـ urgency.
🔍 فهم البيانات: تحميل SMS Spam Collection Dataset (5,574 رسالة). استكشاف التوزيع: 87% ham, 13% spam - بيانات غير متوازنة. تحليل طول الرسائل: spam عادة أطول. استخراج الكلمات الأكثر تكراراً في كل فئة. رسم Word Clouds لـ spam و ham.
🧹 تحضير البيانات: تنظيف النص: إزالة HTML tags، URLs، أرقام الهواتف. تحويل النص إلى lowercase. Tokenization باستخدام NLTK. إزالة Stop Words العربية والإنجليزية. تطبيق Stemming/Lemmatization. تحويل النص إلى vectors باستخدام TF-IDF و Bag of Words. معالجة Class Imbalance باستخدام SMOTE أو Class Weights.
+ 3 خطوات إضافية

المصادر:

📚 SMS Spam Collection Dataset📚 NLTK Documentation📚 Text Classification Guide
تعلم الآلة

نظام التنبؤ بتغيب الموظفين (Employee Attrition)

توقع احتمالية ترك الموظف للشركة باستخدام HR Analytics

متوسط2-3 أسابيع

المهارات المطلوبة:

ClassificationFeature ImportanceXGBoostSHAP

ماذا ستتعلم:

  • التعامل مع بيانات HR Analytics
  • فهم Feature Importance و SHAP Values
  • معالجة Class Imbalance
  • + 1 أهداف أخرى...

الخطوات العملية (CRISP-DM):

📊 فهم المشكلة: تحديد تكلفة استبدال موظف - تصل إلى 150-200% من راتبه السنوي. تحليل معدل التغيب الحالي وتأثيره على الإنتاجية. تحديد أهداف النموذج: التنبؤ المبكر بالموظفين المعرضين للمغادرة. دراسة العوامل المحتملة: الراتب، الرضا الوظيفي، المسافة، ساعات العمل الإضافية، الترقيات.
🔍 فهم البيانات: تحميل IBM HR Analytics Dataset (1,470 موظف، 35 ميزة). استكشاف Attrition Rate: 16.1%. تحليل المتغيرات: Age, Department, JobRole, MonthlyIncome, YearsAtCompany, JobSatisfaction. رسم Distribution plots لكل متغير حسب Attrition. تحليل Correlation: هل الراتب المنخفض يرتبط بالتغيب؟ دراسة التوزيعات الديموغرافية.
🧹 تحضير البيانات: معالجة Class Imbalance (84% stayed vs 16% left). تحويل المتغيرات الفئوية: Department, JobRole, MaritalStatus باستخدام One-Hot Encoding. Feature Engineering: Years Since Last Promotion, Income to Age Ratio, Total Satisfaction Score. تطبيع المتغيرات الرقمية. إنشاء ميزات تفاعلية: OverTime × Distance, JobSatisfaction × YearsAtCompany. تقسيم البيانات 80/20 مع Stratification.
+ 3 خطوات إضافية

المصادر:

📚 IBM HR Analytics Dataset - Kaggle📚 SHAP Documentation📚 XGBoost for HR Analytics
تعلم الآلة

نظام تقييم جودة الهواء والتنبؤ بالتلوث

نموذج ذكي لتصنيف جودة الهواء والتنبؤ بمستويات التلوث بناءً على القياسات البيئية

مبتدئ1-2 أسبوع

المهارات المطلوبة:

Multi-class ClassificationTime SeriesFeature EngineeringScikit-LearnXGBoost

ماذا ستتعلم:

  • فهم وتطبيق Multi-class Classification
  • التعامل مع البيانات البيئية والزمنية
  • تطبيق Feature Selection و Engineering
  • + 3 أهداف أخرى...

الخطوات العملية (CRISP-DM):

📊 فهم المشكلة: تحديد أهمية مراقبة جودة الهواء للصحة العامة - تقليل أمراض الجهاز التنفسي. دراسة معايير منظمة الصحة العالمية لجودة الهواء (PM2.5, PM10, NO2, SO2, CO, O3). تحديد الفئات: جيد، متوسط، غير صحي، خطر. فهم احتياجات البلديات والجهات البيئية.
🔍 فهم البيانات: تحميل Air Quality Dataset من مدن مختلفة. استكشاف المتغيرات: PM2.5, PM10, NO2, SO2, CO, O3, Temperature, Humidity, Wind Speed. تحليل التوزيعات والقيم الشاذة. دراسة الارتباطات بين الملوثات. رسم Time Series للتلوث عبر الزمن والمواسم.
🧹 تحضير البيانات: معالجة القيم المفقودة بطرق ذكية (Interpolation, Forward Fill). تحويل Timestamp إلى ميزات زمنية (Hour, Day, Month, Season). حساب Moving Averages للملوثات. Feature Engineering: نسب الملوثات، التفاعلات بين المتغيرات. تطبيع البيانات باستخدام StandardScaler. معالجة Class Imbalance إذا وجدت.
+ 3 خطوات إضافية

المصادر:

📚 Air Quality Dataset - UCI/Kaggle📚 WHO Air Quality Guidelines📚 Scikit-Learn Multi-class Guide📚 XGBoost Documentation📚 Environmental Data Analysis
تعلم الآلة

نظام توقع الإقراض (Loan Approval Prediction)

نموذج يقرر قبول أو رفض طلب القرض بناءً على معلومات المتقدم

متوسط2-3 أسابيع

المهارات المطلوبة:

ClassificationFeature EngineeringModel InterpretationFairness

ماذا ستتعلم:

  • بناء نموذج تصنيف للقرارات المالية
  • التعامل مع البيانات المالية الحساسة
  • فهم Fairness و Bias في نماذج ML
  • + 1 أهداف أخرى...

الخطوات العملية (CRISP-DM):

📊 فهم المشكلة: دراسة معايير اتخاذ قرار الإقراض - تقليل Default Rate من 8% إلى 3%. تحليل المخاطر المالية وتكلفة القروض الفاشلة. فهم العوامل المؤثرة: الدخل، تاريخ الائتمان، نسبة الدين للدخل، مدة التوظيف. دراسة القوانين والأنظمة المتعلقة بـ Fair Lending و Anti-Discrimination.
🔍 فهم البيانات: تحميل Loan Prediction Dataset (614 طلب قرض، 13 متغير). استكشاف المتغيرات: Gender, Married, Dependents, Education, Self_Employed, ApplicantIncome, LoanAmount, Credit_History. تحليل Approval Rate: 69% approved. دراسة توزيع الدخل والقروض. تحليل تأثير Credit History على القبول. رسم Correlation Matrix للعوامل المالية.
🧹 تحضير البيانات: معالجة 22% قيم مفقودة في متغيرات مختلفة - استخدام Mode للفئوية و Median للرقمية. تحويل المتغيرات الفئوية: Gender, Married, Education بـ Label Encoding. Feature Engineering: Total Income (Applicant + Coapplicant), EMI (قسط شهري متوقع), Loan to Income Ratio. معالجة Outliers في الدخل والقروض. Log Transformation للمتغيرات المائلة. Standardization للمتغيرات الرقمية.
+ 3 خطوات إضافية

المصادر:

📚 Loan Prediction Dataset - Kaggle📚 Fairness in ML - Google📚 Model Interpretability Guide
الرؤية الحاسوبية

نظام كشف العيوب الصناعية بالرؤية الحاسوبية

بناء نظام AI يكتشف العيوب في خطوط الإنتاج باستخدام YOLOv8

متقدم3-4 أسابيع

المهارات المطلوبة:

YOLOv8OpenCVPyTorchImage Processing

ماذا ستتعلم:

  • تطبيق Object Detection في بيئة صناعية حقيقية
  • تجميع وتصنيف بيانات العيوب
  • تدريب YOLO على dataset مخصص
  • + 2 أهداف أخرى...

الخطوات العملية (CRISP-DM):

📊 فهم المشكلة: تحديد أهمية كشف العيوب في خطوط الإنتاج - منع وصول منتجات معيبة للعملاء. تحليل نسبة العيوب الحالية: 2-5%. تحديد أهداف النظام: كشف 95%+ من العيوب، سرعة 50+ FPS. دراسة أنواع العيوب: خدوش، شقوق، لطخات، أخطاء طباعة. فهم بيئة العمل: إضاءة، سرعة الإنتاج، متطلبات الأجهزة.
🔍 فهم البيانات: جمع صور من خط الإنتاج - 500+ صورة لمنتجات سليمة، 300+ لمعيبة. استكشاف أنماط العيوب المختلفة. تحليل شروط التصوير: الإضاءة، الزوايا، الدقة. دراسة توزيع أحجام العيوب. استخدام مجموعات بيانات عامة: MVTec AD Dataset كمرجع.
🧹 تحضير البيانات: استخدام Roboflow لتوسيم العيوب بـ Bounding Boxes. تصنيف العيوب إلى فئات (scratch, crack, stain, print_error). تطبيق Data Augmentation: تدوير، flip، brightness، تغيير السطوع. تقسيم 80/10/10 (train/val/test). تطبيع الصور لحجم موحد 640x640. معالجة Class Imbalance إذا وجدت.
+ 3 خطوات إضافية

المصادر:

📚 Roboflow: https://roboflow.com📚 YOLOv8 Docs: https://docs.ultralytics.com📚 Industrial Defect Dataset
الرؤية الحاسوبية

نظام مراقبة ذكي مع تتبع الأشخاص

بناء نظام يكتشف ويتتبع الأشخاص في الفيديو مع إحصائيات

متوسط2-3 أسابيع

المهارات المطلوبة:

YOLODeepSORTOpenCVTracking

ماذا ستتعلم:

  • فهم Object Tracking Algorithms
  • دمج YOLO مع DeepSORT
  • معالجة فيديوهات في Real-time
  • + 1 أهداف أخرى...

الخطوات العملية (CRISP-DM):

📊 فهم المشكلة: تحديد احتياجات نظام المراقبة - عد الأشخاص، تتبع الحركة، كشف السلوكيات المشبوهة. تحليل تطبيقات النظام: مراكز تجارية، مدارس، مكاتب. تحديد متطلبات الأداء: 25+ FPS، دقة 95%+. فهم التحديات: Occlusion، تغير الإضاءة، ازدحام الناس. دراسة متطلبات الخصوصية.
🔍 فهم البيانات: جمع فيديوهات من زوايا مختلفة. تحليل أنماط الحركة المختلفة. دراسة تروط التصوير: إضاءة، دقة، زاوية. استكشاف تحديات: occlusions, crowded scenes. استخدام MOT Challenge Dataset للتقييم.
🧹 تحضير البيانات: إعداد YOLOv8 للكشف عن الأشخاص (person class). معايرة النموذج للدقة والسرعة. ضبط Confidence Threshold لتقليل False Positives. معالجة الفيديو: تحسين الجودة، تقليل التشويش. تطبيق Background Subtraction لتحسين الكشف.
+ 3 خطوات إضافية

المصادر:

📚 DeepSORT Paper📚 OpenCV Video Processing
الرؤية الحاسوبية

نظام التعرف على الوجوه (Face Recognition System)

بناء نظام يتعرف على الأشخاص من الوجوه باستخدام Deep Learning

متوسط2-3 أسابيع

المهارات المطلوبة:

Face RecognitionFaceNetOpenCVdlib

ماذا ستتعلم:

  • 📊 فهم مشكلة Face Recognition وتطبيقاتها الأمنية
  • 🔍 استكشاف datasets الوجوه المتاحة
  • 🧹 معالجة الصور وتطبيع الوجوه
  • + 3 أهداف أخرى...

الخطوات العملية (CRISP-DM):

📊 Business Understanding: تحديد متطلبات نظام الأمان والدقة المطلوبة
🔍 Data Understanding: جمع صور للأشخاص المستهدفين
🧹 Data Preparation: كشف الوجوه باستخدام MTCNN وتطبيع الصور
+ 3 خطوات إضافية

المصادر:

📚 LFW (Labeled Faces in the Wild) Dataset📚 FaceNet Paper📚 DeepFace Library
الرؤية الحاسوبية

نظام عد المركبات في الشوارع (Vehicle Counter)

كشف وعد المركبات في فيديوهات المرور مع تصنيف الأنواع

متوسط2-3 أسابيع

المهارات المطلوبة:

Object DetectionYOLOv8TrackingOpenCV

ماذا ستتعلم:

  • 📊 فهم تطبيقات المرور الذكي
  • 🔍 تحليل فيديوهات المرور
  • 🧹 معالجة الفيديو وتحسين الجودة
  • + 3 أهداف أخرى...

الخطوات العملية (CRISP-DM):

📊 Business Understanding: احتياجات إدارة المرور للبيانات
🔍 Data Understanding: الحصول على فيديوهات مرور متنوعة
🧹 Data Preparation: تحسين جودة الفيديو ومعالجة الإضاءة
+ 3 خطوات إضافية

المصادر:

📚 UA-DETRAC Dataset📚 YOLOv8 Vehicle Detection📚 OpenCV Vehicle Tracking
الرؤية الحاسوبية

تصنيف الأمراض الجلدية (Skin Disease Classification)

نموذج يشخص الأمراض الجلدية من صور الجلد - تطبيق طبي

متقدم3-4 أسابيع

المهارات المطلوبة:

Medical ImagingCNNTransfer LearningData Augmentation

ماذا ستتعلم:

  • 📊 فهم التحديات الطبية في تشخيص الأمراض
  • 🔍 التعامل مع Medical Datasets
  • 🧹 Data Augmentation للبيانات الطبية
  • + 3 أهداف أخرى...

الخطوات العملية (CRISP-DM):

📊 Business Understanding: أهمية التشخيص المبكر للأمراض الجلدية
🔍 Data Understanding: استكشاف HAM10000 Skin Lesion Dataset
🧹 Data Preparation: معالجة Class Imbalance و Augmentation
+ 3 خطوات إضافية

المصادر:

📚 HAM10000 Dataset - Kaggle📚 Medical Image Classification Guide📚 EfficientNet Paper
الرؤية الحاسوبية

كشف لوحات السيارات (License Plate Detection)

نظام ALPR لكشف وقراءة لوحات السيارات تلقائياً

متقدم3-4 أسابيع

المهارات المطلوبة:

OCRYOLOTesseractImage Processing

ماذا ستتعلم:

  • 📊 فهم أنظمة ALPR وتطبيقاتها
  • 🔍 تحليل تحديات لوحات السيارات
  • 🧹 معالجة الصور وتحسين الوضوح
  • + 3 أهداف أخرى...

الخطوات العملية (CRISP-DM):

📊 Business Understanding: احتياجات الأمن والمواقف
🔍 Data Understanding: جمع صور لوحات متنوعة
🧹 Data Preparation: تصنيف وتحسين جودة الصور
+ 3 خطوات إضافية

المصادر:

📚 OpenALPR📚 Car License Plate Dataset📚 Tesseract OCR
الرؤية الحاسوبية

كشف الحرائق في الوقت الفعلي (Fire Detection)

نظام يكتشف الحرائق والدخان من كاميرات المراقبة

متوسط2-3 أسابيع

المهارات المطلوبة:

Computer VisionReal-time DetectionColor-based DetectionCNN

ماذا ستتعلم:

  • 📊 فهم أهمية الإنذار المبكر للحرائق
  • 🔍 تحليل خصائص النار والدخان البصرية
  • 🧹 تحضير dataset للحرائق
  • + 3 أهداف أخرى...

الخطوات العملية (CRISP-DM):

📊 Business Understanding: تطبيقات السلامة والإنقاذ المبكر
🔍 Data Understanding: جمع صور/فيديوهات للحرائق والدخان
🧹 Data Preparation: Augmentation وتوسيم الحرائق
+ 3 خطوات إضافية

المصادر:

📚 Fire Detection Dataset - Kaggle📚 Real-time Fire Detection Paper📚 YOLOv8 Custom Training
الرؤية الحاسوبية

نظام قياس المسافات الاجتماعية (Social Distance Monitor)

كشف انتهاكات المسافة الاجتماعية في الأماكن العامة

متقدم2-3 أسابيع

المهارات المطلوبة:

YOLODistance CalculationPerspective TransformOpenCV

ماذا ستتعلم:

  • 📊 فهم تطبيقات الصحة العامة
  • 🔍 تحليل المسافات في الفيديو
  • 🧹 معالجة زوايا الكاميرا
  • + 3 أهداف أخرى...

الخطوات العملية (CRISP-DM):

📊 Business Understanding: أهمية المسافة الاجتماعية للوقاية
🔍 Data Understanding: فيديوهات الأماكن المزدحمة
🧹 Data Preparation: تطبيق Perspective Transform
+ 3 خطوات إضافية

المصادر:

📚 Social Distancing Detection GitHub📚 Perspective Transform Tutorial📚 Distance Calculation in CV
التعلم العميق

بناء CNN من الصفر لتصنيف CIFAR-10

بناء شبكة عصبية تلافيفية من الصفر لتصنيف 10 فئات من الصور

متوسط2-3 أسابيع

المهارات المطلوبة:

CNNPyTorchData AugmentationBatch Normalization

ماذا ستتعلم:

  • 📊 فهم معمارية CNNs وكيفية عملها
  • 🔍 استكشاف CIFAR-10 dataset الشهير
  • 🧹 تطبيق Data Augmentation لتحسين التعميم
  • + 3 أهداف أخرى...

الخطوات العملية (CRISP-DM):

📊 Business Understanding: أهمية تصنيف الصور التلقائي
🔍 Data Understanding: تحليل CIFAR-10 (60K صورة، 10 فئات)
🧹 Data Preparation: Data Augmentation (Rotation, Flip, Crop)
+ 3 خطوات إضافية

المصادر:

📚 CIFAR-10 Dataset📚 PyTorch CNN Tutorial📚 Deep Learning Book - Goodfellow
التعلم العميق

Transfer Learning مع ResNet لتصنيف الحيوانات

استخدام نموذج ResNet50 المُدرب مسبقاً لتصنيف صور الحيوانات

متوسط1-2 أسبوع

المهارات المطلوبة:

Transfer LearningResNetFine-tuningPyTorch

ماذا ستتعلم:

  • 📊 فهم Transfer Learning وفوائده
  • 🔍 استخدام نماذج pre-trained
  • 🧹 تجهيز dataset مخصص
  • + 3 أهداف أخرى...

الخطوات العملية (CRISP-DM):

📊 Business Understanding: توفير الوقت باستخدام النماذج المُدربة
🔍 Data Understanding: جمع dataset حيوانات (Cats, Dogs, Birds)
🧹 Data Preparation: تغيير حجم الصور للمتطلبات المطلوبة
+ 3 خطوات إضافية

المصادر:

📚 Animals-10 Dataset - Kaggle📚 Transfer Learning Guide - PyTorch📚 ResNet Paper
التعلم العميق

LSTM للتنبؤ بالسلاسل الزمنية (Time Series)

بناء LSTM للتنبؤ بأسعار الأسهم أو استهلاك الطاقة

متقدم2-3 أسابيع

المهارات المطلوبة:

LSTMRNNTime SeriesSequence Modeling

ماذا ستتعلم:

  • 📊 فهم السلاسل الزمنية وتحدياتها
  • 🔍 تحليل أنماط البيانات التسلسلية
  • 🧹 تحضير البيانات بطريقة sliding window
  • + 3 أهداف أخرى...

الخطوات العملية (CRISP-DM):

📊 Business Understanding: أهمية التنبؤ للتخطيط
🔍 Data Understanding: استكشاف بيانات الأسهم التاريخية
🧹 Data Preparation: تطبيع وتحويل لـ sequences
+ 3 خطوات إضافية

المصادر:

📚 Yahoo Finance Data📚 LSTM for Time Series - Tutorial📚 Understanding LSTM Networks
التعلم العميق

Autoencoder لضغط وإعادة بناء الصور

بناء Autoencoder لضغط الصور وإزالة التشويش منها

متوسط2 أسبوع

المهارات المطلوبة:

AutoencoderDimensionality ReductionDenoisingLatent Space

ماذا ستتعلم:

  • 📊 فهم Autoencoders وتطبيقاتها
  • 🔍 استكشاف Encoder-Decoder Architecture
  • 🧹 إضافة تشويش للبيانات
  • + 3 أهداف أخرى...

الخطوات العملية (CRISP-DM):

📊 Business Understanding: ضغط البيانات وإزالة التشويش
🔍 Data Understanding: استخدام MNIST أو Fashion-MNIST
🧹 Data Preparation: إضافة Gaussian Noise للصور
+ 3 خطوات إضافية

المصادر:

📚 Autoencoder Tutorial - Keras📚 Denoising Autoencoder Paper📚 Variational Autoencoder Explained
التعلم العميق

GAN لتوليد صور وجوه واقعية

بناء Generative Adversarial Network لتوليد وجوه بشرية

متقدم3-4 أسابيع

المهارات المطلوبة:

GANGeneratorDiscriminatorAdversarial Training

ماذا ستتعلم:

  • 📊 فهم آلية عمل GANs
  • 🔍 تحليل معمارية Generator و Discriminator
  • 🧹 تحضير dataset وجوه
  • + 3 أهداف أخرى...

الخطوات العملية (CRISP-DM):

📊 Business Understanding: تطبيقات توليد المحتوى
🔍 Data Understanding: استخدام CelebA أو FFHQ dataset
🧹 Data Preparation: تغيير الحجم وتطبيع [-1, 1]
+ 3 خطوات إضافية

المصادر:

📚 CelebA Dataset📚 DCGAN Paper📚 GAN Training Tips
التعلم العميق

تصنيف النصوص باستخدام RNN

بناء RNN لتصنيف تعليقات IMDb (إيجابية/سلبية)

متوسط2 أسبوع

المهارات المطلوبة:

RNNLSTMText ClassificationEmbedding

ماذا ستتعلم:

  • 📊 فهم معالجة النصوص بـ RNN
  • 🔍 استكشاف datasets النصية
  • 🧹 تحويل النص لـ sequences
  • + 3 أهداف أخرى...

الخطوات العملية (CRISP-DM):

📊 Business Understanding: تحليل آراء العملاء
🔍 Data Understanding: استكشاف IMDb Reviews Dataset
🧹 Data Preparation: Tokenization + Padding + Embedding
+ 3 خطوات إضافية

المصادر:

📚 IMDB Reviews Dataset📚 Text Classification with RNN📚 Word Embeddings Guide
التعلم العميق

تصنيف صور الأشعة السينية لـ COVID-19

نموذج DL لتشخيص COVID-19 من صور الرئة

متقدم3 أسبوع

المهارات المطلوبة:

Medical ImagingTransfer LearningClass ImbalanceGrad-CAM

ماذا ستتعلم:

  • 📊 فهم التطبيقات الطبية للـ DL
  • 🔍 التعامل مع البيانات الطبية الحساسة
  • 🧹 معالجة Class Imbalance
  • + 3 أهداف أخرى...

الخطوات العملية (CRISP-DM):

📊 Business Understanding: أهمية التشخيص المبكر
🔍 Data Understanding: COVID-19 X-Ray Dataset
🧹 Data Preparation: Augmentation + Class Weighting
+ 3 خطوات إضافية

المصادر:

📚 COVID-19 Radiography Database📚 Grad-CAM for Interpretability📚 Medical AI Best Practices
التعلم العميق

نموذج Seq2Seq للترجمة الآلية

بناء نموذج Encoder-Decoder مع Attention للترجمة

متقدم3-4 أسابيع

المهارات المطلوبة:

Seq2SeqAttention MechanismLSTMMachine Translation

ماذا ستتعلم:

  • 📊 فهم Sequence-to-Sequence Models
  • 🔍 استكشاف الترجمة الآلية
  • 🧹 تحضير parallel corpus
  • + 3 أهداف أخرى...

الخطوات العملية (CRISP-DM):

📊 Business Understanding: الحاجة للترجمة الفورية
🔍 Data Understanding: Multi30k (إنجليزي-ألماني)
🧹 Data Preparation: Tokenization + Vocabulary Building
+ 3 خطوات إضافية

المصادر:

📚 Multi30k Dataset📚 Seq2Seq with Attention Paper📚 Neural Machine Translation Tutorial
معالجة اللغة الطبيعية

نظام تحليل المشاعر متعدد اللغات

بناء نموذج يحلل المشاعر (إيجابي/سلبي/محايد) بالعربية والإنجليزية

متوسط2-3 أسابيع

المهارات المطلوبة:

BERTTransformersMultilingual NLPHugging Face

ماذا ستتعلم:

  • 📊 فهم Sentiment Analysis وأهميته التجارية
  • 🔍 استكشاف multilingual models
  • 🧹 معالجة النصوص العربية والإنجليزية
  • + 3 أهداف أخرى...

الخطوات العملية (CRISP-DM):

📊 Business Understanding: تحليل آراء العملاء لتحسين المنتجات
🔍 Data Understanding: استخدام Arabic Sentiment Dataset + IMDB
🧹 Data Preparation: تنظيف النصوص والتوحيد
+ 3 خطوات إضافية

المصادر:

📚 ArSentD-LEV Arabic Sentiment Dataset📚 Hugging Face Transformers📚 mBERT Documentation
معالجة اللغة الطبيعية

نظام استخلاص الكيانات المسماة (NER)

بناء نموذج لاستخلاص الأسماء، الأماكن، المنظمات من النصوص

متقدم3 أسابيع

المهارات المطلوبة:

NERSpaCyBERTToken Classification

ماذا ستتعلم:

  • 📊 فهم Named Entity Recognition وتطبيقاته
  • 🔍 استكشاف NER datasets
  • 🧹 تحضير البيانات لـ Token Classification
  • + 3 أهداف أخرى...

الخطوات العملية (CRISP-DM):

📊 Business Understanding: استخراج معلومات من المستندات
🔍 Data Understanding: CoNLL-2003 أو ANERcorp (عربي)
🧹 Data Preparation: تحويل لـ BIO tagging format
+ 3 خطوات إضافية

المصادر:

📚 CoNLL-2003 Dataset📚 SpaCy NER Tutorial📚 BERT for Token Classification
معالجة اللغة الطبيعية

نظام تلخيص النصوص التلقائي

بناء نموذج يلخص مقالات طويلة إلى نقاط رئيسية

متقدم3-4 أسابيع

المهارات المطلوبة:

Text SummarizationT5BARTSeq2Seq

ماذا ستتعلم:

  • 📊 فهم Extractive vs Abstractive Summarization
  • 🔍 تحليل datasets التلخيص
  • 🧹 تحضير مقالات طويلة
  • + 3 أهداف أخرى...

الخطوات العملية (CRISP-DM):

📊 Business Understanding: توفير وقت القراءة للمستخدمين
🔍 Data Understanding: CNN/DailyMail Dataset أو XL-Sum (عربي)
🧹 Data Preparation: تقسيم لـ article-summary pairs
+ 3 خطوات إضافية

المصادر:

📚 XL-Sum Dataset (Multilingual)📚 Hugging Face Summarization📚 ROUGE Score Explained
معالجة اللغة الطبيعية

نظام الأسئلة والأجوبة (Question Answering)

بناء نموذج يجيب على أسئلة من سياق معطى

متقدم2-3 أسابيع

المهارات المطلوبة:

Question AnsweringBERTSQuADContext Understanding

ماذا ستتعلم:

  • 📊 فهم Reading Comprehension
  • 🔍 استكشاف QA datasets
  • 🧹 تحضير context-question-answer triplets
  • + 3 أهداف أخرى...

الخطوات العملية (CRISP-DM):

📊 Business Understanding: تحسين محركات البحث والمساعدات
🔍 Data Understanding: SQuAD 2.0 أو ARCD (عربي)
🧹 Data Preparation: تحديد start و end positions
+ 3 خطوات إضافية

المصادر:

📚 SQuAD Dataset📚 ARCD Arabic QA Dataset📚 Hugging Face QA Pipeline
معالجة اللغة الطبيعية

نظام الترجمة الآلية العصبية

بناء نموذج ترجمة عربي-إنجليزي باستخدام Transformers

متقدم3-4 أسابيع

المهارات المطلوبة:

Machine TranslationMarianMTSeq2SeqBLEU Score

ماذا ستتعلم:

  • 📊 فهم Neural Machine Translation
  • 🔍 استكشاف parallel corpora
  • 🧹 معالجة أزواج الترجمة
  • + 3 أهداف أخرى...

الخطوات العملية (CRISP-DM):

📊 Business Understanding: الحاجة للترجمة في التواصل العالمي
🔍 Data Understanding: OPUS Arabic-English Corpus
🧹 Data Preparation: تنظيف وموازنة أزواج الجمل
+ 3 خطوات إضافية

المصادر:

📚 OPUS Parallel Corpus📚 MarianNMT📚 sacrebleu for Evaluation
معالجة اللغة الطبيعية

كشف الأخبار المزيفة (Fake News Detection)

نموذج يحدد مصداقية الأخبار باستخدام NLP

متوسط2-3 أسابيع

المهارات المطلوبة:

Text ClassificationBERTMisinformation DetectionFeature Engineering

ماذا ستتعلم:

  • 📊 فهم مشكلة Misinformation
  • 🔍 تحليل patterns الأخبار المزيفة
  • 🧹 Feature Engineering للنصوص الإخبارية
  • + 3 أهداف أخرى...

الخطوات العملية (CRISP-DM):

📊 Business Understanding: مكافحة المعلومات المضللة
🔍 Data Understanding: LIAR Dataset أو FakeNewsNet
🧹 Data Preparation: استخلاص features (source, headline, body)
+ 3 خطوات إضافية

المصادر:

📚 LIAR Dataset📚 FakeNewsNet📚 Misinformation Detection Papers
معالجة اللغة الطبيعية

تصحيح الأخطاء الإملائية والنحوية

نموذج يصحح الأخطاء في النصوص تلقائياً

متوسط2 أسبوع

المهارات المطلوبة:

Grammar CorrectionT5Error DetectionSeq2Seq

ماذا ستتعلم:

  • 📊 فهم Grammar Correction كمهمة Seq2Seq
  • 🔍 تحليل أنواع الأخطاء الشائعة
  • 🧹 إنشاء synthetic errors
  • + 3 أهداف أخرى...

الخطوات العملية (CRISP-DM):

📊 Business Understanding: تحسين جودة الكتابة
🔍 Data Understanding: C4_200M Dataset أو QALB (عربي)
🧹 Data Preparation: إضافة أخطاء صناعية للنصوص الصحيحة
+ 3 خطوات إضافية

المصادر:

📚 QALB Arabic Grammar Dataset📚 Grammarly Research📚 T5 for Grammar Correction
معالجة اللغة الطبيعية

نظام توليد النصوص الإبداعية

نموذج يولد قصص أو شعر بناءً على بداية معطاة

متقدم3 أسابيع

المهارات المطلوبة:

Text GenerationGPT-2Creative WritingFine-tuning

ماذا ستتعلم:

  • 📊 فهم Language Modeling للتوليد
  • 🔍 جمع نصوص إبداعية
  • 🧹 تحضير corpus للتدريب
  • + 3 أهداف أخرى...

الخطوات العملية (CRISP-DM):

📊 Business Understanding: توليد محتوى إبداعي
🔍 Data Understanding: جمع قصص/شعر عربي أو إنجليزي
🧹 Data Preparation: تنسيق النصوص للتدريب
+ 3 خطوات إضافية

المصادر:

📚 WritingPrompts Dataset📚 GPT-2 Fine-tuning Guide📚 AraBERT-GPT للعربية
النماذج اللغوية الضخمة

بناء Chatbot ذكي مع RAG

مساعد ذكي يجيب من مستنداتك الخاصة باستخدام Retrieval Augmented Generation

متوسط2-3 أسابيع

المهارات المطلوبة:

RAGLangChainVector DBOpenAI APIEmbeddings

ماذا ستتعلم:

  • 📊 فهم RAG وأهميته في LLMs
  • 🔍 استكشاف Vector Databases
  • 🧹 تحضير المستندات للتضمين
  • + 3 أهداف أخرى...

الخطوات العملية (CRISP-DM):

📊 Business Understanding: الحاجة لـ chatbot يعرف معلومات خاصة
🔍 Data Understanding: جمع مستندات الشركة/المجال
🧹 Data Preparation: تقسيم لـ chunks + إنشاء embeddings
+ 3 خطوات إضافية

المصادر:

📚 LangChain Documentation📚 Pinecone/ChromaDB📚 OpenAI Embeddings Guide
النماذج اللغوية الضخمة

Fine-tuning GPT على نمط كتابة معين

تخصيص GPT ليكتب بأسلوب معين (رسمي، تقني، إبداعي)

متوسط2 أسبوع

المهارات المطلوبة:

Fine-tuningGPT-3.5OpenAI APIPrompt Engineering

ماذا ستتعلم:

  • 📊 فهم Fine-tuning للـ LLMs
  • 🔍 جمع بيانات التدريب
  • 🧹 تنسيق البيانات لـ OpenAI
  • + 3 أهداف أخرى...

الخطوات العملية (CRISP-DM):

📊 Business Understanding: الحاجة لأسلوب كتابة موحد
🔍 Data Understanding: جمع 100+ مثال للأسلوب المطلوب
🧹 Data Preparation: تحويل لـ JSONL format
+ 3 خطوات إضافية

المصادر:

📚 OpenAI Fine-tuning Guide📚 Best Practices for Fine-tuning📚 Example Datasets
النماذج اللغوية الضخمة

LLM Agent مع Tools

بناء Agent يستخدم أدوات خارجية (بحث، حسابات، API)

متقدم3-4 أسابيع

المهارات المطلوبة:

LangChain AgentsFunction CallingTool IntegrationReAct Pattern

ماذا ستتعلم:

  • 📊 فهم LLM Agents
  • 🔍 استكشاف Function Calling
  • 🧹 تصميم Tools مفيدة
  • + 3 أهداف أخرى...

الخطوات العملية (CRISP-DM):

📊 Business Understanding: Agent يؤدي مهام معقدة
🔍 Data Understanding: تحديد الأدوات المطلوبة
🧹 Data Preparation: إنشاء tool descriptions واضحة
+ 3 خطوات إضافية

المصادر:

📚 LangChain Agents Documentation📚 OpenAI Function Calling📚 ReAct Paper
النماذج اللغوية الضخمة

نظام تلخيص المستندات الطويلة

تلخيص PDFs ومستندات طويلة باستخدام LLMs

متوسط2 أسبوع

المهارات المطلوبة:

Document ProcessingMap-ReduceLangChainPDF Parsing

ماذا ستتعلم:

  • 📊 فهم Document Summarization
  • 🔍 معالجة PDFs والمستندات
  • 🧹 تقسيم المستندات الطويلة
  • + 3 أهداف أخرى...

الخطوات العملية (CRISP-DM):

📊 Business Understanding: توفير الوقت في قراءة التقارير
🔍 Data Understanding: جمع PDFs متنوعة
🧹 Data Preparation: استخراج النص وتقسيمه
+ 3 خطوات إضافية

المصادر:

📚 PyPDF2/LangChain📚 Map-Reduce Pattern📚 Document Summarization Techniques
النماذج اللغوية الضخمة

بناء LLM Evaluator

نظام لتقييم جودة إجابات LLMs تلقائياً

متقدم2-3 أسابيع

المهارات المطلوبة:

LLM EvaluationPrompt EngineeringMetricsTesting

ماذا ستتعلم:

  • 📊 فهم تحديات تقييم LLMs
  • 🔍 استكشاف evaluation metrics
  • 🧹 إنشاء test sets
  • + 3 أهداف أخرى...

الخطوات العملية (CRISP-DM):

📊 Business Understanding: ضمان جودة LLM outputs
🔍 Data Understanding: إنشاء golden dataset
🧹 Data Preparation: تحديد معايير الجودة
+ 3 خطوات إضافية

المصادر:

📚 LangSmith📚 RAGAS Framework📚 LLM Evaluation Best Practices
النماذج اللغوية الضخمة

Multi-modal LLM Application

تطبيق يعالج النصوص والصور معاً (GPT-4 Vision)

متقدم3 أسابيع

المهارات المطلوبة:

Multi-modal AIGPT-4 VisionImage UnderstandingLangChain

ماذا ستتعلم:

  • 📊 فهم Multi-modal LLMs
  • 🔍 استكشاف GPT-4 Vision capabilities
  • 🧹 تحضير بيانات متعددة الوسائط
  • + 3 أهداف أخرى...

الخطوات العملية (CRISP-DM):

📊 Business Understanding: تطبيقات تفهم الصور والنصوص
🔍 Data Understanding: جمع صور مع أوصاف
🧹 Data Preparation: ترميز الصور لـ base64
+ 3 خطوات إضافية

المصادر:

📚 GPT-4 Vision Documentation📚 LangChain Multi-modal📚 Vision Use Cases
النماذج اللغوية الضخمة

نظام Code Assistant مع LLMs

مساعد برمجة يساعد في كتابة وشرح الكود

متقدم3-4 أسابيع

المهارات المطلوبة:

Code GenerationGPT-4Code UnderstandingGitHub Copilot Patterns

ماذا ستتعلم:

  • 📊 فهم Code LLMs
  • 🔍 استكشاف code generation patterns
  • 🧹 معالجة code context
  • + 3 أهداف أخرى...

الخطوات العملية (CRISP-DM):

📊 Business Understanding: تسريع التطوير
🔍 Data Understanding: جمع أمثلة code
🧹 Data Preparation: contextual code retrieval
+ 3 خطوات إضافية

المصادر:

📚 OpenAI Code Examples📚 VS Code Extension API📚 Code Generation Best Practices
النماذج اللغوية الضخمة

Prompt Engineering Framework

بناء نظام لإدارة واختبار prompts

متوسط2 أسبوع

المهارات المطلوبة:

Prompt EngineeringTemplate ManagementA/B TestingVersioning

ماذا ستتعلم:

  • 📊 فهم أهمية Prompt Management
  • 🔍 استكشاف prompt patterns
  • 🧹 تنظيم prompt templates
  • + 3 أهداف أخرى...

الخطوات العملية (CRISP-DM):

📊 Business Understanding: تحسين نتائج LLMs
🔍 Data Understanding: جمع prompts فعالة
🧹 Data Preparation: categorize و template prompts
+ 3 خطوات إضافية

المصادر:

📚 Prompt Engineering Guide📚 LangChain PromptTemplate📚 Best Practices

جاهز لبدء رحلتك؟

اختر مساراً تعليمياً واستكشف المشاريع التفصيلية مع خطوات واضحة وموارد شاملة

استكشف المسارات التعليمية