طارق بن جعبل طعيمان

مهندس ذكاء اصطناعي

0%

الرئيسيةالمشاريعمعالجة اللغة الطبيعيةنظام تلخيص النصوص التلقائي
معالجة اللغة الطبيعية
مشروع عملي احترافي

نظام تلخيص النصوص التلقائي

بناء نموذج يلخص مقالات طويلة إلى نقاط رئيسية

متقدم
3-4 أسابيع
4 مهارات

مقدمة المشروع

في هذا المشروع العملي، ستتعلم كيفية بناء نموذج يلخص مقالات طويلة إلى نقاط رئيسية. هذا المشروع مصمم خصيصاً لمستوى متقدمويستغرق تقريباً 3-4 أسابيع لإكماله بشكل كامل.

سنتبع منهجية CRISP-DM (Cross-Industry Standard Process for Data Mining) المعترف بها عالمياً، والتي تضمن بناء مشروع احترافي قابل للتطبيق في بيئة الإنتاج.

ماذا ستتعلم؟

📊 فهم Extractive vs Abstractive Summarization
🔍 تحليل datasets التلخيص
🧹 تحضير مقالات طويلة
⚙️ استخدام T5/BART للتلخيص
✅ تقييم بـ ROUGE Score
🚀 نشر نظام تلخيص أخبار
منهجية CRISP-DM

خطوات العمل التفصيلية

اتبع هذه الخطوات الست لبناء مشروع احترافي

1
📊

Business Understanding

فهم المشكلة

تحديد الأهداف والمتطلبات من منظور الأعمال

الخطوات العملية:

توفير وقت القراءة للمستخدمين

2
🔍

Data Understanding

فهم البيانات

جمع البيانات الأولية والتعرف عليها وتحديد جودتها

الخطوات العملية:

CNN/DailyMail Dataset أو XL-Sum (عربي)

3
🧹

Data Preparation

تحضير البيانات

تنظيف وتحويل البيانات لتكون جاهزة للنمذجة

الخطوات العملية:

تقسيم لـ article-summary pairs

4
⚙️

Modeling

بناء النموذج

اختيار وتطبيق تقنيات النمذجة المناسبة

الخطوات العملية:

Fine-tune T5 أو mT5 للتلخيص

5

Evaluation

التقييم

تقييم النموذج والتأكد من تحقيق الأهداف

الخطوات العملية:

حساب ROUGE-1, ROUGE-2, ROUGE-L

6
🚀

Deployment

النشر

نشر النموذج في بيئة الإنتاج

الخطوات العملية:

تطبيق ويب للتلخيص الفوري

المصادر والأدوات

XL-Sum Dataset (Multilingual)
Hugging Face Summarization
ROUGE Score Explained

المهارات المطلوبة

Text SummarizationT5BARTSeq2Seq

إحصائيات سريعة

المستوىمتقدم
المدة3-4 أسابيع
المهارات4
الخطوات6
العودة للمشاريع