طارق بن جعبل طعيمان

مهندس ذكاء اصطناعي

0%

الرئيسيةالمشاريعالنماذج اللغوية الضخمةنظام تلخيص المستندات الطويلة
النماذج اللغوية الضخمة
مشروع عملي احترافي

نظام تلخيص المستندات الطويلة

تلخيص PDFs ومستندات طويلة باستخدام LLMs

متوسط
2 أسبوع
4 مهارات

مقدمة المشروع

في هذا المشروع العملي، ستتعلم كيفية تلخيص pdfs ومستندات طويلة باستخدام llms. هذا المشروع مصمم خصيصاً لمستوى متوسطويستغرق تقريباً 2 أسبوع لإكماله بشكل كامل.

سنتبع منهجية CRISP-DM (Cross-Industry Standard Process for Data Mining) المعترف بها عالمياً، والتي تضمن بناء مشروع احترافي قابل للتطبيق في بيئة الإنتاج.

ماذا ستتعلم؟

📊 فهم Document Summarization
🔍 معالجة PDFs والمستندات
🧹 تقسيم المستندات الطويلة
⚙️ تطبيق Map-Reduce Pattern
✅ تقييم جودة التلخيص
🚀 نشر خدمة تلخيص
منهجية CRISP-DM

خطوات العمل التفصيلية

اتبع هذه الخطوات الست لبناء مشروع احترافي

1
📊

Business Understanding

فهم المشكلة

تحديد الأهداف والمتطلبات من منظور الأعمال

الخطوات العملية:

توفير الوقت في قراءة التقارير

2
🔍

Data Understanding

فهم البيانات

جمع البيانات الأولية والتعرف عليها وتحديد جودتها

الخطوات العملية:

جمع PDFs متنوعة

3
🧹

Data Preparation

تحضير البيانات

تنظيف وتحويل البيانات لتكون جاهزة للنمذجة

الخطوات العملية:

استخراج النص وتقسيمه

4
⚙️

Modeling

بناء النموذج

اختيار وتطبيق تقنيات النمذجة المناسبة

الخطوات العملية:

Map-Reduce Summarization Chain

5

Evaluation

التقييم

تقييم النموذج والتأكد من تحقيق الأهداف

الخطوات العملية:

مراجعة الملخصات

6
🚀

Deployment

النشر

نشر النموذج في بيئة الإنتاج

الخطوات العملية:

واجهة لرفع وتلخيص PDFs

المصادر والأدوات

PyPDF2/LangChain
Map-Reduce Pattern
Document Summarization Techniques

المهارات المطلوبة

Document ProcessingMap-ReduceLangChainPDF Parsing

إحصائيات سريعة

المستوىمتوسط
المدة2 أسبوع
المهارات4
الخطوات6
العودة للمشاريع