تفاصيل الوثيقة

نوع الوثيقة : رسالة جامعية 
عنوان الوثيقة :
تحليل هيكل المستندات العربية باستخدام التعلم العميق
LAYOUT ANALYSIS FOR ARABIC DOCUMENTS USING DEEP LEARNING
 
الموضوع : كلية الحاسبات وتقنية المعلومات 
لغة الوثيقة : العربية 
المستخلص : في الآونة الأخيرة اهتم الباحثون بمجال تحليل المستندات والتعرف الضوئي على الأحرف (OCR) ، حيث يمكننا أن نرى تحسنًا كبيرًا للغاية في أنواع مختلفة من محركات التعرف الضوئي على الحروف للغات مختلفة ، سواء بالنسبة للمستندات المطبوعة أو المستندات المكتوبة بخط اليد . كما نرى هناك اهتمام أقل بمعالجة المستندات باللغة العربية مقارنة باللغات الأخرى مثل اللغة الإنجليزية، ويمكن أن يكون ذلك لأسباب عديدة مثل صعوبة تحليل اللغة العربية ومحدودية قاعدات البيانات للمستندات العربية الموجودة. لتنفيذ أي محرك OCR، فإن الخطوة الأولى التي نحتاج إلى القيام بها هي تحليل تخطيط الصور المحددة قبل إرسال الصورة إلى OCR. تهتم دراسة الأطروحة هذه بتحليل تخطيط المستندات العربية باستخدام نهج التعلم العميق. نحن نستخدم في هذه الاطروحة نموذجين مختلفين للتعلم العميق، وهما الشبكة العصبية RCNN Faster وMask RCNN، حيث يتم تحديد استخدام كل نموذج لنوع مختلف من المستندات العربية. نحن نقوم بتجميع ثلاثة أنواع مختلفة من قاعدات البيانات للمستندات العربية وهم، المستندات المطبوعة قديما المسندات المطبوعة حديثا، والمستندات التاريخية، حيث إن لكل نوع من المستندات حجمها الخاص وهيكلها ومتطلبات خاصة لمعالجتها. نحن نقوم باستخدام RCNN Faster للمستندات العربية المطبوعة قديما والمطبوعة حديثا، وMask RCNN للمستندات التاريخية. معالجة المستندات العربية أصعب من معالجة المستندات الآخرى، وذلك بسبب الهيكل التخطيطي وصفات المستندات التاريخية مثل، نمط خط الكاتب عمر الورق المستخدم، الفترة الزمنية التي جاء منها المستند، الحبر المستخدم، وغيرها الكثير. نتائج هذه الأطروحة هي كالتالي، ٩٩.٥٩٪ للمستندات المطبوعة قديما، و٩٩.٥٦٪ للمستندات المطبوعة حديثا، وبالنسبة للوثائق التاريخية ٥١.١٤٪. مقارنة نتائجنا بنتائج النماذج الأخرى الموجودة، يمكننا القول إن عملنا يمكنه التغلب على الكثير من النماذج الموجودة في هذا المجال بنتائج رائعة. الكلمات المفتاحية: تحليل المستندات ، اللغة العربية ، منطقة الاهتمام ، Faster RCNN ، Mask RCNN 
المشرف : د. الحسنين البرهمتوشي 
نوع الرسالة : رسالة ماجستير 
سنة النشر : 1445 هـ
2023 م
 
تاريخ الاضافة على الموقع : Monday, November 13, 2023 

الباحثون

اسم الباحث (عربي)اسم الباحث (انجليزي)نوع الباحثالمرتبة العلميةالبريد الالكتروني
لطيفه جلال الجفريAl Jafri, Latifa Jalalباحثماجستير 

الملفات

اسم الملفالنوعالوصف
 49546.pdf pdf 

الرجوع إلى صفحة الأبحاث