التَّشابُهُ الدِّلاليُّ بَيْنَ الجملِ العربيَّةِ من خلالِ تِقْنِيةِ (BERT بيرت) الإلكترونيَّة: دراسة تقييميَّة حاسوبيَّة | ||||
مجلة جامعة مصر للدراسات الإنسانية | ||||
Volume 4, Issue 1, January 2024, Page 155-194 PDF (1.01 MB) | ||||
Document Type: البحوث والدِّراسات. | ||||
DOI: 10.21608/mjoms.2023.250586.1134 | ||||
![]() | ||||
Author | ||||
مُحَمَّد مَجدي لَبيب حامِد ![]() | ||||
المتطلبات الجامعية – جامعة مصر للعلوم والتکنولوجيا. | ||||
Abstract | ||||
يهدف البحث إلى تقييم وتقويم أداة قياس تشابه الجمل (Sentence similarity) الملحقة بـ(BERT) المعدة من (Google)، التي يعتمد عليها بشكل كبير في البحوث المهتمة بمعالجة اللُّغات الطَّبيعيَّة، خاصة في تحسين مخرجات التَّرجمة الآليَّة[ ]، وذلك من خلال تتبع دقة مخرجاتها ودراسة تلك المخرجات، ثم ترجمة النتائج إلى إحصاءات توضح مدى دقة تعامل هذه الأداة المهمة مع اللُّغة. وللوصول للهدف المنشود من البحث، تم الاعتماد على مدونة متوازية بين اللغة العربية واللغة الإنجليزية، ثم ترجمة عينة عشوائية من المدونة باللغة الإنجليزية على (Google Translate)[ ]، ثم محاذاة نتائج الترجمة مع المدونة باللغة العربية، ثم إدخال أزواج الجمل المتحاذية (Patterns) باللغة العربية إلى (BERT)؛ لقياس مدى التشابه الدلالي بينها من خلال الأداة (Sentence similarity). وأمكن البحثُ من خلال التطبيق العملي وتحليل مخرجات (BERT)، التوصل إلى مواضع الخلل التي تعيق عمل الأداة مع اللغة العربية، مقارنًا تلك النتائج بتعامل الأداة نفسها مع اللغة الإنجليزية، وكانت النتيجة في صالح اللغة الإنجليزية؛ حيث بلغت نسبة كفاءة الأداة معها حوالي (65%)، في مقابل (40%) مع اللُّغة العربيَّة. وقد وضع البحث مقترحًا يسهم إلى تحسين مخرجات تعامل (BERT) مع اللغة العربية، مستندًا في ذلك على نتائج تحليل عينة الدراسة، والوقوف على أبرز الأخطاء التي لم تستطع الأداة تخطيها، مما قلل من كفاءتها. | ||||
Keywords | ||||
BERT; التَّشابه الدِّلاليِّ بين النُّصوص; معالجة اللُّغات الطَّبيعيَّة; المدونات اللغوية; التَّرجمة الآليَّة | ||||
References | ||||
| ||||
Statistics Article View: 148 PDF Download: 136 |
||||