/

يونيو 22, 2026

ArabicNLP 2026 يوسّع خريطة المنافسة البحثية في معالجة اللغة العربية بمهام مشتركة تمتد من كشف الهلوسة إلى شبكات المعرفة

تشهد الدورة الرابعة من مؤتمر معالجة اللغة العربية الطبيعية ArabicNLP 2026، المنعقدة بالتزامن مع مؤتمر EMNLP 2026 في بودابست خلال أكتوبر المقبل، زخمًا لافتًا في مسار المهام المشتركة، بعد توالي دعوات المشاركة في عدد من المسابقات البحثية المتخصصة التي تستهدف قضايا محورية في الذكاء الاصطناعي العربي، من سلامة المحتوى وكشف الهلوسة إلى المقروئية العربية، وشبكات المعرفة، واللهجات، والتقييم الثقافي للأنظمة متعددة الوسائط.

وتكشف الدعوات المتتابعة المنشورة عبر مجموعة SIGARAB عن اتساع واضح في أولويات مجتمع معالجة اللغة العربية آليًا؛ إذ لم تعد المهام المشتركة مقتصرة على مسائل التصنيف أو التحليل اللغوي التقليدية، بل امتدت إلى اختبار موثوقية النماذج اللغوية الكبيرة، وقدرتها على التعامل مع المعرفة الحساسة، وفهم السياق الثقافي، ومعالجة الخطاب العربي المكتوب والمنطوق والبصري.

وتُعد المهام المشتركة في مؤتمرات معالجة اللغة الطبيعية آلية بحثية مهمة لتوحيد معايير التقييم، وإتاحة مجموعات بيانات مرجعية، ومقارنة النظم المختلفة ضمن شروط واحدة. وفي هذا السياق، نظمت فرق عربية ودولية جلسة تعريفية قصيرة في 11 يونيو 2026 لمساعدة المشاركين، ولا سيما الجدد منهم، على فهم طبيعة هذه المهام، وآلية المشاركة، وكتابة أوراق وصف الأنظمة، وتجنب الأخطاء الشائعة في هذا النوع من المنافسات العلمية.

في مجال موثوقية النماذج اللغوية الكبيرة، برزت مهمتان لافتتان. الأولى هي HalluScoring 2026، التي تركز على كشف الهلوسة في إجابات النماذج اللغوية العربية، والتمييز بين الإجابات الصحيحة والمضللة في أسئلة المعرفة العامة والثقافية والإسلامية. وتتضمن المهمة مسارات لاختبار قدرة الأنظمة على التعميم عبر أسئلة جديدة أو نماذج لغوية غير مرئية في بيانات التدريب، بما يجعلها اختبارًا مباشرًا لقوة النماذج في التحقق من الحقائق لا في إنتاج نص عربي فصيح فحسب.

أما المهمة الثانية فهي IslamicEval 2026، التي تتناول مجالًا بالغ الحساسية، هو كشف الهلوسة الدقيقة في المحتوى الإسلامي العربي. وتركز المهمة على العثور على اقتباسات القرآن والحديث داخل إجابات النماذج، والتحقق من صحتها، وتصحيح النصوص الخاطئة، وقياس مدى صلة الاستشهاد بالسؤال المطروح. وتكتسب هذه المهمة أهمية خاصة في ظل تزايد الاعتماد على النماذج اللغوية في الإجابة عن أسئلة معرفية ودينية، حيث قد تبدو الصياغة العربية سليمة بينما يكون الاقتباس محرّفًا أو منسوبًا على غير وجهه.

وفي اتجاه آخر، تطرح ArGuard 2026 تحديًا متصلًا بسلامة المحتوى العربي، من خلال مسارين: الأول لكشف الميمات العربية الحاوية على خطاب كراهية عبر تحليل الصورة والنص معًا، والثاني لرصد المحفزات النصية الضارة الموجهة إلى النماذج اللغوية الكبيرة. وتتعامل المهمة مع تحديات عربية خاصة، منها اللهجات، والسخرية، والتناوب اللغوي، والإشارات الثقافية، بما يجعلها أقرب إلى بيئات الاستخدام الفعلية لا إلى بيانات مختبرية مبسطة.

وتحضر التطبيقات التعليمية بقوة عبر مهمة BAREC Shared Task 2026 الخاصة بتقييم المقروئية العربية. وتستهدف هذه المهمة تصنيف الجمل والوثائق العربية وفق 19 مستوى من الصعوبة القرائية، اعتمادًا على مدونة عربية كبيرة تتجاوز مليون كلمة. ومن شأن هذه المهمة أن تدعم تطوير أدوات تعليمية قادرة على تقدير ملاءمة النصوص للمتعلمين، ومساعدة الناشرين والمنصات التعليمية في تبسيط المحتوى أو توجيهه إلى الفئات المناسبة.

أما KnowledgeGraphEval 2026 فتتجه إلى بناء شبكات المعرفة العربية وتكييفها عبر المجالات. وتعالج المهمة مسألتين رئيسيتين: التعرف على الكيانات المسماة في عشرة مجالات مختلفة، واستخراج العلاقات الدلالية بين الكيانات. وتأتي أهمية هذا المسار من ارتباطه المباشر بتطبيقات البحث الدلالي، واسترجاع المعلومات، والإجابة عن الأسئلة، وأنظمة التوليد المعزز بالاسترجاع، وهي تطبيقات تتطلب تمثيلًا منظمًا للمعرفة لا مجرد معالجة سطحية للنصوص.

وفي مجال اللهجات والكلام، أعلنت NADI 2026 إتاحة بيانات التدريب ونصوص التقييم والأنظمة المرجعية، فاتحة مرحلة تطوير الأنظمة أمام المشاركين. وتمتد نسخة هذا العام إلى مهام في معالجة الكلام العربي اللهجي، منها التعرف الآلي على الكلام في ظروف ضوضائية، والتعرف على الكلام المختلط اللهجات، ومعالجة التناوب اللغوي، وتحويل النص إلى كلام، والترجمة المنطوقة، وفهم اللغة المنطوقة. ويعكس ذلك انتقال الاهتمام من النص المكتوب وحده إلى العربية المنطوقة بتنوعاتها الواقعية.

كما تطرح AraGenre 2026 مهمة متخصصة في التصنيف الهرمي للأجناس النصية العربية اعتمادًا على تعريفات موجهة، مع اختبار قدرة النظم على التعميم من بيانات تدريب محدودة إلى تراكيب وأجناس غير مرئية. وتبرز هذه المهمة أهمية فهم الوظيفة التواصلية للنص العربي، لا مجرد تصنيفه وفق مؤشرات سطحية.

وفي الذكاء الاصطناعي متعدد الوسائط، تدعو ImageEval 2026 المشاركين إلى تطوير وتقييم أنظمة تفهم الصور والسياقات الثقافية العربية، من خلال أسئلة بصرية عربية، وكشف الهلوسة المرتبطة بالصورة، وتقييم الدقة الثقافية في توليد الصور من النصوص. وتأتي هذه المهمة في وقت تتسارع فيه أدوات توليد الصور وفهمها، بينما تظل الثقافة البصرية العربية ومنطقة الشرق الأوسط وشمال إفريقيا أقل تمثيلًا في كثير من النماذج العالمية.

وتشير الدعوات إلى أن كثيرًا من المواعيد الحرجة للمشاركة تقع في يوليو وأغسطس 2026، ولا سيما مواعيد التسجيل، وإتاحة بيانات الاختبار العمياء، وتسليم نتائج الأنظمة، ثم تقديم أوراق وصف الأنظمة للنشر ضمن أعمال ArabicNLP 2026. كما تؤكد بعض الدعوات أن المشاركة في المهام المشتركة تتيح للفرق البحثية فرصة نشر أوراق وصف أنظمتها ضمن وقائع المؤتمر، إلى جانب المنافسة على لوحات النتائج والجوائز في بعض المهام.

وتعكس هذه الخريطة البحثية اتجاهًا واضحًا في معالجة العربية آليًا: الانتقال من بناء النماذج إلى مساءلتها، ومن قياس الدقة العامة إلى اختبار السلامة، والثقة، والتعميم، والحساسية الثقافية، والقدرة على التعامل مع العربية بوصفها منظومة لغوية متعددة المستويات واللهجات والوسائط.

وبينما تتقدم النماذج اللغوية الكبيرة بسرعة في إنتاج النصوص العربية، تظهر مهام ArabicNLP 2026 المشتركة بوصفها اختبارًا عمليًا لما هو أبعد من الطلاقة: هل تفهم النماذج العربية في سياقاتها؟ هل تتحقق من مصادرها؟ هل تتعامل مع المعرفة الدينية والثقافية بحذر؟ هل تستطيع فهم اللهجات والصور والميمات والكلام المنطوق؟ تلك هي الأسئلة التي تسعى هذه المهام إلى تحويلها من نقاش عام إلى قياسات بحثية قابلة للمقارنة.

المصدر: رسائل دعوات المشاركة المنشورة عبر مجموعة SIGARAB الخاصة بمعالجة اللغة العربية الطبيعية، والمواقع الرسمية للمهام المشتركة في ArabicNLP 2026.