أُعلن عن قبول ورقة بحثية عربية في مؤتمر Language Resources and Evaluation Conference (LREC 2026)، أحد أبرز المحافل الدولية في مجال الموارد اللغوية وتقييمها، تتناول قياس “التأدب” في العربية ضمن سياق النماذج اللغوية الكبيرة وتطبيقاتها. وتحمل الورقة عنوان:
“ADAB: Arabic Dataset for Automated Politeness Benchmarking – A Large-Scale Resource for Computational Sociopragmatics”.
التأدب بوصفه معيارًا للتواصل الفعّال
تأتي هذه الدراسة في سياق الاهتمام المتزايد ببعد “اللطافة” أو “التأدب” في التفاعل بين الإنسان والأنظمة اللغوية، حيث يُعدّ هذا البعد عاملًا حاسمًا في تحسين جودة التواصل الآلي، والحد من سوء الفهم الثقافي، وتعزيز الثقة في تطبيقات مثل الدردشة الآلية والترجمة الآلية وخدمات العملاء.
وتشير الورقة إلى أن التأدب في العربية يرتبط بمرجعيات ثقافية وأخلاقية عميقة، مستمدة من التراث الإسلامي ومنظومات القيم الاجتماعية، وهو ما يميّزه عن المقاربات الغربية الكلاسيكية، مثل مبدأ روبن لاكوف (1973) الذي يركّز على قواعد تجنب الفرض وإظهار الود. في المقابل، تتجلى اللطافة في العربية في صيغ الشكر، والإجلال، والإعجاب، والدعاء، والرفق في القول والفعل، كما فصّل علماء التراث شروط الكلام المهذّب من حيث الداعي، والموضع، والقدر، واختيار اللفظ.
“أدب” (ADAB): أول مجموعة بيانات عربية واسعة النطاق
تقدّم الورقة أول مجموعة بيانات عربية متخصصة لقياس التأدب آليًا، تحت اسم ADAB، وتضمّ 10,000 عينة نصية مصنفة إلى ثلاث فئات رئيسة:
مهذّب
غير مهذّب
محايد
وقد جُمعت العينات من مصادر متنوعة، تشمل وسائل التواصل الاجتماعي، والتجارة الإلكترونية، وخدمات العملاء، بما يضمن تمثيلًا واسعًا للسياقات الواقعية. كما تغطي البيانات العربية الفصحى إلى جانب لهجات متعددة (الخليجية، والمصرية، والشامية، والمغاربية)، مع تصنيف لغوي عبر 16 فئة فرعية للتأدب.
اختبار أربعين نموذجًا لغويًا
لم يقتصر العمل على بناء المورد، بل شمل أيضًا اختبار 40 نموذجًا حاسوبيًا، من بينها:
نماذج التعلم الآلي التقليدية،
نماذج قائمة على بنية المحوّلات (Transformers)،
نماذج لغوية كبيرة (LLMs).


