دور المدونات الحاسوبية في بناء المعاجم الالكترونية لتعليم اللغة العربية للناطقين بغيرها

Le rôle des blogs dans les dictionnaires électroniques pour l’enseignement de l’arabe aux non-natifs

The Role of Computer Blogs in Developing Electronic Dictionaries for Teaching Arabic to Non-Native Speakers

العربي بوعمران بوعلام

p. 269-282

العربي بوعمران بوعلام, « دور المدونات الحاسوبية في بناء المعاجم الالكترونية لتعليم اللغة العربية للناطقين بغيرها », Aleph, Vol 11 (3-1) | 2024, 269-282.

العربي بوعمران بوعلام, « دور المدونات الحاسوبية في بناء المعاجم الالكترونية لتعليم اللغة العربية للناطقين بغيرها », Aleph [], Vol 11 (3-1) | 2024, 20 May 2024, 21 November 2024. URL : https://aleph.edinum.org/11638

تعد المدونات الحاسوبية من بين المجالات التي استفادت بكثرة من التقانات الحديثة، وحققت ارتباطا قويا بين اللغة والحاسوب، حتى أصبحت أداة بحثية ومقاربة منهجية لا يمكن الاستغناء عنها في مختلف الدراسات اللغوية، والتي ترتبط بشكل مباشر باللسانيات الحاسوبية، والمعالجة الآلية للغات الطبيعية، كما يمكن استثمارها في مجال الصناعة المعجمية، والتعليمية، والترجمة وغيرها من المجالات، وذلك يعود للميزات التي تتيحها هذه المدونات اللغوية من توفير كم هائل للبيانات النصية، واختصار الجهد والوقت وتنظيم المعلومات وتصنيفها، والقدرة على استرجاعها.


Les blogs linguistiques figurent parmi les domaines qui ont largement bénéficié des technologies modernes, établissant ainsi un lien solide entre la langue et l'ordinateur. Ils sont devenus un outil de recherche indispensable et une approche méthodologique dans diverses études linguistiques, directement liées à la linguistique computationnelle et au traitement automatique des langues naturelles. Ils peuvent également être exploités dans le domaine de l'industrie lexicale, de l'éducation, de la traduction et d'autres domaines, grâce aux avantages qu'ils offrent, notamment la fourniture d'une énorme quantité de données textuelles, la réduction des efforts et du temps, l'organisation et la classification des informations, ainsi que la facilité de recherche.

Linguistic blogs have greatly benefited from modern technologies, establishing a strong connection between language and computers. They have become indispensable research tools and methodological approaches in various linguistic studies, directly related to computational linguistics and natural language processing. Additionally, they can be leveraged in the field of lexical industry, education, translation, and other areas due to the advantages they offer, such as providing vast amounts of textual data, reducing effort and time, organizing and classifying information, and facilitating retrieval.

مقدّمة 

إن ظهور المدونات اللغوية الحاسوبية وما صاحبها من منهجيات، قد غير من أسلوب استقراء مؤلفي المعاجم واللغويين للحقائق اللغوية، فالمدونات اللغوية في الوقت الراهن تعني أن مؤلفي المعاجم بإمكانهم الجلوس أمام إحدى شاشات الحواسيب الإلكترونية، وفيما لايزيد عن عدة ثواني يمكنهم استخراج الأمثلة الكاملة التي تمثل الاستخدام الحقيقي لكلمة أو تعبير لغوي في نصوص يتعدى حجمها مليون كلمة، وهذا لا يعني فقط أن إنتاج المعاجم وتطويرها يتم الآن بشكل أسرع مما سبق، بل يعني أيضا أن تعريف المواد اللغوية يتم بشكل أدق وأكثر شمولية، وذلك لأن المواد اللغوية يتم استقراؤها من خلال مدونة لغوية حقيقية، وهذه الذخيرة تمثل تجمع هائل للعينات اللغوية يفوق كثيرا ماكان عليه الوضع فيما مضى. (نينغ لي، 2016، ص282)

فالاعتماد على المدونات اللغوية في الصناعة المعجمية يشكل قفزة هائلة، لما تتيحه من إمكانات سواء من ناحية الجهد والوقت أو من ناحية المعلومات التي توفرها.

كما تساعد المدونات اللغوية المحوسبة في استقراء الحالات التي تظهر فيها كلمة ما للتعرف على معناها وهذه المنهجية تستخدم بصورة أساسية في مجال علم المعجمية، إلا أن المدونات تلعب دورا مهما في خدمة الدلالة حيث يبرز دورها في إمدادها بشروح موضوعية تعتمد على أسلوب ديناميكبي يتغير حسب طبيعة التغيرات اللغوية، ويتمثل أول دور مهم للمدونات اللغوية في إمكانية حصر المعاني الإضافية للكلمات بشكل موضوعي وفقا للواقع اللغوي (نينغ لي، 2016، ص287)، أي استقراء مختلف السياقات اللغوية التي من الممكن أن ترد فيها الكلمة، والتي باستطاعة المدونات اللغوية أن توفرها كونها تضم كم هائل من البيانات المحوسبة والتي يتم استرجاعها بسهولة فائقة.

1. دور البرامج والمدونات الحاسوبية في الصناعة المعجمية

1.1. أهمية البرامج الحاسوبية في الصناعة المعجمية 

ينبغي هنا أن نميز بين مفهومين في إطار العلاقة بين المعجم والتقنيات الحاسوبية :

  1. الأول : هو المعجمية الحاسوبية، ويقصد بها صناعة المعاجم باستخدام تقنيات الحاسوب وقدراته في التخزين والتحليل والاستفسار، ابتداء من الاعتماد على المدونات المحوسبة والأشكال الحاسوبية للتخزين مثل قواعد البيانات.

  2. الثاني : هو المعجم الحاسوبي، ويقصد به المعجم المبني على أسس مفاهيمية حاسوبية تتعدى مجرد استخدام الأدوات الحاسوبية في التحليل أو التخزين أو تيسير الاستدعاء، فنقل معاجم تقليدية وتخزينها حاسوبيا لا ينتج معجما حاسوبيا حقيقيا، ولكنه ينتج معجما تقليديا بشكل حاسوبي. (رشوان،2019، ص26)

ويمكن تقديم لمحة عن المساهمات الحاسوبية في بناء المعجم :

  • يوظف المعجميون الحاسوبيون البرامج والأدوات الحاسوبية في إجراء عمليات الجمع والاكتساب والاحصاء والفهرسة والتحليل والتصنيف، ثم يأتي دور المعجمي الذي يقوم بعمليات تحليل النصوص أو السياقات التي وردت فيها الكلمة، للوصول إلى الدلالات، ثم تصنيفها إلى دلالات مركزية ودلالات هامشية ودلالات مجازية، ثم يقوم بالعنونة.

  • تنظيم المادة وتخزينها حاسوبيا، إذ يقوم بتحويل المادة المعالجة إلى صورة قاعدة بيانات معجمية تمهيدا لاستخراج الموارد المعجمية منها، وللحاسوب دور مهم في في تنسيق وتنظيم المادة. (رشوان،2019، ص26)

  • ساهم الحاسوب بشكل كبير في الصناعة المعجمية، وذلك نظرا لكمية البيانات الضخمة التي تحتاجها الصناعة المعجمية، إذ أن معالجة البيانات الضخمة تشكل عائقا كبيرا خاصة إذا كان يتم الأمر بشكل يدوي، ومن هنا تظهر أهمية الحاسوب من خلال تخزين كم هائل من البيانات وترتيبها وتصنيفها، مع إمكانية التعديل والحذف والزيادة، بحيث أن المعاجم الالكترونية تمتاز بخاصية إيجابية هي كونها مفتوحة المصدر لإمكانية إضافة وتطوير الرصيد المعجمي الموجود على مستوى قاعدة البيانات، إضافة إلى خاصية الاسترجاع السريعة وذلك أن الحاسوب بامكانه تصنيف المعلومات وتبويبها إلى العديد من الفئات أو المداخل حتى يسهل العثور عليها وإعادة استرجاعها.

  • كما يتيح المعجم الالكتروني العديد من المزايا من بينها توفير ميزة التدقيق الاملائي للكلمة المدخلة، إذ تورد احتمالات الخطأ عند ادخال المستخدم للكلمة، وتقدم مقترحات بديلة للكلمة المراد البحث عنها.

2.1. المدونات الحاسوبية والصناعة المعجمية 

اعتمدت المعجمات القديمة في تسجيل المفردات ومعانيها على اللغة التي تستخدم على ألسنة الجماعة اللغوية، وأولى المعجميون المتأخرون عناية بتهذيب المعاجم القديمة وإعادة صياغتها لتتناسب مع اللغة المعاصرة ومستجداتها التي تفرضها عوامل التطور اللغوي المتأثرة بالزمان والمكان والأحداث، لكن واقع الصناعة المعجمية في كثير من اللغات يؤكد أن المعجميين لم يوفقوا إلى هذا الهدف، لاعتمادهم على المعجمات القديمة، الأمر الذي أدى إلى عدم التمييز بين المهمل والمستعمل من مفردات اللغة ومعانيها، ونستطيع أن نمثل على ذلك من اللغة العربية بالمعجم الوسيط ( وهو معجم عربي معاصر، أصدره مجمع اللغة العربية بالقاهرة في طبعته الأولى عام 1960م، وفي طبعته الثالثة عام 2003) حيث يعنى بإيراد معاني العديد من الحقول المهملة، على شاكلة (بجبج، بحشل، جعبب) ولا يعنى بكلمتي (حاسب وحاسوب) الشائعتين.

وهنا تظهر فائدة استخدام المدونات اللغوية الحاسوبية في صناعة المعجم، لأن المعجمي حينئذ سيجمع المادة التي يعتمد عليها في صناعة المعجم من اللغة المستعملة والمتداولة بين أهلها، لا من اللغة المهجورة في ثنايا المعجمات القديمة، كما سيكون قادرا على التمييز بين المستعمل والنادر والمهمل من المفردات والمعاني. (رشوان،2019، ص79)

2. تكامل المدونات الحاسوبية في تعليم اللغات وتطوير المعاجم الإلكترونية

1.2. المدونات الحاسوبية وتعليمية اللغات 

تعتبر المدونات اللغوية مصدرا هاما في عملية تعليم اللغات، وذلك لأن الدارسين في المرحلة المبكرة يكونون في حاجة إلى تزويدهم برصيد لغوي خاص، لذا بالإمكان الاعتماد على ذخائر لغوية خاصة بالعملية التعليمية، توفر نصوص تحريرية خاصة تراعي حاجات المتعلم، كما يمكن استخدام المدونات اللغوية في عملية تعليم اللغات الأجنبية لأغراض خاصة، أي تعليم اللغات لأغراض تختص ببعض مجالات الاستخدام اللغوي، وهذا ما يتعارف عليه الجميع باسم تعليم اللغات الأجنبية لأغراض تخصصية مثل تعليم اللغة الإنجليزية لطلاب الطب، حيث تكون العينات منتقاة من المقررات الدراسية تضم قوائم المفردات ومختلف الاستعمالات اللغوية. (نينغ لي، 2016، ص291)

كما تؤدي المدونات اللغوية دورا كبيرا في تطوير المناهج التعليمية للغات، إذ لا يقتصر دورها على جمع المادة اللغوية وإحصائها، وإنما تمتد لتشمل الأنماط البنيوية والتركيبية للغة، والتي تساعد على تعلم القواعد النحوية، ففي اللغة العربية يمكن الاعتماد على المدونات اللغوية التي ترتكز على بنية الكلمة في حصر الأوزان الصرفية الشائعة للأفعال والمشتقات والمصادر بأنواعها، كما يمكن الاعتماد عليها في حصر الصيغ الشائعة لكل نوع من المشتقات على حدة، أما على مستوى التراكيب فيمكن الإفادة من المدونات اللغوية في التعرف على المواقع الاعرابية الأكثر ترددا وشيوعا، وكذلك في حصر أنماط الجملة العربية، الأمر الذي يساعد على معرفة أكثر الأنماط التركيبية شيوعا، واستنباط خصائص الجملة العربية من حيث متوسطات أطوالها وتتابعات أقسامها، كذلك تستخدم في التحليل الدلالي للنصوص وفي بناء قواعد بيانات الأنطولوجيات وشبكات الكلمات. (رشوان،2019، ص81)

كذلك من أهم أهداف الذخيرة هو الاهتمام بالجانب التعليمي من خلال حصر الألفاظ المستعملة في ميدان التخصص المعرفي، وتحديد الجذور الخاصة بالكلم وماهيته التلفظية، وكذا بناء المعاجم التعليمية المتخصصة، وهذا ما أشار إليه «  عبد الرحمن الحاج صالح » حينما دعا إلى اعتماد الذخائر اللغوية، إذ أن معظم أعماله العلمية التي شرع في انجازها منذ سبعينيات القرن الماضي، كلها تكرس العمل على ترقية استعمال اللغة العربية وتطوير تدريسها بالاعتماد على معطيات اللسانيات التربوية، وبالاستعانة بالتكنولوجيا اللغوية لتطوير البحث ومضاعفة مردوده، وهي غاية حضارية يتطلب تحقيقها إعادة النظر في منهج البحث والمادة اللغوية وطرق التدريس وتكوين المعلمين. (بوشحدان، 2010، ص32)

حيث دعا إلى إنجاز بنك آلي يتضمن مادة لغوية زاخرة تستقى من التراث العربي القديم والحاضر، كما أن لهذا البنك جانبين : يتمثل الأول في الجانب اللغوي ( الاستعمال الحقيقي للغة قديما وحديثا)، أما الثاني فيكمن في الجانب الثقافي (العلمي والتربوي) ومع ذلك، هناك جانب ثالث استدركه عبد الرحمن الحاج صالح له صلة بمجال التعليمية يقول في هذا الصدد

«  ومن جهة أخرى، جميع الطرائق التعليمية المتعلقة بتحصيل مهارة معينة، كتعليم اللغة العربية بحسب أعمار المتعلمين ومستواهم ولغة منشئهم، وكتعليم الفنون المختلفة بالعربية، وغير ذلك، ولهذا ستدخل في الذخيرة اللغوية العربية أنواع كثيرة من النصوص، منها الموسوعات العلمية والتقنية العربية أو المعربة ( مع النص الأجنبي الأصلي)، وطرائق لتعليم العربية، ومختلف الطرائق لتعليم تقنيات معينة بمستويات متنوعة ». (الحاج صالح،2001، 153)

2.2. ضرورة بناء معجم الكتروني لتعليم اللغة العربية للناطقين بغيرها 

إن مهمة إتقان اللغة مطلب عزيز بالفعل، ولا بد لهذا الأمر من أن يكون ماثلا أمام كل من يرغب في تعلم لغة ما أو تعليمها، وإذا كان الحديث هنا يتناول تعلم اللغة وتعليمها فإنه لا بد من الإشارة إلى أن اللغة من حيث هي مادة تعليمية لا تقتصر على مجموعة القوانين والأنظمة الصوتية والصرفية والنحوية والمعجمية، بل هي نظام أوسع من ذلك بكثير يمتد ليؤثر في الأنظمة السلوكية والإشارية المرتبطة بالإفادات المجتمعية الناتجة عن تقديرات مجتمعية سابقة تواضع المجتمع على الاعتراف بها وقبولها في ظل شروط وضعها هو نفسه فصارت اللغة بذلك محاطة بشروط ثقافية خاصة تحكمها أعراف كل مجتمع وتواضعاته المسبقة تجاهها.( فاطمة العمري،2012، ص 394 )

لذلك يواجه متعلموا اللغة العربية للناطقين بغيرها، صعوبات جمة ومشكلات عديدة من بينها :

  • غنى المعجم العربي من حيث الرصيد المعجمي، إذ أن كثرة الكلمات تجعل من الصعوبة التمكن الكامل من اللغة العربية وهذا يشكل عائق أمام متعلم اللغة غير الناطق بها.

  • تعدد معاني الكلمات وتنوع دلالاتها بحسب السياقات التي ترد فيها، وانتقال الكلمة من المعنى الحقيقي إلى معان مجازية، وهذا ما يشكل صعوبة أمام المتعلم لفهم مختلف المعاني للكلمة الواحدة.

  • ارتباط الكلمات العربية بالتصريف، وخضوعها للقواعد الصرفية، من حيث الشكل أو البنية، والميزان الصرفي والتوزيع، وهذا يشكل صعوبة على المتعلم الناطق بغير اللغة العربية، وإن كان هذا الارتباط من الميزات المهمة في اللغة العربية، فالكثير من المتعلمين الذين لم يتعودوا على هذا النوع من الارتباط في لغاتهم. (حاج إبراهيم، 2018، ص166)

يغفل الكثير من المتعلمين الجوانب الثقافية، والذي له مكانة هامة في تعليم وتعلم اللغات، ويعتبر مكونا أساسيا ومكملا مهما لمحتوى المواد التعليمية في هذا الميدان، لذلك لا بد أن تندمج العناصر الثقافية للغة المستهدفة اندماجا كاملا في المادة التعليمية، وقد أثبتت الدراسات أن معظم متعلمي اللغة يرون أن المعلومات والمعارف الثقافية هدف أساسي من أهداف أي مادة تعليمية لتعلم اللغات الأجنبية، كما يرون أيضا أنها عامل مهم من عوامل النجاح في تعلم اللغة واستخدامها فالتفاعل مع الناطقين باللغة لا يحققه إتقان مهارات اللغة فقط، بل فهم ثقافة أهل اللغة أيضا، حيث العادات الثقافية تشبه إلى حد كبير المهارات اللغوية.

3.2. مراحل التعامل مع المدونات اللغوية المحوسبة 

هناك العديد من الطرق في التعامل مع الذخائر اللغوية، سواء كان ذلك من خلال الاستعانة بالبرمجيات الحاسوبية أو الخوارزميات أو بعض الأدوات التحليلية الإحصائية، نذكر هنا بعض طرق التعامل مع المدونات اللغوية المحوسبة :

  1. الوسم أو التمييز بالعلامات : وهي مرحلة أساسية في التعامل مع النص، ونعني بها عملية كسر تسلسل الحروف في النص بالعثور على حدود الكلمات كلمة كلمة وتحديد نقطة بدايتها ونقطة انتهائها، ويبدو هذا يسيرا في الإنجليزية وما شابهها من أنظمة الكتابة اللاتينية، ولكن العربية تواجه تحديات أكبر من حيث تنوع شكلها الكتابي، والضبط عن طريق الحركات.

  2. عنونة الكلمات بأقسامها : في هذه المرحلة يتم فرز أقسام الكلمة ووسم كل منها بإشارة مميزة، فالمفردات يتم تقسيمها إلى مفرد وجمع، ومذكر ومؤنث، وكذلك عنونة الأفعال وفق صيغها الزمنية، وتختلف برامج العنونة من حيث القدرة إذ هناك برامج لا تزيد عنوناتها على 20 عنونة وأخرى متقدمة ومطورة قد تصل إلى 400 عنونة، وتطمح الذخيرة العربية الشاملة إلى عنونة صرفية ونحوية ومعجمية شاملة متقدمة ومتطورة.

  3. الاعراب الجزئي : تأتي وظيفة المعرب الجزئي ليطبق قواعد نحوية عليها وذلك بإنتاج شجرة أو جدول الاعراب من الجملة، ويتضمن الجدول مجموعة الأعاريب الجزئية التي يقوم برنامج الفهرسة أثناء عملية الإعراب والتي يناظر كل إعراب جزئي منها جزءا من الجملة(Substring)، أي تحليل الجمل إلى مكوناتها الأساسية، وقد يتم وضع هذه المكونات الأساسية بين أقواس، ويتم عادة التحليل الاعرابي للجمل في شكل تفريعي يشبه الشجرة يطلق عليه «  أشجار تركيب العبارة »، وتتجمع هده الأشجار مع بعضها البعض لتمثل الجمل والعبارات المكونة للمدونة اللغوية. (الدكروري، 2018، ص74)

  4. التحليل الدلالي : ويقصد به الكشف عن معنى الكلام بطريقة منهجية، وهو الهدف من تحليل الجملة، ويتلخص في تجريد البنية المقطعية والعلاقات المنطقية للتركيب النحوي للجملة، فالتحليل الدلالي يقصد منه التعرف على مضمون الدلالات الكامنة وراء الجملة أو السياق، والطريقة المتبعة الشائعة في هذه المهام تجويل التعريفات القاموسية لمعاني الكلمات إلى صيغ منطقية، كما أنه ليس هناك قياس واحد متفق عليه للسمات الدلالية التي ينبغي أن يؤخذ بها سوى عمليات الاستنتاج المنطقي.

  5. الحاشية / التعليقة الخطابية : تختلف هذه المرحلة عما سبق من تحليل لساني للذخيرة بأنها لا تحلل الجملة كلمة كلمة، ولا هي تفك شفرات معاني الجمل جملة جملة فحسب، بل إنها تقوم بالكشف عن بنية الخطاب التي تحددها العلاقات اللغوية والمنطقية الصريحة والضمنية التي تربط بين أجزاء الكلام، وتوضح التعليقة علاقة الكلام بالسياق الذي يستعمل فيه لفهم معناه الإجمالي ورفع ما قد يوجد من لبس في معاني الجمل.

3. الخطوات المنهجية لصناعة معجم الكتروني متخصص لتعليم اللغة العربية للناطقين بغيرها 

هناك العديد من الوسائل لبناء المدونات اللغوية من أجل الصناعة المعجمية كطريقة الجمع الشامل للبيانات« ، أو طريقة اختيار البيانات من أجل بناء معجم متخصص، وندكر هنا بعض الطرق الحاسوبية التي يمكن الاعتماد عليها في جمع البيانات :

  • الطريقة التعاونية  »ويكي«  : تمكن الطريقة التعاونية  »الويكي«  من بناء معاجم الكترونية بتكلفة زهيدة جدا، وهذه الطريقة برزت مع ظهور المدونات الحاسوبية والموسوعات الالكترونية الحرة، كونها تسمح للمستخدمين بالمشاركة الدورية من خلال وضع بيانات جديدة من أجل إثراء المحتوى، ويمكن الاعتماد على هذه المواقع الالكترونية في بناء معاجم الكترونية كونها توفر المفردات الجديدة المستعملة، إضافة إلى سهولة الوصول إلى البيانات النصية واسترجاعها.

  • ويب كورب : هو عبارة عن مدونة نصية ضخمة متاحة مجانا على شبكة الانترنيت تضم العديد من الأدوات التي تساعد على البحث واسترجاع المعلومات ومعرفة السياقات وعدد التكرارات، وهي بخلاف محركات البحث البسيطة والمعهودة، مصممة خصيصا للبحث في مجال المدونات اللغوية، تم إنشاء وتشغيله وصيانته بواسطة وحدة البحث والتطوير لدراسات اللغة الإنجليزية بجامعة برمجهام سيتي.

الشكل (01) : واجهة موقع WebCorp

الشكل (01) : واجهة موقع WebCorp

تشبه واجهة WebCorp الواجهات التي توفرها محركات البحث القياسية، حيث تقوم بإدخال كلمة أو عبارة، واختيار الخيارات من القوائم المتوفرة ثم الضغط على الزر Search، تظهر بذلك جميع السياقات التي ظهرت فيها الكلمة المدخلة، كذلك تظهر قائمة عناوين URL التي تتواجد فيها الكلمة المدخلة، بحيث يتم استرجاع هذه المعلومات من كل صفحة من صفحات الويب، كل ذلك يظهر في صفحة واحذة مع إشارة إلى روابط المواقع التي استخدمت الكلمة.

الشكل (02) : واجهة نتائج البحث عن كلمة مدونة في موقع WebCorp

الشكل (02) : واجهة نتائج البحث عن كلمة مدونة في موقع WebCorp

  • الاعتماد على بناء المدونات اللغوية المحوسبة:

  • تعتبر هذه الطريقة ذات فعالية عالية في بناء المعاجم اللغوية، إضافة إلى أنها غير مكلفة، إلى أنها تحتاج خبرة في التعامل مع مختلف الأنظمة الحاسوبية، وإطلاع واسع على طرق الاسترجاع والتصنيف والمعالجة، وكذا أدوات التحليل الحاسوبي والترميز والتشفير، وغيرها من الأدوات التي يمكن الاعتماد عليها في بناء المدونات اللغوية المحوسبة، ونذكر هنا أهم هذه الأدوات :

  • التشفير والترميز : والمقصود بالتشفير هنا هو تحويل النصوص أو المادة اللغوية إلى صيغ أو نماذج تتلاءم ولغة الحاسوب مثل : C++، وphp وHTML وJava وxml، وتحضيرها لمعالجتها آليا أو تصنيفها أو إعادة استرجاعها، أما الترميز فيعنى بإضافة معلومات توصيفية لهيكل المدونة اللغوية في صورة تمكن من التعامل معها برمجيا، أو تحليل نصوصها باستخدام أدوات المعالجة الآلية، أي إضافة مجموعة من الأكواد المعيارية إلى النصوص أو الوثائق المختزنة في المدونات اللغوية، بحيث تتوافر معلومات عن نصوص هذه الوثائق، تتيح التحكم في أشكالها، وطرق معالجتها مثل : اعطاء معلومات عن مصدر المدونة اللغوية، وتاريخ النص، ونوع النص، والمكان، وعدد المتحدثين، وتاريخ الميلاد، والمهنة والمستوى التعليمي...الخ، ويمكن وضع هذه الحقول وبياناتها في بداية كل ملف، أو في ملفات مستقلة مرتبطة بالملف الأساس، ولترميز المدونات اللغوية أهمية خاصة يمكن إيضاحها فيما يلي :

  • يتم اللجوء إلى ترميز المدونات اللغوية عندما يتم حذف الجداول وغيرها من الإيضاحيات من النصوص المكتوبة، فيشار إليها بعلامات تعويضية تدل على أماكنها وأنواعها، بينما يتم ترميز النصوص المنطوقة للتعبير عن الملامج المساعدة المميزة للحديث، كالضحك والبكاء، والتثاؤب..الخ.

  • إضافة تعليقات خاصة بالأعمال التحريرية التي تتم على المدونات اللغوية، ومن أشهر المواصفات المستخدمة في ترميز المدونات : معيار ترميز المدونات اللغويةCorpusEncoding Standard CES، معيار دبلن كور Dublin Core، مبادرة تشفير النصوص Texte Encoding Initiative(TEI) .

  • أن بيانات المدونات اللغوية قائمة بالأساس على رصيد من النصوص الأصلية، إلا أنها بمجرد تخزينها في الملفات يكون قد تم إخراجها من سياقاتها الطبيعية، فيأتي دور الترميز بما تقدمه من حقول للوصف لتستعيد هذه السياقات المفقودة، وتمكن القائمين على المدونات اللغوية من ربط النصوص بهذه السياقات مرة أخرى، وكلما ازدادت حقول الوصف في الترميز، ازدادت إمكانية تعويض الفقد السياقي للنصوص، وبالتالي ازدادت إمكانية إعادتها للاستعمال الطبيعي الذي ولدت فيه.(الدكروري، 2018، ص66)

  • التعرف على الكشافات السياقية : الكشافات السياقية هي أداة برمجية تبحث في المدونات اللغوية المحوسبة، وتعرض مجموعة من البيانات التي تتعلق بالدخيرة اللغوية كالكلمات والجذور وتصنيف حسب طول الكلمات، ترددات، بيانات نحوية أو معجمية.

  • لا تقتصر مهمة الكشافات السياقية في معالجة المدونات اللغوية على الاستخراج الآلي للبيانات، بل إنها تمكن من ضبط القوالب المتكررة (Recurring Pattens)، وعرض الأجزاء النصية التي تنتمي إليها، ولا يقف البحث عند هذه المرحلة الكمية، بل يتعداها إلى التحليل، بحيث تتولى مهمتين رئيسيتين هما :

  1. تنظيم مكونات المدونة اللغوية وتهيئتها على نحو ييسر على الباحث معاينتها ودراستها.

  2. ضبط تلك المكونات في شكل معطيات إحصائية. (توتاوي، 2009، ص 42)

هناك العديد من الأدوات والبرامج الحاسوبية التي تعمل ككشافات سياقية، حيث تبرز المفردة المعجمية من خلال مختلف السياقات التي وردت فيها، وبالتالي معرفة المعاني التي يمكن أن تتخدها المفردة الواحدة باختلاف استعمالها في مختلف السياقات اللغوية، ونذكر منها :

  • برنامج Concorde : بني في قسم الحاسب الآلي بجامعة ليدز، وهو أداة مجانية ومفتوحة المصدر، صممت في المقام الأول للتعامل مع المدونات اللغوية الحاسوبية، تقوم هذه الأداة بإظهار نتائج البحث على شكل كلمات في سياقاتها، بالشكل الذي تظهر عليه في المدونة الأصلية، لذا فهي تسمح للمستخدم برؤية النمط العام المتبع في استخدام الكلمات من خلال مختلف السياقات التي وردت فيها، ولإنشاء قائمة فهرسة كلمة أو جملة نقوم بإدخال الكلمة أو العبارة المراد البحث عنها مربع الادخال، ثم النقر على زر « إبدأ » لبدء إظهار نتائج الفهرسة، على شكل ثلاثة صفوف الصف الوسط يرمز له بـ(0) ويشير إلى الكلمة أو الجملة المدخلة، أما الصف الأيمن يشير إلى الكلمات التي تقع قبل الكلمة المدخلة ويرمز له بـ(R1)، أما الصف الثالث فيشير إلى الكلمات التي تقع بعد الكلمة المدخلة ويرمز له بـ (L1).

كما يمكن الانتقال من شاشة الفهرسة إلى نص الذخيرة المدخلة في البرنامج للإطلاع على موقع الكلمة أو الجملة أو السياق اللغوي الذي وردت فيه، بالنقر على أسطر الفهرسة، كما أن هناك العديد من التطبيقات التي تتيح ضمن أدواتها الكشاف السياقي، ويعد من أبرزها تطبيق aConCorde الذي يعتمد الفهرسة الألفبائية، حيث يكون ترتيب المفردات ألفبائية دون النظر إلى السوابق واللواحق كما هو موضح في الشكل التالي :

الشكل(03) : الكشاف السياقي ببرنامج aConCorde

الشكل(03) : الكشاف السياقي ببرنامج aConCorde

  • برنامج وورد سميث : يوفر برنامح وورد سميث الكثير من الوظائف التحليلية للمدونات اللغوية، فبعد تنصيب البرنامج وفتحه تظهر لنا نافدة البرنامج وعلى الرغم من عدم توفر واجهة معربة لهذه الأدوات إلا أنه من السهل التعامل مع مختلف الأدوات، تتيح الواجهة الرئيسية ثلاث أدوات أساسية هي : الكشاف السياقي (concord)، الكلمات المفتاحية (keywords)، وقائمة الكلمات (wordlist).

الشكل(04) : الواجهة الرئيسية لبرنامج وورد سميث

الشكل(04) : الواجهة الرئيسية لبرنامج وورد سميث

  • المعالجة الإحصائية :

تعتبر المدونات اللغوية مصدرا هاما لإجراء التحليل الكمي للغة، إلا أن استخدام التحليل الكمي في علم المدونات اللغوية ليس بالأمر الذي يمكن إجراؤه بسهولة داخل المادة اللغوية الممثلة لمتن المدونة، والتقنيات الاحصائية المستخدمة في هذه الحالة لا تقتصر على إجراء التحليل الرياضي للبيانات اللغوية المعقدة واستخراج القواعد المنظمة لتلك البيانات اللغوية فحسب، بل يمكن استخدامها أيضا في تفسير العلاقة بين كل من أسلوب الكتابة والتركيب اللغوي، وهناك العديد من طرق الإحصاء مثل : إحصاء معدل التكرار، نسبة ترددات الكلمة داخل المدونة، أسلوب الاختبارات الإحصائية وغيرها من الطرق. (نينغ لي، 2016، ص205)

الغاية الأساسية من التحليل الاحصائي للمدونات اللغوية هو استخلاص قائمة تحوي أكثر الكلمات شيوعا في المدونة اللغوية، وأن نتأكد من أن هذه القائمة تشغل الحيز الأكبر من الاستخدام الفعلي لجملة الكلمات في اللغة، والواقع أن أية لغة طبيعية تشتمل على نوعين من الكلمات هي الكلمات الوظيفية FunctionWords كأدوات العطف وحروف الجر ونحوها مما يعنى به علم التركيب Syntax، وكلمات المحتوى Content Words من الأسماء والأفعال، والمعتاد أن تكون الكلمات الوظيفية أكثر ترددا من كلمات المحتوى.( المعتز بالله، 2018، ص37)

الشكل(05) : الاحصاء الآلي بواسطة تطبيقaConCorde

الشكل(05) : الاحصاء الآلي بواسطة تطبيقaConCorde

خاتمة 

توصلت الدراسة إلى مجموعة من النتائج هي :

  • تعتبر الاستفادة من التقانات الحديثة في العملية التعليمية التعلمية أمر في غاية الأهمية، كونها تساعد في تحسين جودة التعليم.

  • ضرورة اتباع استراتيجية محكمة في بناء معجم الكتروني مخصص لتعليم اللغة العربية للناطقين بغيرها، تراعي مختلف مستويات المتعلم ومختلف المهارات اللغوية، من دون اغفال دور الجانب الثقافي في تعليم للغة العربية.

  • تعتبر المدونات اللغوية أداة فعالة جدا في بناء المعاجم الالكترونية، لما تتسم به من مزايا كتوفير الجهد والوقت والتنظيم والقدرة على تصنيف البيانات في العديد من الفئات، وسرعة استرجاع المعلومات.

ضرورة بناء مدونات لغوية عربية وإتاحتها للباحثين، من أجل الاستفادة منها في جميع المجالات كصناعة المعاجم وتدريب البرامج الحاسوبية، وعملية الترجمة وغيرها من الميادين البحثية.

أسوندي بن لامنياشيم، 2009، نحو بناء نموذج الذخيرة اللغوية العربية في ماليزيا، رسالة ما جستير، في اللغة العربية وآدابها، كلية الدراسات العليا، الجامعة الأردنية، آذار.

أيمن الدكروري، 2018، المدونات اللغوية ودورها في معالجة النصوص العربية، مركز الملك عبد الله بن عبد العزيز الدولي لخدمة اللغة العربية، السعودية، ط1.

خوانغ تشانغ نينغ لي جوان تزي، 2016، علم الذخائر اللغوية، تر : هشام موسى المالكي، المركز القومي للترجمة، مصر، ط1.

الشريف بوشحدان، 2010، الأستاذ عبد الرحمن الحاج صالح وجهوده العلمية في ترقية استعمال اللغة العربية، مجلة كلية الآداب واللغات، جامعة بسكرة، الجزائر، العدد07، جوان.

عبد الرحمن الحاج صالح، 2012، مشروع الذخيرة اللغوية العربية وأبعاده العلمية والتطبيقية، مجلة الآداب، العدد03.

فاطمة الزهراء توتاوي، 2009، استثمار المدونة في تدريب المترجم، مذكرة ماجستير،كلية الآداب واللغات والفنون، قسم الترجمة، جامعة وهران، السانية.

فاطمة محمد العمري، 2012، ثقافة للغة طريق أم هدف : مقاربة في تعليم اللغة العربية للناطقين بغيرها، مجلة دراسات، العلوم الإنسانية والإجتماعية، المجلد 39، العدد 02.

محسن رشوان وآخرون، 2019، الموارد اللغوية الحاسوبية، دار وجوه للنشر والتوزيع، المملكة العربية السعودية، ط1.

المعتز بالله السعيد، 2018، المدونات الرقمية وتعليم العربية لغة ثانية، المعتز بالله السعيد، المدونات الرقمية وتعليم العربية لغة ثانية، مجلة التواصل اللساني، المجلد، 19، العددان 1-2.

نوال بنت عبد الله، مجدي حاج ابراهيم، 2018، نحو بناء معجم مصطلحات تعليم اللغة العربية للناطقين بغيرها، مجلة الرسالة، المجلد 02، العدد01، جوان.

الشكل (01) : واجهة موقع WebCorp

الشكل (01) : واجهة موقع WebCorp

الشكل (02) : واجهة نتائج البحث عن كلمة مدونة في موقع WebCorp

الشكل (02) : واجهة نتائج البحث عن كلمة مدونة في موقع WebCorp

الشكل(03) : الكشاف السياقي ببرنامج aConCorde

الشكل(03) : الكشاف السياقي ببرنامج aConCorde

الشكل(04) : الواجهة الرئيسية لبرنامج وورد سميث

الشكل(04) : الواجهة الرئيسية لبرنامج وورد سميث

الشكل(05) : الاحصاء الآلي بواسطة تطبيقaConCorde

الشكل(05) : الاحصاء الآلي بواسطة تطبيقaConCorde

العربي بوعمران بوعلام

جامعة خميس مليانة، الجزائر

© Tous droits réservés à l'auteur de l'article