مقدمة
يتعرض الباحثون في زمن تكنولوجيا المعلومات لمشاكل عدة في مجال البحث والتنقيب عن المعلومات، خاصة العلمية والتقنية منها (IST) والتي هي محلّ إهتمام الأكاديميين قاطبة، هذه المشاكل متعددة منها ما هو لغوي ومنها ما يرجع للندرة ومنها أيضا ما هو تقني مرجعه إستحالة ولوج بعض المحركات وقواعد البيانات لعدم تناسب البروتوكولات التي تعتمدها الجزائر مع هذا النوع من المصادر.
هذا البحث سيسلط الضوء عن المشاكل اللغوية التي يصادفها الباحث وبالتحديد قضية الترادف اللغوي وكثرة المصطلحات وكيفية إيجاد طريقة للعمل بكل راحة وسط هذه الصعوبات التي تجعل الباحث في حيرة وحتى تناقض أحيانا خاصة في تحضير المساهمات والأعمال العلمية من مقالات، مذكرات، رسائل، ملتقيات...وغيرها، وفي هذا المجال يمكننا التساؤل عن ماهية الأدوات التي تساعد في التغلب على مشكل الترادف اللغوي في البحث العلمي، وإلى أي مدى يمكن للباحث إستغلالها في أبحاثه؟
1. الجانب المنهجي
1.1. الإطار العام للدراسة
1.1.1. الأدوات والتقنيات
سنعمل في هذا البحث على توظيف المنهج التطبيقي أو التجريبي كما يسميه بعض الباحثين، من خلال عرض لأدوات الويب 2.0، كما سيتم توظيف التحليل العلمي للأدبيات المتاحة في مجال اللغات التوثيقية، إلى جانب توظيف منهج البحث البيبليوغرافي لتصيف المراجع المعتمدة في العمل.
2.1.1. مصطلحات الدراسة
الترادف لفظ مشتق من الفعل ردف أو المصدر الردف، وهو ما تبع الشيء هذا على قول إبن جني (إبن جني، 2008) وهو عند إبن منظور كل قافية إجتمع في آخرها ساكنان وسمي بذلك لأن غالب العادة في أواخر الأبيات أن يكون فيها ساكن واحد، فلما اجتمع في هذه القافية ساكنتان كان أحد الساكنين ردف الآخر ولاحقا به (إبن منظور، 2019)
-
اللغات التوثيقية: أدوات تكشيف موضوعية معدة مسبقا تهتم بضبط المصطلحات وتوحيدها.
-
المكانز: مصطلح يوناني يعني كنز وهو عبارة عن خزان مصطلحات تربطها علاقات دلالية.
-
الأنطولوجيا: خرائط المعرفة أو كما يسميها البعض الخرائط الذهنية
-
الفالكسونومي: محتوى شعبي أو كلمات شعبية مصدرها مستعملي الويب وتم إختيارها لشعبيتها.
-
القواميس والموسوعات: كتب مرجعية تختوي مصطلحات مرتبة هجائيا وهي أنواع كثيرة
-
التصانيف العالمية: أدوات لتصنيف المعرفة العلمية حسب فلسفة معينة ونظام معين.
2. المقاربة التطبيقية لموضوع البحث
إشكالية الترادف كثيرة الحدوث في اللغة العربية وهذا نظرا لغناها وتنوعها في المعاني والسياقات اللغوية وقضية الترادف سيتم التطرق له من جانبان؛ الجانب الأول فهم أسباب وأنواع هذا الترادف تقنيا دون التعمق في القضايا اللغوية لكونها من تخصص اللغويين أما الجانب الثاني وهو ركيزة عذا البحث يسكون فيه توصيف للمشاكل التي يسببها الترادف الاصطلاحي للباحثين على مستوى استرجاع المعلومات في البحث داخل الويب العلمي والتقنيات التي يمكن أن تساعد في التغلب على هذا المشكل.
1.2. الترادف اللغوي في اللغة العربية: أسباب، أنواع، وتقنيات التوضيح والتقييس في الحوسبة
1.1.2. أسباب وأنواع الترادف
يأتي الترادف في اللغة العربية لعدة أسباب منها:
-
فقدان الوصفية لبعض الألفاظ وزيادة وتوسع المعاني حيالها وهذا على قول الجرجاني في كتابه التعريفات والذي أشار فيه إلى العلاقة بين المعنى اللغوي والمعنى الإصطلاحي والأمثلة في هذا الباب كثيرة يمكن تقديم مثال للفهم؛ لفظ السيف له أكثر من 50 صفة منها المهند واليماني والهمام (المهند الذي هو مصنوع في الهند، واليماني مصنوع في اليمن) وهكذا (مطوري، 2014. ص.4)
-
إختلاف الأسماء عند القبائل العربية، مثال ذلك القمح في لغة الشام، والحنطة عند أهل الكوفة والبر في لغة الحجاز.
-
الإقتراض من اللغات الأعجمية: وهو دخول عدد من الكلمات الأعجمية للغة العربية وهذا ما يسمى الدخيل والمستعار ويمكن تقديم مثال بسيط للفهم؛ النرجس التي هي عند العرب العبـــــــــهر والرصاص الذي هو الصّرفان؛
-
المجاز: المجاز يصبح مرادف مع مرور الوقت والأمثلة كثيرة؛ كاللسان للدلالة عن اللغة أو العين للدلالة عن الجاسوس؛
-
التساهل في الإستخدام: وهو عدم مراعاة الدلالة اللغوية الصحيحة للألفاظ عند إستخدامها مما يسبب ما يعرف بالأخطاء الشائعة في اللغة؛
-
التغيّر الصوتي: وذلك عند إستبدال حرف مكان حرف أو القلب اللغوي؛ مثال صاعقة وصاقعة، ثوم وفوم.
نلاحظ مما سبق أن الترادف له مسببات أكثرها ناتج عن إختلاط الألسنة واللغات العالمية وبالتالي لا مناص من تزايد الترادف وهذا ما أثار فيما بعد دراسات لإيجاد حل لهذا المشكل، ومن الجدير بالذكر في هذه القضية أن هناك مؤيدين لوجود الترادف ومناهضين له، ومن بين المؤيدين للترادف نذكر : سيبويه ، الأصمعي، الرماني أبو الحسن، الأصفهاني والفيروزآبادي، كما يوجد معارضين للترادف كثعلب وابن درستوية وابن فارس والبيضاوي وغيرهم....، والقول الفصل الذي عليه أغلب جمهور اللغة بوجود الترادف ووجود صعوبات لغوية كبيرة تنتج عنه، ولعل البحث في المحركات والويب العلمي اليوم دليل واضح لهذا الطرح عند إجراء عملية تنقيب عن المعلومات باللغة العربية.(مكتبة الملك فهد، 2008)
2.1.2. توضيح تقني حول مشكل الترادف اللغوي في العربية
على المستوى التطبيقي عند البحث باللغة العربية، كثيرا ما يواجه الباحث عن المعلومات التقنية والعلمية خاصة صعوبات يمكن سرد أهمها للتوضيح والفائدة لأن الباحث ملزم بكتابة كلمات مفتاحية داخل إطار معادلة البحث مباشرة بعد الولوج لقواعد المعلومات أو البوابات، الأرضيات، المحركات والأدلة بعبارة أبسط أدوات الويب، وبالتالي عندما يعرف الباحث الإجابة عن السؤال لماذا؟ يمكنه النجاح أو على الأقل التحسن في الإجراء الذي هو كيف؟
أهم الصعوبات الناجمة في البحث هي:
-
الإشتقاق وتشتت المداخل
-
المفاهيم المركبة
-
التعدد الدلالي
-
المستعار (النقحرة) التي هي كتابة المصطلحات الأجنبية باللغة العربية وإدماج كلمتين في كلمة
-
شفرة المحارف (غياب مواصفات عربية للنشر باللغة العربية)
-
صعوبات كتابة الحرف العربي
-
علامات الترقيم وتنقيط الحروف
-
جهة الكتابة التي تعاكس جهة كتابة اللغة الأجنبية
-
الفعل في اللغة العربية يسبق الفاعل على عكس اللغات الأخرى
-
الصيغ النحوية لكلمات الإستدراك مثل لكن ولأن التي تعكس مكان الفعل والفاعل.
-
صعوبة التعرف على الحروف العربية OCR
-
نقص بوتوكولات تبادل وعرض المعلومات في الويب.
هذه العناصر في الحقيقة هي من أهم النقاط الواجب تطويرها للوصول إلى محتوى عربي مقبول لكن التنفيذ أمر بالغ الصعوبة خاصة إذا عرفنا أن من يقوم بذلك أجانب ومن المبرمجين التابعين للغات الأخرى.
3.1.2. تقييس الحروف العربية في الحاسوب
بدأ تقييس الحروف العربية في الحاسوب ما بين (1933- 1968) نظريا طبعا بفضل مجمع اللغة العربية بالقاهرة، لكن هذه المحاولات لم ترق إلى تحقيق التوحيد وبدأت المنظمات الخاصة بالبحث عن حلول وإيجاد شفرة عربية موحدة، غير أن أهم وأنجع الدراسات حققتها المنظمة العربية للمواصفات والتقييس (العيدروس، 2007. ص. 60) وفيما يلي أهم المواصفات التي تشفر الحرف العربي:
-
مواصفة ASMO 445
-
المواصفة العربية ASMO 449 بسبعة عناصر
-
المواصفتين الدوليتين ISO 8859/ ISO 9036 شفرة بسبعة عناصر، لها 128 محرف وهي محارف خطوط تجمع الحروف والأرقام قابلة للتوسع، المحارف الألفبائية تتكون من 44 محرفا وهي 31 حرف ألف بائي – 3 حركات- 5 علامات للكتابة الهمزة و3 للتنوين- الأرقام من 0إلى 9 بالإضافة للعلامات الرياضية وعلامات المدلول الوظيفي (العيدروس، ص.90)
-
الشفرة العربية اللاتينية ذات 8 عناصر ISO 8859/6 والتي تم الإضافة فيها 50 محرفا
بالنسبة لمواصفات التشفير الخاصة بالحروف لدينا الترميز المعياري آسكي (ASCII) وكمثال لفهم هذا المعيار بكل بساطة؛ كل حرف يقرأ بسبع بيتات A مثلا رمزه 1000001 وهكذا... وهناك 128 شكل مختلف لتركيب هذه الحروف و1000 معادلة رياضية للشكل بالنسبة للغة الأجنبية و12000 للعربية.
كما هناك مواصفة أو نظام الترميز (UNICODE) الذي صمم لتشفير النصوص وتخزينها وهو بسيط ومستخدم بصفة واسعة بكل لغات العالم.
UNICODE يمثل الحروف ب 16 BIT بدلا من 7 وبالتالي لوحة المحارف تستوعب 65000 حرف وهذا المعيار يحدّد الحروف ومواقعها تمهيدا لتعامل البرمجيات للتعامل معها.
يمكن الإشارة هنا أن أحسن البرمجيات لكتابة العربية برنامج (صخر) الذي يحتوي على
-
أدوات الشكل الثمانية
-
الهمزات الستة مع الألف والباء والتاء المربوطة
-
الحروف الأخرى مع الكشيدة *
-
الرموز البيانية
-
مجموعات الألف واللام بثمانية مواضع
-
كل موضع الهمزات على الألف
وقد تبنت شركة ميكروسوفت Windows أشكال الهمزة والحروف العربية وعلامات الترقيم العربية التي تختلف عن الأجنبية.
2.2. تكنولوجيا توثيق اللغات: أدوات العمل اللغوي والتقنية في البحث وعلم المكتبات
1.2.2. الأدوات التقنية التي توفرها اللغات التوثيقة: مقاربة علم المكتبات
إن المشاكل السالفة الذكر تحتل جزء كبير من الدراسات العلمية في تخصص علم المكتبات والتي لا يعرفها الكثيرين ومن بين الحلول التي يقترحها علم المكتبات لهذه المشاكل إستخدام أدوات اللغات التوثيقية التي تدرس ضبط المداخل في البحث التوثيقي والبيبليوغرافي وهي أدوات معدة مسبقا منها : المكانز وقوائم رؤوس الموضوعات (ضبش، محمد عبد الواحد،1999) وتقنيات التكشيف والإستخلاص، كل هذه التقنيات أصبحت تحتل مكانة أساسية في إستراتيجيات البحث العلمي في الويب كما أنها مدرجة ضمن كل أدوات الويب 2.0 في قواعد البيانات والأرشيفات المفتوحة ووسائل الوصول الحرّ، ومحركات البحث.. وغيرها وسنقدم شرح وجيز لهذه لمقاربة.
-
الكلمات المفتاحية هي أساس البحث في الويب العلمي وهي تعتمد على ما يعرف بالروابط البولينية لكنها ليست كافية بل تحتاج إلى ضبط آخر وهو الكتابة المعيارية وهذه بالتحديد تؤخذ من المكانز ورؤوس الموضوعات حتى تصبح فعالة في البحث.
-
الكلمات المفتاحية المعيارية تختلف عن غيرها لأن محركات البحث وأدوات إستراجاع المعلومات تتعرف عليها وبالتالي تصبح فعالة في الإسترجاع وهذا بالتحديد أهمية إختيار الكلمات المفتاحية من المكانز وقوائم رؤوس الموضوعات.
-
كل أدوات إسترجاع المعلومات لها بنية هيكلية مبنية على العلاقات بين المصطلحات وهذه هي فلسفة بناء المكانز وقوائم رؤوس الموضوعات وقوائم الإسناد وحتى فهارس المكتبات المتاحة على الخط OPAC
-
يجب على الباحثين تعلم إستخدام المكانز والقوائم الإستنادية حتى يتمكنوا من الإستفادة منها لتوصيف المداخل واختيار الكلمات المفتاحية بفاعلية التي تقلّل بشكل كبير من مشكلة الترادف لأن هذه الأدوات معّدة على نظريات التحديد الدلالي للمعاني.
-
كل مصطلح له معنى ومقصود signifiant et signifier وهذه نظرة مهمة جدا أتى بها البنيويين من بينهم Barthes ومن هم في هذا التوجه الذى فتح آفاق جديدة في فهم النصوص وبالتالي زاد من إمكانات إسترجاعها.
-
علم المعجميّة الذي استقل بذاته حديثا واهتم بدراسة دقة اللغة ومفرداتها وهو قسمان؛ قسم يسمى معجمية عامة نظرية lexicology ومعجمية تطبيقية lexicography (المنظمة العربية للترجمة، 2014. ص.4) هذا العلم طور كثيرا نظام القواميس والمعاجم التي تعنى بالدلالة بعبارة أخرى المعاجم الدلالية أو كما يسميها البعض معاجم المتضادات والمتجانسات والمترادفات.
إن عملية التكشيف بدأت يدويا وتطورت مع ولوج المعالجة الآلية للغة والتكشيف هو ترجمة المستندات أو الوثائق إلى لغة إصطناعية (توثيقية) التي تعد نقل إلى لغة وسيطة بين القائم بعملية التوثيق والآلة وهذا ما يعرف بالتحليل الموضوعي، هذا الأخير له مستويين أولهما التكشيف الذي يتم فيه إستخراج الكلمات المفتاحية ثم يتم الإنتقال إلى المستوى الثاني الذي يتم فيه تلخيص الوحدات التي تجمع الكلمات المفتاحية وهذا ما يعرف بالإستخلاص (العناسوة، 2013. ص.290)، تنتقل هذه العمليات بعد التدقيق إلى الملفات الإستنادية والمكانز لتغذي هذه الأدوات.
2.2.2. أليات عمل أدوات اللغات التوثيقية في عملية البحث
إختيار الكلمات المفتاحية التي هي وحدة لغوية صغيرة تعتبر هي مستند الجمل المستخدمة في عملية الإسترجاع والتي تسمى في التخصص بالواصفات أو المداخل، عند الفرنسيين les vedettes أو les entrée أو عند الأنجلو فونيين subject heading ، وفي عملية الإسترجاع غالبا تبدأ الآلة باستبعاد الزوائد التي هي حروف العطف وأدوات النصب والجرّ، ثم يتم إستدعاء نظام البحث لمسح كل المصطلحات مع العلم أن الأفعال لا تستخدم في معادلات البحث فالعملية أذن تمر بتحويل الأفعال إلى أسماء (جامعة الدول العربية، 2015. ص.6)، فالكلمات المفتاحية التي تستخدمها هذه الأدوات هي :
-
صفة وموصوف
-
مضاف ومضاف إليه
-
كلمة واحدة
-
جملة مركبة إصطلاحيا أو برابطة
-
النحت
وبالتالي فإن البحث باستخدام هذه الأدوات في الحقيقة يستخدم تقنيات محددة من اللغة وليس كلها وبالتالي تكون المصطلحات هنا قليلة الترادف، أما التقنيات الأخرى فهي من تخصص أدوات أخرى مثل الأنطولوجيا أو خرائط المعرفة Ontologies التي هي من أدوات الويب 2.0 وابتكار تيم برنارد لي في 2004، والفالكسونومي Folksonomie التي توخذ منها الكلمات التي مصدرها المستعملين للويب أو دفع الملقمات RSS ((شاشة، 2014. ص. 87-107) وولوج الويب الدلالي الذي يوظف لغات برمجة أكثر تطورا XML (extensible markup language) ولغة أنطولوجيا الويب OWL وغيرها، بالإضافة إلى التكشيف الاجتماعي وغيرها من المراصد التي تنمي ثروة الكلمات المفتاحية التي هي أساس البحث العلمي في الويب.
بعد هذا الشرح الوجيز لبعض التقنيات، يمكن عرض أهم الأدوات التي توفرها اللغات التوثيقية للباحثين الأكاديميين والتي يمكن عرضها في جدولين ثم تقديم بعض الشروحات التطبيقية لكيفية عملها:
الجدول 1: نماذج لبعض أشهر المكانز
المكنز |
اللغة والمجال |
الطفولة |
عربي مختص في الطفولة وشؤون الأسرة |
الفولكلور |
عربي مختص في العادات والتقاليد والتاريخ |
اليونسكو |
متعدد اللغات مجاله التربية والثقافة والعلوم |
AGROVOC |
متعدد اللغات مصطلحاته متخصصة في التغذية والفلاحة |
ERIC |
متعدد اللغات مجاله العلوم التطبيقية |
MOTBIS |
فرنسي متعدد التخصصات مكنز عالمي |
TERmSciences |
متعدد اللغات والتخصصات مكنز عالمي |
Webster |
إنجليزي متخصص في اللغات والمعاني |
Oxford |
إنجليزي متخصص في الدلالات والمعاني |
إلى جانب هذه الأدوات يمكن ذكر قوائم رؤوس الموضوعات التي هي أدوات لا تقل أهمية عن سابقتها وتقدم حلولا دقيقة للترادف الكثير الحدوث في المجالات التقنية:
جدول 2: نموذج لقوائم رؤوس الموضوعات
القائمة |
اللغة والمجال |
قائمة رؤوس الموضوعات العربية/ شعبان عبد العزيز خليفة |
عربية / متعددة التخصصات |
قائمة رؤوس الموضوعات القياسية/ اليونسكو |
عربية / متعددة التخصصات |
قائمة إبراهيم الخازندار |
عربية / متعددة التخصصات |
RAMEAU |
فرنسية / متعددة التخصصات ومن أكبر القوائم الفرونكفونية |
LCSH |
إنجليزية / أكبر قائمة في العالم لمكتبة الكونقرس |
Mesh |
إنجليزية / أكبر قائمة العلوم الطبية |
RVM |
فرنسية/ إنجليزية/ ترجمة لقائمة جامعة Laval |
هذه القوائم طبعا هي أدوات عمل وليست للقراءة لكونها ضخمة واستعمالها تقني محدد للتكشيف واختيار الكلمات المفتاحية التي تستخدمها أدوات البحث في الويب.
3.2. شرح تطبيقي للمقاربة باللغات التوثيقية في معالجة الترادف اللغوي
سيتم عرض بعض الأدوات التي تمكن من ضبط الترادف اللغوي بالنسبة للغة العربية مع تقديم حلولا أخرى لدينا الأدوات الموالية التي توفرها تكنولوجيا المعلومات : المعاني وهو معجم في شكل إلكتروني يحتوي على خدمات عديد فهو مزود بخدمة ترجمة وقواميس متعددة ومعجم مترادفات التي تهم الباحث في حالات الصعوبات اللغوية، فيجب في أول الأمر الولوج إلى موقع هذا القاموس : www.almaany.comعلى الباحث إلا النقر على إيقونة المرادفات والأضداد ثم كتابة كلمة البحث على مساحة البحث فتظهر كل المرادفات المناسبة وبالتالي ما على الباحث إلا إختيار المصطلح المناسب للمعنى الذي يريده وتسجيله، ثم الخروج من الموقع للدخول إلى محرك البحث google مثلا ويكتب الكلمة المفتاحية المسجلة بطريقة مقننة وسيلاحظ الباحث أن النتائج ستكون أدق بكثير.
من الأدوات المساعدة أيضا لدينا : مكنز اليونسكو الذي يمكن استخدامه في عملية البحث بنفس الطريقة تقريبا وهو على الموقع www.unesdoc.unesco.org والشكل أسفله يوضح الفكرة : الشكل (3) : مكنز اليونسكو
من الأدوات المناسبة والمساعدة للتقليل من الكلمات المفتاحية لدينا قائمة رؤوس الموضوعات العربية التي يمكن تقديم شرح وجيز لها (خليفة، شعبان، 2001) : تأخذ القائمة الشكل الموالي يكون فيه الدخل في أول الصفحة وهذه المداخل الأساسية تكون مرتبة ألفبائيا، ونلاحظ المصطلحات التي ترد تحت عبارة أنظر أيضا التي هي إحالة توجيه تبين للباحث أو القائم بعملية التكشيف الكلمات المفتاحية المناسبة للبحث في هذا المبحث، وبالتالي يتوضح هنا أن عدد المصطلحات الممكنة محدودة وفي حدود الترادف المسموح به وعند إختيار الكلمات من هذه الأداة يكون الباحث على يقين بأن كل المصطلحات المناسبة لبحثه موجودة عنده. والشكل (4) و(5)يوضح الفكرة.
خاتمة
عملية البحث عن المعلومات باللغة العربية تصادفها مشاكل لغوية ناتجة عن الترادف اللغوي، لكن هذا الترادف ليس بالصعوبة البالغة التي لا يمكن تجاوزها لوجود أدوات متخصصة تساعد الباحثين عن المعلومات في تحديد كلمات مفتاحية دقيقة من بين هذه الأدوات المكانز وقوائم رؤوس الموضوعات والأنطولوجيا والفولكسونومي وغيرها، لكن كل ما في الأمر أن البحث والتنقيب عن المعلومات في عصر التكنولوجيا لا يمكن أن يتم بالصدفة بل بالعكس يحتاج إلى تكوين وتقنيات تساعد على الإبحار في عالم تضخم المعلومات الكم الهائل المتراكم لها، لكن علينا الإعتراف أن الأدوات العربية لحد الآن لا تماثل الأدوات الأجنبية ولهاذا يجب على الباحث أن يكون ذكيا في عمله وفي ما يلي بعض الإضافات تزيد من فاعليت البحث في الويب :
-
الكلمات المفتاحية تعمل بعدة لغات وبالتالي على الباحث إكتساب مهارات اللغة
-
الترجمة خدمة قد تقلل من الترادف وتزيد من مستوى المعلومات
-
يجب على الباحث تجريب الكلمات بصفة دائمة لتعلم الإختلافات المسجلة بين المصطلحات
-
المصطلحات في تغير مستمر حسب البيئة واللغة والتخصص
-
كل الباحثين مهما بلغ مستواهم يحتاجون إلى تعلم اللغة وإتقانها وخاصة المشتغلون على إستراتيجيات البحث الوثائقي من مهندسين في الإعلام الآلي والمختصين في المعلومات، فلا يمكن تطوير اللغة من قبل من يجهل خباياها
-
تطوير البحث العلمي وتقنياته يحتاج تكاثف جهود الجميع بمعني العمل التشاركي.