+91 98 999 407 04
aqlamalhind@gmail.com

القائمة‎

المعالجة الآلية للغة و تطوير البرمجيات والنظم الإلكترونية في ضوء الدرس اللساني الحاسوبي
أد. جميلة روقـــاب أد. محمد حاج هنّي

   

المعالجة الآلية للغة و تطوير البرمجيات والنظم الإلكترونية في ضوء

الدرس اللساني الحاسوبي

 

أد. جميلة روقـــاب    أد. محمد حاج هنّي

قسم اللغة العربية/كلية الآداب الفنون/جامعة الشلف/ الجزائر

d.rougab@univ-chlef.dz

m.hadjhenni@univ-chlef.dz

 

الملخص:

                 تهدف هذه الورقة البحثية إلى تعرف مفهوم المعالجة الآلية للغة ووظائف النظم التقنية والبرامج الحاسوبية لمسح وتشفير وأرشفة الوثائق والنصوص، وأزمة المدقق الإملائي اللغوي- النحوي- الالكتروني، ومعالجة مشكلات المكتبات الرقمية، مع عرض موجز لبعض البرامج الحاسوبية المعتمدة في المكتبة الالكترونية لجامعة الشلف على غرار برنامج سانجاب والأوباك، والتطرق لمحركات البحث العربية والحاضنات التكنولوجية والبنك السعودي للأصوات وأهم النظم التكنولوجية المعتمدة في مجال الترجمة الآلية في ظل الدرس اللساني الحاسوبي؛ حتى يتمكن الطالب من تجاوز الصعوبات المنهجية وإثراء رصيده المعرفي بمادة جديدة في كلّ مرحلة من مراحل التطور في هذا الحقل اللساني المختص، من أجل التدريب والتعوّد على استعمال الحاسوب والتدرّج به إلى اكتساب مهارة التعامل مع النصوص الترابطية الرقمية وكيفية معالجتها في مرحلة التعليم العالي ومرحلة ما بعد التدرج لإعداد أطاريحهم الأكاديمية العلمية المتميزة.

الكلمات المفتاحية:اللسانيات الحاسوبية؛ المعالجة الآلية، النصوص؛ نظام (OCR)؛ برنامج  سانجاب.

 

 

 

 

 

مقدمة:

          أحدثت النظم والبرامج الحاسوبية انقلابا حقيقيا في علاقة الإنسان بالتكنولوجيا، وعزّزت حاجة المجتمع إلى اعتماد اقتصاد المعرفة لتجاوز اختلالات التطوّر والتنمية وسدّ الفجوة  الرقمية في المعالجة الآلية للغة في ظل اللسانيات الحاسوبية.

                وأعادت هذه النظم والبرامج النظر في معايير القوّة الحقيقية للمعالجة الآلية للغات، إذ لم تعد اللسانيات الحاسوبية درسا يؤسس على مناهج بسيطة محددة، تنطلق من التحليل الآلي للغات الطبيعية على المستويات الصرفية والنحوية والدلالية، بل أصبحت رهانا لتطوّر اللغات والتعليم والإنتاج العلمي والإبداع التكنولوجي. ولمواكبة تطوّر تطبيقات المعالجة الآلية للغات التي نستعملها نحن البشر، صمّمت برامج ونظم محوسبة جديدة وضخمة لتقطيع الجمل، وتحليل النصوص واسترجاعها وتخزينها، وكذا البحث عن المعلومات، دون أن ننسى المدقق الإملائي، والتلخيص الآلي للوثائق والمخطوطات، فضلا عن الترجمة الآلية وصناعة المعاجم الالكترونية وحوسبة المكتبات الجامعية على غرار المكتبة الرقمية لجامعتنا بالشلف.

                وتروم هذه الورقة البحثية الإجابة عن الإشكالية التالية: إلى أين وصلت المعالجة الآلية للغات في ظل اللسانيات الحاسوبية اليوم؟ وما هي النظم  التقنية والبرامج الحاسوبية  التي أفرزها هذا الحقل العلمي المتخصص؟وما مناهج هندستها  باستعمال الروابط النصية (hyper text links) ؟

  • مفهوم المعالجة الآلية للغة:

                 ونعني بها توطين آليات المعرفة التقنية في الحاسوب من أجل تيسير إدخال المعرفة واسترجاعها، ويمكن تلخيص هذا فيما يسمّى بالذكاء الاصطناعي الذي هو علم تطويع الآلة لتحاكي الذكاء البشري[1].

                وجدير بالتنبه أنّ المختصين في مجال البرمجيات واللسانيات الحاسوبية تكفلوا ولا يزالون بتصميم البرامج الخاصة بمستويات اللغة العربية الصوتية، والصرفية، والتركيبية والدلالية، والبرامج الحاسوبية، فما المراد بها في ظل المعالجة الآلية للغات؟ وما أنواعها ؟ وأهمّ خصائصها؟

  • البرامج الحاسوبية:

                “هي مجموعة التعليمات والبيانات التي توضع في القسم الالكتروني والتي يتّبعها لتنفيذ مهامه”[2]. إنّ تكييف البرمجيات الحرّة ذات المصدر المفتوح تطويعها للعربية أمر ميسّر ويسمح بزيادة القدرات المحلية في مجال البرمجيات، وينشر التقانات الحديثة دون القيود التي تضعها الدول المتقدمة، وباستخدام هذه البرمجيات المفتوحة المعربة يمكن نشر التطبيقات العربية على نطاق واسع في مجالات الحكومة الإلكترونية والتعلم والتعليم والتجارة الالكترونية وغيرها، ممّا يدفع بعجلة تطير اللغة العربية لخدمة مجالات هامة ذات طيف واسع ومتجدد[3].

  • سبل المعالجة الآلية للغة:

أ‌-        نظام OCR:

                 (‏Optical character recognition‏) هو التعرف الضوئي على الحروف، نوع من ‏البرمجيات الحاسوبية، يمكن تحويل صور النصوص المكتوبة باليد أو بآلة مثل الماسحة إلى ‏نصوص قابلة لتحرير، لذلك ‏ يُستخدم  هذا البرنامج كثيرا في الحياة اليومية، لأنه يمكن استخراج ‏النصوص من الصور أو ‏PDF‏ ممسوحة ضوئيا. ‏وربما لا يدعم اللغة العربية، لكن يوجد برنامج ‏ ‏ OCR يدعم اللغة العربية – بالإضافة إلى ذلك، هو يدعم تحويل ‏PDF‏ إلى نصوص قابلة ‏للتحرير. “وهو برنامج قاعدي ضروري تمتلكه كلّ لغة، يسمح بتحويل النصّ المصوّر بكاميرا أو ماسح ضوئي (scanner) إلى نصّ رقمي يمكن فتحه بناشر إلكتروني مثل word، وأرشفته كملف على الكمبيوتر،وبدونه يلزم من جديد إعادة طباعة كلّ ما كتب بالعربية على الكمبيوتر[4].

نظام TEI (Text Encoding Initiative ) :

                وهو نظام حاسوبي يعمل على تشفير الوثائق بدلا من مسحها كما هو في النظام السابق (OCR)، وضع هذا البرنامج كبديل لنظام UTF   من قبل  نظام ethosيعد(hypervisor (أو الجهاز الظاهري هو قطعة من البرمجيات التي تسمح أنظمة تشغيل متعددة لتشغيل في نفس الوقت جهاز الكمبيوتر. نكون أمام تطوير نظام جديد لتشغيل  النواة المستهدفة ونحن نضع خطة لأخلاقيات الهندسة المعمارية لا نريد التعامل مع كتابة برامج تشغيل الأجهزة، أنظمة الملفات، والربط الشبكي في هذه المرحلة المبكرة[5].

نظام ISSN : (International Standard Serial Number)

                إنّ الرقم الدولي الموحد للدوريات هو رمز من ثمانية أرقام يستخدم لتعريف الصحف والمجلات المتخصصة، والمجلات والدوريات أيّا كانت طبيعتها أو وسيط لنشرها، سواء أكانت مطبوعة أم الكترونية، ويعرف الرقم الدولي الموحد للدوريات جميع المصادر المتتابعة  من الصحف، المنشورات السنوية، المجلات المتخصصة، المجموعات، المواقع الالكترونية، قواعد البيانات، المدونات…إنّه نظام الرقم التسلسلي الدولي الموحّد للدعامات الالكترونية، يمكن تخصيص رقم تسلسلي دولي موحّد لكلّ المصادر الالكترونية، أقراص مدمجة، أقراص فيديو رقمية (دي في دي)، مواقع شبكية، ويجب أن تستوفي هذه المصادر حسب نوعها معايير محددة جدّا[6].

                يستعمل الرقم الدولي الموحد في ميدان التجارة الدولية للكتاب نظام الرقم الدولي الموحد للكتاب (ردمك) (ISBN)  International Standard Book Numberوالرقم الدولي الموحد للدوريات (ردمد) (ISSN) International Standard Serial Number  وذلك لتحديد هوية أيّ كتاب أو مجلة دون أيّ خطأ، هذه الأرقام تستعمل أيضا للأقراص المدمجة CDوDVD والمنشورات عبر الانترنيت مثل المجلات الالكترونية، مع العلم أنّ هذه الأرقام لم تصمّم للمنشورات الالكترونية، لكنّها تظلّ تحمل أرقام هذا النظام، كما تمّ اقتراح نظام محدد الكيان الرقمي –الالكتروني- DOI (Digital Object Identifier)، من طرف جمعية الناشرين الأمريكيين وشركة المبادرات البحثية الوطنية؛ وهو نظام تحديد هوية الكيانات في البيئة الرقمية، كما يمكن أن يرافق الرقم الدولي الموحّد للدوريات مثال: DOI.10.5120/ISSN.2258-2896[7] .

البرنامج الحاسوبي: UNICODE  الذي استعملته شركة ميكروسوفت منذ 2000م ، حيث بدأ استخدامه الفعلي مع ويندوز (Windows 2000)، وهو جدول يرمز لأكثر من 35 ألف حرف، مما يمكنه من تمثيل أغلب اللغات ومن بينها اللغة العربية، ويستخدم يونيكود  32 خانة ترميز، وبالتالي يمكن التعامل مع أكثر من لغتين في وقت واحد، ويتطابق تمثيلها العربي مع المواصفة العربية (ASMO449)[8]

البرمجيات الحاسوبية بالمكتبات الجامعية: (Opac/syngeb)

  • تعتمد المكتبة الجامعية الرقمية لجامعة الشلف – كما سبق الذكر- على برنامج سانجاب ولهذا البرنامج واجهتين هما:
  • الواجهة الخاصة بالإدارة: واجهة لا يطلع عليها إلاّ من يعمل بالمكتبة وحسب وهي التي تقوم على تزويد قاعدة البيانات بالكتب، إدخال وتحيين القوائم بما فيها قوائم الطلبة والباحثين المسجلين بالمكتبة
  • وعن هذه الواجهة المخصصة بالطلبة ما تزال في طور الإعداد والهيكلة لليوم
  • ومن نقائص برنامج سنجاب استعمال نسخ مجانية من البرنامج، أو بالأحرى اقتناء البرامج من الخارج، في ظل نقص الكفاءة البشرية المؤهلة لتطوير البرنامج ومعالجته

الواجهة الخاصة بالطلبة والباحثين

في حوار مباشر مع أحد المهندسين في الإعلام الآلي[9] العاملين بمكتبة جامعة الشلف، أكّد لنا أنّ المكتبات الجامعية بالجزائر يستخدم السواد الأعظم منها برمجية (SYNGEB )[10] هي الأكثر شيوعا، وتداولا مقارنة ببعض البرمجيات الأخرى على غرار برمجية (PMB)[11]

                ومما هو قمين بالذكر أنّ مركز الإعلام العلمي والتقني cerist ; وفي سنة 1990م قد طوّر هذا النظام؛ أي برمجية (SYNGEB)  على مستوى دائرة الجمع، المعالجة، والبث، ثمّ توالت الطبعات الأخرى وكانت آخرها سنة 2006م وهي طبعة الشبكة

                 ومن مميزات الطبعة القديمة لـ (SYNGEB) أنها لا تعمل في إطار الشبكة، وهي طبعة ذات واجهة بسيطة، حيث تمكن من إنشاء قاعدة بيانات حسب نوع الوثائق بخلاف طبعة الشبكة التي يتمّ فيها إنشاء قاعدة بيانات واحدة لكلّ أنواع الوثائق، هذا ولا تسمح بربط منطقي وتلقائي بين مختلف الوحدات (Modules)؛ فالبيانات المسجلة في وحدة الاقتناءات مثلا لا يمكن أن ترسل بصفة تلقائية إلى بقية الوحدات الأخرى. كما توفر كل وحدة في نسختين العربية واللغة الأجنبية عكس طبعة الشبكة التي تسمح بإدماج اللغتين في نفس الواجهة.

والنموذج أسفله يبيّن واجهة البحث البيبليوغرافي للطبعة القديمة لـ SYNGEB

                تسمح شاشة البحث للطبعة القديمة SYNGEB البحث في حقول عدة من ضمنها: حقل المؤلف، والعنوان، والكلمات الدالة، الناشر، والشفرة أو ما يسمّى بالرقم الاستدلالي، كما يمكن القارئ البحث باللغة عن طريق اختيارها من قائمة تضمّ العديد من اللغات، فتوفر بذلك هذه الشاشة البحث بالرابطين البوليين “و” و” أو” والبحث الجزئي. وبخصوص شاشة العرض فإنّها تعرض  نتائج البحث في تركيبة واحدة وهي تركيبة العرض العام حيث لا تسمح بالإبحار أو بمواصلة البحث من خلالها كما هو مثبت في النموذج .

                أما بالنسبة لواجهة عرض النتائج فتفدم مجموعة من العناوين المتطابقة مع الكلمة التي تم البحث بها. يمكن أن نقوم بفرز بالمؤلف، تاريخ النشر أو العنوان كما يمكن أن نقوم بتقييد بنوع الوثيقة وحفظ نتائج البحث.

        يمكن من خلال هذه الواجهة معرفة قائمة المقتنيات الجديدة تسمح هذه الواجهة باختيار ثلاث مستويات للبحث و هي البحث الأساسي، البحث التفصيلي و البحث المتقدم.

بعد النقر على أحد العناوين نتحصل على التسجيلة الكاملة و التي يمكن من خلالها الإبحار عن طريق الروابط الفائقة و التقدم في عملية البحث بالنقر على الواصفة و التي تحيلنا إلى التسجيلات التي تحتوي على نفس الواصفات كما أن النقر على المؤلف سيحيلنا إلى مؤلفاته أماحين النقر على العنوان فسنتحصل على كشاف العناوين.

وقد وصف مصمّمو نظام SYNGEB الطبعة الأخيرة لبرمجيتهم بما يلي:

  • برمجية كاملة تسمح بتسيير كافة أنواع الوثائق (كتب، دوريات، أطروحات، مقالات ومواد غير الكتب)
  • تسمح بالتسيير السريع والفعال لكل الوثائق
  • يتماشى ومتطلبات التقنيتين المعمول بها: ISBD;UNIMARC
  • تسمح بتسيير السلسلة الوثائقية لكلّ أنواع المكتبات (مكتبات جامعية، مكتبات المتاحف، مراكز التوثيق…الخ)[12].

                هناك ثلاثة أسباب تدفع إلى اختيار برمجية SYNGEB حسب مصمميه، وهذا ما شرح لنا أحد المهندسين بالمكتبة الجامعية موضحا التالي:

الحميمية convivialité؛ إذ يعمل  (SYNGEB) في محيط WINDOWS، وهو ثنائي اللغة- وهذا ما يعزز المحتوى الرقمي العربي- هناك واجهات حميمية ( كالقوائم، واجهات البحث،  الخ)، يتيح هذا النظام الفهرس بطرق بحث مختلفة بسيطة ومتقدمة، ويمكنه عرض التسجيلات بثلاث تركيبات ((ISBD-UNIMAR ومفصّلة.

                كما أشار المهندس إلى مزايا أخرى للبرمجية على غرار القوّة (Puissance)؛ لأنّها تتماشى مع احتياجات المكتبات الصغيرة والكبيرة، فضلا عن مرونته الكبيرة في تصميم القواعد (الكتب والدوريات والأطاريح العلمية وغيرها مما تتوافر عليه المكتبات.

وبيّن المتحدث أنّها برمجية توفر كل الوظائف التي توفرها النظم الكبيرة وبأسعار متواضعة، وأكّد في الأخير أنّ واجهة واب (Interface Web) تسح البرمجية بإتاحة الفهرس عبر الشابكة[13] (الأنترنت)

التدقيق النحوي الآلي:

                هو نظام الإعراب الآلي للجمل العربية واحد من التطبيقات الرئيسية للحاق اللغة العربية بالجيل الثاني من تطبيقات معالجة اللغات الإنسانية، التي تتضمن نظم الفهم الآلي وتحليل بنية السرد المستمر للغات.

الترجمة الآلية  :       (Machine Aided translation)

     لها عدّة تسميات على غرار: الترجمة الميكانيكية (Mechanical Translation) وهي الأقدم، والترجمة الأوتوماتيكية (Automatic Translation)، أو الترجمة بمساعدة الحاسوب (Computer Aided translation) فهي تمثل نوعا من أنواع الترجمة المستحدثة حيث يقوم برنامج جهاز الكمبيوتر بتحليل النصوص المصدر ومن ثم محاولة إنتاج نصوص أخرى موازية لها في اللغة الهدف، بدون أن يتدخّل المترجم في عملية الترجمة.ويراد بها جميع التقنيات والنظم الهادفة أتمتة (Automatize)[14]) عملية الترجمة ؛ ومعناه جعل العملية آلية سواء كان جوهر هذه الأخيرة منجزا آليّا أو عن طريق المترجم (الإنسان).

                فاختصارا قيل الترجمة الآلية، ومع اتساع دائرة الشابكة العالمية للمعلومات (internet)، ارتقت اتجاهات الترجمة الآلية الحالية والمستقبلية القائمة على تقديم خدماتها عبر هذه الشابكة وعن بعد[15]؛ لأنّ المهام الرئيسية في هندسة نظم الترجمة الآلية تتوزع على حدّ سواء بين المعلوماتيين والالكترونيين من جهة، واللسانيين والمترجمين من جهة أخرى.

                من حسناتها اختصار الوقت والجهد والسماح بمواكبة روح العصر، غير أنّ “الترجمة الناجحة تتطلب أيضا دراسات مقارنة في خصائص اللغات المترجم منها وإليها، وبرامج محوسبة قادرة على التصفح الآلي للنصوص المكتوبة أو المقروءة ومكنزا محوسبا تستقي منه مادة مفرداتها وتراكيبها ومصطلحاتها وأساليبها المجازية بما يتفق والنتائج العلمية التي يتوصل إليها الدارسون؛ الأمر الذي سيفيد في إغناء عملية الترجمة وسينتج مترجمات يتوفر لها نصيب كبير من سلامة المضمون واللغة[16].

  • البنك السعودي للأصوات نموذج تطوير قواعد بيانات لمعالجة اللغة العربية:

                                يعمل هذا البنك على تطوير قاعدة بيانات لمعالجة اللغة العربية آليا منها تطوير نظام حاسوبي للقراءة الآلية، وإخراج النصوص المكتوبة بشكل صوتي، وما يشفع لهذا البنك الآلي العربي أنّه يحتوي على نظام تكنولوجي لوضع علامات التشكيل على الحروف[17]– وهذا لا محالة سيساعد المحقق والمفهرس في عملية التحقيق المرقمن- وغير ذلك. أضف إليه مشروع مكتبة الملك فهد الوطنية في رقمنة المخطوطات، كما أنشأت دولة الإمارات العربية المتحدة مدينة عالمية للإنترنيت، فضلا عن هذا يوجد مركز الماجد بالإمارات وهو مركز تكنولوجي عربي له جهود طيبة في حوسبة المخطوطات العربية والإسلامية، لكن هذه الجهود البشرية والمشاريع التقنية على تنوّعها ما يؤخذ عليها أنّها تبقى مجرّد جهود وأعمال مبعثرة.

ج- الحاضنات التكنولوجية:

                                هي الأخرى من المشاريع العربية الضخمة التي تسعى بدورها إلى فكّ العجز التقني الذي تعانيه لغتنا العربية مجسّدا في عدم وجود ماسحات ضوئية جيّدة – باستثناء نظام ( OCR) الذي سبق الحديث عنه- تسمح بتحويل النصوص والمخطوطات المصوّرة بكاميرات أو ماسحات ضوئية ما يصطلح عليها بـ:( scanner) إلى نصوص رقمية يمكن فتحها بناشر إلكتروني، مع العلم أنّ العديد من لغات العالم بحوزتها هكذا أجهزة تقنية عالية الجودة، والتي تسمح في دقائق وبشكل آلي كامل فتح الكتاب أو المخطوط وتصويره صفحة صفحة وتمرير القارئ الضوئي الآلي عليه لتحويله إلى نص مرقمن قبل أرشفته وزجّه في الفضاء الكوني ليصل العالم في لمحة بصر[18].

                بدأت منذ عام (2003م) في بلدان الوطن العربي مبادرة المحتوى الرقمي العربي  من خلال إطلاق مشروع  تعزيز صناعة المحتوى الرقمي العربي عن طريق ما يعرف بالحاضنات التكنولوجية التي أطلقت عام (2007م)، إضافة إلى جهود مجموعة اللغة العربية الرقمية في مجال الذكاء الاصطناعي بإشراف محمد زايد بالمغرب، إذ تتبنّى هذه المجموعة البحث في إنشاء المعجم الموحّد للتقنيات الحديثة باللغة العربية[19]، وهذا المحتوى الرقمي العربي يأتي في عدّة أشكال تشمل كلّ ما هو مكتوب بحروف عربية على الشابكة الالكترونية، أو مسجل بأصوات عربية، وحتّى المصوّر بشكل يستدلّ به على مصدره العربي من نصوص، وأشرطة فيديو، وصور وبرامج تلفزيونية وأخرى إذاعية وغيرها.

                                وتأسيسا على ما سبق ذكره، لابدّ من تدريب الكوادر البشرية على هذه الأعمال التكنولوجية الرقمية والهندسية الدقيقة التي قد تستغرق منّا زمنا وجهدا كبيرين للنهوض بتراثنا العربي وإعادة إحيائه بروح العصر الذي نعيشه عن طريق خلق العديد من محركات البحث العربية[20] ، التي تهتم بنشر الكتب التراثية والمخطوطات المحققة والمفهرسة آليا.

البرنامج الرقمي العربي: (Digital Arabic Content

                يهدف هذا البرنامج إلى سد الفجوة بين عدد متحدثي اللغة العربية، وبين توافر المحتوى الرقمي باللغة العربية (Digital Arabic Contentيعبر مفهوم هذا الأخير عن مجموعة من تطبيقات تعالج وتخزن وتعرض المعلومات باللغة العربية، والبرمجيات لإعداد تطبيقات تتلاءم مع اللغة العربية الكترونيا ويشمل المحتوى كل معلومة متوافرة باللغة العربية بصيغة رقمية؛ أي كل ما يتم تداوله رقمياً من معلومات مقروءة، أو مرئية، أو مسموعة. وتنشأ أهميته من عاملين:  أولهما نشر وسرعة الوصول، ومدى الانتقال إلى المتلقي، وثانيهما: كثافة المحتوى الرقمي الذي أصبح من أهم عوامل التعبير عن الثقافة والحضارة على الصعيد العالمي[21]

                حيث قام بتأسيس البرنامج كل من شركة يملي(Yamli ) إذ يعتبر حبيب حداد مؤسسها الفعلي،  ويسمح هذا البرنامج الرقمي  بتحويل الأحرف الإنجليزيّة إلى كلمات عربيّة لتسهيل الطباعة بالعربية؛ ويشرح حبيب حدّاد فيقول:”لطالما شعرت بالإحباط في عدم وجود لوحة مفاتيح عربية وكلّما حاولت ايجاد أخبار عربيّة على الشابكة، فمثل الملايين من المستعملين أجد سهولة كبرى في التعبير عن كلمات عربيّة باستعمال الأحرف الإنجليزيّة، ولكنني أجد صعوبة في طبعها؛ فبدت لي أن الحاجة لتقنيّة تحوّل اللفظات الصوتيّة هذه بشكل فعّال إلى كلمات عربيّة ضرورية، يجدر أن تكون هذه التقنيّة، سلسة بحيث يطبع المستعلون الكلمات العربية وينسون بأنّهم يستعملون الأحرف الإنجليزيّة[22].

                هكذا ولد  هذا البرنامج المحوسب حيث يحوّل  (Yamli) ما يمليه المستخدم بالأحرف الإنكليزية إلى كلمات عربيّة، ومن أجل دفع الاستعماليّة إلى أعلى حدّ يقبل عددا من اللفظات الصوتيّة المختلفة، ويقترح مجموعة من الكلمات الملائمة مع الوقت، كما يتعرّف برنامج (Yamli )على الأنماط الشعبية والألفاظ الأكثر شيوعا مما يزيد من دقّته.ويبدي أحد المؤسسين وهو عماد جريديني رأيه على أنّ الشبكة العربيّة تقلع بشكل حقيقي عندما يصبح المستعملون قادرون على إيجاد المعلومات العربيّة وكتابتها بسهولة فيما هناك عدد من التطبيقات لتقنيّتنا هذه، ارتأينا الاستجابة لهاتين الحاجتين الأساسيّتين بشكل حالي، هذا وتتضمّن النسخة الأولى من (Yamli Editor ) يسمح (Yamli Search  ) للمستعلين بالبحث على الإنترنت من خلال محرك البحث جوجل(google) فيستطيع مستعملو الشابكة الالكترونية البحث في مضمون الويب، من فيديوهات، وصور وأخبار ومدوّنات إلكترونية أمّا (Yamli Editor) فيسمح للمستعلين بكتابة نص عربي يمكن نقله إلى أي وسيط الكتروني[23].

                         وعطفا على ما سبق ذكره، نلفي النصوص الرقمية( النصوص الترابطية) ضرورية في الترجمة فهي متوالية حسب نظام منطقي، أو أن تعبر عن علاقات ثنائية بين وحدات؛ أي علاقات غير تراتبية، حيث تتيح الوسيلة الالكترونية تعايشا ضمن نص واحد بين التفكير التراتبي والتفكير التشابكي؛ فالنص الرقمي لا يعني كتابة الكترونية على مساحات أي مع وحدات مزودة بهوية في الفضاء، فشبكات النص الرقمي يمكن أن تمتد نظريا إلى ما لا نهاية[24]وهذا عمل لا يأتيه إلاّ أهل الاختصاص في هذا المجال الحاسوبي.

ج- محركات البحث العربية:

                توجد محركات بحث عربية قامت بهندستها العديد من الدول أكثرها عربية، وهي بمسيس الحاجة إلى إعادة تأهيل لتناسب اللغة العربية؛ لأنها استندت إلى أساليب البحث المصمّمة للغة الإنجليزية التي تختلف  بطبيعة الحال اختلافا جذريّا فيما يخص بنية الكلمة العربية ذات الطابع الاشتقاقي والتصريفي، ومن أشهر هذه المحركات: (مكتوب)  وهو محرك بحث عربي أنتجه المملكة الهاشمية الأردنية، (أبحث) لدولة تونس، صخر، وعجيب، وإسلام أون لاين، والوراق، والفصيح والمسبار، والمصطفى، ومكتبة الإسكندرية والمعرفة… وغيرها عملت المملكة العربية السعودية– على سبيل المثال- تحديدا مدينة الملك عبد العزيز للعلوم والتقنية على إثراء المحتوى العربي المفتوح، وقد وقعّت هذه الأخيرة اتفاقية مع البرنامج الإنمائي للأمم المتحدة((UNDP)  لإنشاء برنامج وطني لهذه التقنيات، وفي مجال إدارة المحتوى العلمي تعمل المدينة على مشروع توثيق الإنتاج الفكري الوطني إلكتروني.

                 كما عمل معهد بحوث الحاسبات بالمدينة فقد كرس عددا كبيرا من أعماله لتطوير قاعدة بيانات لمعالجة اللغة العربية منها على سبيل المثال (البنك السعودي للأصوات) كما تم تطوير نظام حاسوبي للقراءة الآلية وإخراج النصوص المكتوب بشكل صوتي، كما قام بنظام آلي لوضع علامات التشكيل على الحروف، وغير ذلك،وكذلك مشروع مكتبة الملك فهد الوطنية في رقمنة المخطوطات[25]،كما أنشأت دولة الإمارات العربية المتحدة مدينة عالمية للإنترنت وكذلك مركز الماجد بالإمارات الذي له جهود طيبة في حوسبة المخطوطات العربية، وجهود أخرى كثيرة في عالمنا العربي،ويؤخذ على هذه الجهود أنها مبعثرة[26].

د- تجربة المدقق الإملائي العربي الحر مشروع قيد الإنجاز:

                وجد مستعملو البرامج المكتبية الحرة في مجموعة أوبن أوفيس (Open Office)، ك-أوفيس إو جنوم-أوفيس ( K-Génome office)ضالتهم عندما يرغبون في تحرير نصوصهم، أو جدولة حساباتهم، وتدبير قواعد بياناتهم، ووضع رسوم أو تصميم عروض …الخ هذه البرامج تدعم في مجملها وبشكل لا بأس به اللغة العربية إلا أنها تفتقر إلى مدقق إملائي وظيفي يدعم لغة القرآن، كان هذا المشروع بمساهمة ثلة من محبي البرامج الحرة والغيورين على لغة الضاد، انطلق في تأسيس مشروع أيسبل(Aspell)[27]  الذي يهدف إلى إنشاء قاموس عربي للتدقيق الإملائي وتطوير الوظائف البرمجية تعالج رقمياً خصوصيات اللغة العربية الاشتقاقية، حيث يعتمد المشروع على خوارزم البرنامج الحر هانسبل( Hunspell) الذي يظهر تلاؤما مع خصائص اللغة العربية أفضل من الذي يقدمه أسبل( Aspell) المدقق الإملائي الحر الآخر[28].

                إن تفريغ قاموس اللغة العربية ومعالجته الكترونيا هو بالفعل عمل شاقّ جدّا قد يستغرق الكثير من الوقت؛ ولكنه لا يتطلب قدرة على البرمجة مما يجعل المشروع رهن إشارة كل شخص على علم ببعض القواعد الأساسية للغة العربية في المستوى الابتدائي والإعدادي، مثال: في الجزء الخاص بالأفعال من المشروع علينا تصنيف أكثر من (10.000)، فعل حسب لزوميتها المطلقة والنسبية وتعديها إلى مفعول به واحد غير عاقل أو عاقل أو إلى مفعولين اثنين، ثمّ تصنيف يستند طبعاً على تفسير معنى الفعل وشرحه المعجمي وفي هذا-وفي تصريف الأسماء لاحقا- نحتاج ليد المساعدة[29] على غرار: أسماء النطاقات العربية النوعية تتألف رموزها العلوية النوعية في النظام …من ثلاثة محارف متتابعة أو أكثر معتمدة قياسيّا، مثلا الرمز اللاتيني الاسمي هيئة إعلامية  لكلمة إعلان (خبر) خ يقابلها الرمز (Info) [30]لذا يستحيل للقاموس العربي التواجد بالكيفية التي ينبغي أن يتواجد بها في عالم رقمي يناشد توفير كلّ ما نحتاجه في القواميس والمعاجم اللغوية.

                وتأسيسا على ما سبق تسعى بعض الجهات المعنية بحوسبة المعجم العربي مقارنة بنظيراتها الغربية على تجاوز العديد من الإشكالات التي تتصارع معها مثل هكذا مشاريع رقمية تنموية عربية على غرار جمعية الهندسة اللغوية، والشركة الهندسية لتطوير أنظمة الحاسب بجامعة عمان، ومحمد الخامس، وجامعة لبنان والشركة العالمية صخر.

قاموس صخر الالكتروني:

                                يحتاج الباحث إلى القاموس الالكتروني نظرا لسهولة البحث فيه وسرعة الوصول إلى المداخل المعجمية، وهذه كلها خصائص قد لا توفرها القواميس الورقية، فما هي هذه الخصائص المحققة لدى قاموس صخر الالكتروني؟

                                قاموس صخر المحوسب (الالكتروني ) عبارة عن قاموس تفاعلي يجعل المتعلم/أو الباحث يلج إلى تطبيقاته العلمية، ويتعامل معها ويستفيذ منها من خلال الحاسوب، وعبر خطوط مبرمجة، وهو عبارة عن قاموس ثنائي اللغة، (عربي –انجليزي) استمد مادته المعجمية من عدّة معاجم هي: المزهر للسيوطي، والمحيط للفيروزآبادي، ولسان العرب لابن منظور، والعين للفراهيدي، وبالنسبة للإنجليزية فقد استفاد من قاموس أوكسفورد (0ED) وقاموس (thesaurus) وقاموس إلى جانب قاموس (Alphabetical plan of dictionary).

وبعد تشغيل القاموس وتثبيته على الحاسوب تظهر الشاشة الافتتاحية تتبعها شاشة البرنامج التي تتضمن أيقونات عديدة هي[31]

خيارات

نطق

طباعة

مساعدة

نبذة عن القاموس

خروج

كاميرا.

       خاتمة:

                إنّ الاهتمام بالدرس اللساني الحاسوبي في ضوء مناهج المعالجة الآلية  والنظم التقنية والبرامج الحاسوبية لهو من صميم الدفاع عن اللغة العربية في عصر تكنولوجيا الإعلام والاتصال يؤهل اللغة العربية لتحقيق أقصى إمكانيات القدرة على معالجة القضايا والمشكلات الرقمية؛ لأنّ مفهوم الأمية اليوم صار مرتبطا أشدّ الارتباط بعدم معرفة استعمال الحاسوب والانترنيت والمعلوماتية ورقمنة الكتب والمكتبات العامة والجامعية، وهذا ما شكلّ تحديّا جديدا أمام الدرس اللساني الحاسوبي العربي على وجه الخصوص.

الهوامش:

[1] معجم الحاسبات، مجمع اللغة العربية، مصر، ط2، 1995م، ص:12.

[2] – أنطوان بطرس، موسوعة الكمبيوتر، مكتبة لبنان، بيروت، ط1، 1991م، ص:11.

[3] – ينظر: منصور فرح، الفجوة الرقمية في المجتمعات العربية وأثرها على اللغة العربية، مجلة المجمع الجزائري للغة العربية، العدد6، ص:107

[4] – حبيب عبد الله سروري، اللغة العربية في مهب العولمة مشروع إنهاض، مركز الجزيرة للدراسات، 2009م، على الرابط: http//www.aljazeera.net/NR/exeres/DCED6-0694-4c2C

[5] – Satya Popuri Graduate Student University of Illinois at Chicago Chicago, IL 60607  spopur2 [at] uic [dot] edu

[6] -http://www.issn.org/understanding-the-issn/what-is-an-issn/

[7] – صديق بسو، النشر الالكتروني واللغة العربية، ندوة المحتوى الرقمي باللغة العربية النشر الالكتروني، منشورات المجلس الأعلى للغة العربية، الجزائر، ط2014، ص: 8، 9.

[8] – عباس مصطفى صادق، المعوق التكنولوجي للوجود العربي في الانترنيت، الشرق الأوسط، العدد39، أوت 2003م، على الرابط:

http://www.aawsat.com/details.asp

[9] – حوار مع أحد مهندسي الإعلام الآلي بالمكتبة( شريف)، 27جوان 2018 في حدود العاشرة صباحا

[10] – برمجية SYNGEB (système nationalisé de gestion de bibliothèque)  أو ما يصطلح عليه بالنظام المقيّس للتسيير الآلي للمكتبات.

[11] – تمّ إنشاء هذه البرمجية من طرف المكتبي الفرنسي François  Lemarchand، يتمّ حاليّا تطويرها وصيانتها وتمويلها من قبل شركة PMB Service. الاسم الكامل للبرمجية هو PhpMyBibli ويطلق عليها أيضا تسمية Pour Ma Bibliothèque

Voir :Evaluation de quelques logiciels libres destinés aux professionnels de l’information. (en ligne) Mise à jour 1-4-2008 (document consulté le 18-03-2008) disponible à l’adresse : http://bibliodoc.francophonie. Org/article=133

[12] Centre de recherche sur l’information scientifique et technique, système normalisé de gestion de bibliothèque-SYNGEB :version réseau- :Manuel d’utilisation(Version2007)Alger : cerist 2007,p :5.

[13] [13] – voir :centre de Recherche sur L’information scientifique et Technique Système Normalisé de Gestion de Bibliothèque( en ligne) document consulté le :18-03-08 disponible à l’adresse : http://193,194,91,202/index.php? page=pressyn .htm

[14] –    الكلمة معربة من الفعل الانجليزي فهي مصدر مشتق .

[15] – ينظر: عبد الله الحميدان، مقدمة في الترجمة الآلية، ص:11و12على الموقع : www.PDFFactory.com

[16] – صادق عبد الله أبو سليمان، نحو استثمار أفضل للحاسوب في مجالات خدمة اللغة العربية وعلومها، مجمع المجمع الجزائري للغة العربية، العدد السادس، ص:33.

[17] – ينظر: مستقبل اللغة العربية وحقوق الملكية الفكرية في ظل الرقمنة، محمد التفرواتي، على الرابط:  http://azhar-ali.com/go/

[18] – ينظر: المعالجة الآلية للغة العربية جهود الحاضر وتحديات المستقبل، أبو الحجاج محمد بشير، دت،  على الرابط: www.almadenahnews.com

[19]ينظر: المعالجة الآلية للغة العربية جهود الحاضر وتحديات المستقبل، أبو الحجاج محمد بشير، دت،  على الرابط: www.almadenahnews.com

[20] – محركات البحث العربية أشهرها: إسلام أون لاين ، والوراق الذي يعدّ أكبر محرك بحث يضمّ مكتبة تراثية، وأخرى محققة، ومكتبة القرآن، ومجالس الوراق على الرابط ، صخر، عجيب…وغيرها.

[21]http://www.alyaseer.net

[22] http://www.yamli.com

[23] [23] http://www.yamli.com

[24] علوم الاتصال والمجتمعات الرقمية ، فريال مهنا، (2002م)، دار الفكر المعاصر، دمشق، سورية، ط1، ص: 96

[25] مستقبل اللغة العربية وحقوق الملكية الفكرية في ظلّ الرقمنة،محمد التفرواتي، على الرابط:  http://azhar-ali.com/go

[26]مستقبل اللغة العربية وحقوق الملكية الفكرية في ظلّ الرقمنة،محمد التفرواتي، على الرابط:  http://azhar-ali.com/go

[27] – ينظر: المصطلح العلمي في اللغة العربية، عمقه التراثي وبعده المعاصر، رجاء وحيد دويدري، ص:308.

[28] الأبعاد الديداكتيكية لقاموس صخر الالكتروني، نورة مستغفر، ضمن الاستكتاب الجماعي المعجم العربي العصري و”إشكالاته، أحمد بريسول وآخرون، منشورات معهد الدراسات والأبحاث للتعريب، جامعة محمد الخامس السويسي، الرباط، يونيو 2007م، ص:223وما بعدها.

[29] – برنامج الأمم المتحدة الإنمائي:يصطلح عليه:: United Nations Development Programme واختصاراً “يو أن دي بي” هي شبكة تطوير عالمية تابعة  للأمم المتحدة؛ وهي منظمة تدعم التغيير وربط الدول بالمعرفة والخبرة والموارد لمساعدة الأشخاص لبناء حياة أفضل وتعمل في( 177) دولة وتساعدهم في تطوير حلولهم لمواجهة تحديات التنمية المحلية والعالمية، كما تعمل على تطوير القدرات المحلية التي تعتمد على موظفي برنامج الأمم المتحدة الإنمائي وشريحة واسعة من الشركاء، تأسس في :(1-1-1966) من خلال دمج برنامجين تابعين للأمم المتحدة, هما برنامج الأمم المتحدة للمساعدة التقنية الممتد( EPTA) وبرنامج الأمم المتحدة للدعم الخاص, وتم الدمج بشكل كامل في عام( 1971) الذي تم من أجل تجنب تضارب الصلاحيات والخدمات المقدمة من كلا البرنامجين تقدر الميزانية السنوية لبرنامج الأمم المتحدة الإنمائي بما يقرب من( 5000) مليون (5 مليار) دولار أمريكي سنويا.( ينظر: http://www.us.undp.org/WashingtonOffice/UNDPFactSheet2012.pdf)

http://ayaspell.blogspot.com/

– Hun spell (us): http://hunspell.sourceforge.ne/

http://perso.menara.ma/~kebdani/ayaspell-dic/consignes.html

 http://perso.menara.ma/~kebdani/ayaspell-dic/consignes.html

[30]ينظر: المصطلح العلمي في اللغة العربية، عمقه التراثي وبعده المعاصر، رجاء وحيد دويدري، ص:308.

[31] الأبعاد الديداكتيكية لقاموس صخر الالكتروني، نورة مستغفر، ضمن الاستكتاب الجماعي المعجم العربي العصري و”إشكالاته، أحمد بريسول وآخرون، منشورات معهد الدراسات والأبحاث للتعريب، جامعة محمد الخامس السويسي، الرباط، يونيو 2007م، ص:223وما بعدها

بيبليوغرافيا البحث:

1- صديق بسو، النشر الالكتروني واللغة العربية، ندوة المحتوى الرقمي باللغة العربية النشر الالكتروني، منشورات المجلس الأعلى للغة العربية، الجزائر، ط2014

2- محركات البحث العربية أشهرها: إسلام أون لاين ، والوراق الذي يعدّ أكبر محرك بحث يضمّ مكتبة تراثية، وأخرى محققة، ومكتبة القرآن، ومجالس الوراق على الرابط ، صخر، عجيب…وغيرها.

3-مستقبل اللغة العربية وحقوق الملكية الفكرية في ظل الرقمنة، محمد التفرواتي، على الرابط:  http://azhar-ali.com/go/

4-الأبعاد الديداكتيكية لقاموس صخر الالكتروني، نورة مستغفر، ضمن الاستكتاب الجماعي المعجم العربي العصري و”إشكالاته، أحمد بريسول وآخرون، منشورات معهد الدراسات والأبحاث للتعريب، جامعة محمد الخامس السويسي، الرباط، يونيو 2007م، ص:223وما بعدها.

5-أنطوان بطرس، موسوعة الكمبيوتر، مكتبة لبنان، بيروت، ط1، 1991م

6-حبيب عبد الله سروري، اللغة العربية في مهب العولمة مشروع إنهاض، مركز الجزيرة للدراسات، 2009م، على الرابط: http//www.aljazeera.net/NR/exeres/DCED6-0694-4c2C

7-حوار مع أحد مهندسي الإعلام الآلي بالمكتبة( شريف)، 27جوان 2018 في حدود العاشرة صباحا.

8-صادق عبد الله أبو سليمان، نحو استثمار أفضل للحاسوب في مجالات خدمة اللغة العربية وعلومها، مجمع المجمع الجزائري للغة العربية، العدد السادس

9-عباس مصطفى صادق، المعوق التكنولوجي للوجود العربي في الانترنيت، الشرق الأوسط، العدد39، أوت 2003م، على الرابط:

10-عبد الله الحميدان، مقدمة في الترجمة الآلية، على الموقع : www.PDFFactory.com

11-علوم الاتصال والمجتمعات الرقمية ، فريال مهنا، (2002م)، دار الفكر المعاصر، دمشق، سورية، ط1

12-مستقبل اللغة العربية وحقوق الملكية الفكرية في ظلّ الرقمنة،محمد التفرواتي، على الرابط:  http://azhar-ali.com/go

13-المصطلح العلمي في اللغة العربية، عمقه التراثي وبعده المعاصر، رجاء وحيد دويدري،

14-المعالجة الآلية للغة العربية جهود الحاضر وتحديات المستقبل، أبو الحجاج محمد بشير، دت،  على الرابط: www.almadenahnews.com

15-المعالجة الآلية للغة العربية جهود الحاضر وتحديات المستقبل، أبو الحجاج محمد بشير، دت،  على الرابط: www.almadenahnews.com

16-معجم الحاسبات، مجمع اللغة العربية، مصر، ط2، 1995م

17-منصور فرح، الفجوة الرقمية في المجتمعات العربية وأثرها على اللغة العربية، مجلة المجمع الجزائري للغة العربية، العدد6

-18 Hun spell (us): http://hunspell.sourceforge.ne/

-19 Satya Popuri Graduate Student University of Illinois at Chicago Chicago, IL 60607  spopur2 [at] uic [dot] edu

  1. 20. http://www.yamli.com.

21:centre de Recherche sur L’information scientifique et Technique Système Normalisé de Gestion de Bibliothèque( en ligne) document consulté le :18-03-08 disponible à l’adresse : 21-http://193,194,91,202/index.php? page=pressyn .htm

22Centre de recherche sur l’information scientifique et technique, système normalisé de gestion de bibliothèque-SYNGEB :version réseau- :Manuel d’utilisation(Version2007)Alger : cerist 2007,p :5.

23http://ayaspell.blogspot.com/

24http://perso.menara.ma/~kebdani/ayaspell-dic/consignes.html

25 http://www.alyaseer.net

-26http://www.issn.org/understanding-the-issn/what-is-an-issn/

http://www.aawsat.com/details.asp27

28Evaluation de quelques logiciels libres destinés aux professionnels de l’information. (en ligne) Mise à jour 1-4-2008 (document consulté le 18-03-2008) disponible à l’adresse : http://bibliodoc.francophonie. Org/article=133

قسم اللغة العربية/كلية الآداب الفنون/جامعة الشلف/ الجزائر

d.rougab@univ-chlef.dz

m.hadjhenni@univ-chlef.dz

Leave a Reply

avatar
  Subscribe  
Notify of