- مقدمة
يجزم الأكاديميون اليوم؛ بل والناس عامة أن اختراع الحاسوب قد غير وجه العالم، ولا تزال عمليات تطويره تتقدم تزداد ونفاجأ من حين لآخر بإدخال الحاسوب لمجالات لم نكن نتخيل أنه يمكن أن يستعمل فيها وقد نقل العديد من تطبيقاته إلى ما يسمى الهواتف الذكية حتى صارت قادرة على قياس درجة الحرارة وضغط الدم.
وقد أدركت أهمية إجادة العمل عليه واستخدامه منذ رأيته عند بعض أصدقائي الذين اقتنت عائلاتهم هذا الجهاز بسعر عال جدا ولدى بعض التجار أيضاً الذين اقتنوه لأغراض ترفيهية بحتة ولم يستعملوه في أعمالهم إلاّ بعد زمن وعند دخولي الجامعة سعيت حثيثا لاقتناء هذا الجهاز مهما كلفني ذلك لأني أيقنت بفوائده الجمة في دراستي وبحوثي وقد يسر الله لي ذلك والحمد لله وأتقنت العمل عليه وخضعت لدورات للتمكن من برامجه المتعددة.
وكان أكثر استخدامي له في تحرير النصوص واقتباسها فاكتشفت الكثير من الثغرات في تعامل هذا الجهاز مع النص العربي، وزادت إحاطتي بمزاياه وقصوره أثناء عملي رئيس تحرير مجلة فكرة وتدقيقي لجميع المقالات التي تنشر فيها الأمر الذي شكل لدي تصوراً شاملاً للجوانب التي تعد عائقاً أمام الحاسوب في معالجة النص العربي ومع مرور الوقت توصلت إلى كثير من الحلول لهذه المشكلات.
وهذا ما دفعني لكتابة هذا البحث ووضع هذه الحلول والاقتراحات بين أيدي المهتمين والمختصين والمسؤولين، كما قصدت أن أزيل جميع العقبات التي تؤخر حوسبة اللغة العربية وتمنع الدارسين والباحثين من الانتفاع بخصائص جهاز الحاسوب في إنجاز بحوثهم ودراساتهم موفقا بين دراسات سابقة عديدة ومستفيدا من جهود أخرى قريبة من هذا المجال وكلي رجاء أن تصل إلى من يتبناها ويطبقها وينال الثواب العظيم على خدمته لهذه اللغة.
ولا أزعم أني رائد هذا المجال فقد سبقني فيه كثير من أصحاب الفضل مثل الدكتور إبراهيم أنيس والدكتور نبيل علي ومحمد مراياتي ونهاد الموسى وغيرهم، وقد خصصت فصلا من البحث للحديث عن إسهاماتهم.
وقد حوى البحث مقدمة وخمسة فصول وخاتمة. تحدثت في الفصل الأول عن اللسانيات الحاسوبية وتعريفاتها وتعدد المصطلحات الدالة عليها،
وفي الفصل الثاني عن مجالات استخدام اللسانيات الحاسوبية ونبهت لبعض المجالات التي يظن البعض أنها من مواضيع اللسانيات الحاسوبية وهي ليست كذلك، وفي الفصل الثالث تحدثت عن اللغة العربية والتحديات التي تقف عائقا أمام حوسبتها، وفي الفصل الرابع تعريف بالجهود السابقة في مجال اللسانيات الحاسوبية العربية، أما الفصل الخامس فخصصته لشرح رؤيتي واقتراحاتي لحل مشكلة حوسبة اللغة العربية.
وكانت الخاتمة تلخيصا موجزاً للبحث وتأكيدا على ما يمتاز به من بقية البحوث والدراسات
أسأل الله العظيم أن ينفع به ويتقبله مني عملا صالحاً خالصاً لوجهه الكريم والحمد لله رب العالمين.
طارق أمهان
1/1/1439هـ
- الفصل الأول: تعريف باللسانيات الحاسوبية
– لمحة تاريخية غربيه وعربية
تم اختراع جهاز الحاسوب في أواخر النصف الأول من القرن العشرين 1948 وتطورت تقنية هذا الجهاز عبر السنوات تطوراً مذهلا أما بدء استخدام الحاسوب في دراسة اللغة على مستوى العالم فمن الصعب تحديد تاريخ له فعلى المستوى الأمريكي بدأ عام 1954 في مجال الترجمة الآلية وعلى المستوى الأوربي فأقدم محاولة حصلت سنة 1961 في السويد لكنها ظلت ذات طابع محلي وتعد البداية الفعلية لهذا الاتجاه عام 1962 في مركز التحليل الآلي للغة بمدينة قارلا بإيطاليا حيث وضعت الدعائم الأولى لاستخدام الحاسوب في دراسة اللغة وتوالى بعد ذلك افتتاح المراكز في أوروبا والاتحاد السوفيتي.
أما العرب فقد كانت العلوم الشرعية أسبق العلوم الإنسانية استخداماً لتقنيات الحاسوب ونظم المعلومات إذ بدأ ذلك في سبعينيات القرن العشرين وتبدأ قصة الاتصال العلمي بين الحاسوب و البحث اللغوي العربي مع الدكتور إبراهيم أنيس حينما فاتحه الطبيب محمد كامل حسن متسائلا عن إمكانية الاستفادة من الكمبيوتر في البحوث اللغوية الأمر الذي لاقى قبولاً عنده وانتهز الدكتور أنيس عمله في جامعة الكويت عام 1971 حيث التقى بالدكتور علي حلمي موسى أستاذ الفيزياء النظرية بجامعة الكويت وطرح عليه فكرة الاستعانة بالحاسوب في إحصاء الحروف الأصلية لمواد اللغة العربية فرحب بهذه الفكرة واستحسنها وبدأ بالتخطيط لها وتنفيذها في النصف الأول من عام 1971 وكان ثمرة ذلك صدور الدراسة الإحصائية للجذور الثلاثية وغير الثلاثية لمعجم الصحاح للجوهري ت324
– تعدد المصطلحات
ما يزال تعريف اللسانيات الحاسوبية غير مستقر ويعود ذلك لتعدد ترجمات المصطلح بالأصل بالإضافة إلى التشتت في تحديد المجالات التي تشكل محور الدرس فيه لذلك نجد مصطلحات مثل:
اللسانيات الحاسوبية واللسانيات المعلومية وعلم اللغة الحاسوبي
فأما اللسانيات الحاسوبية فهي ترجمة للمصطلح الإنكليزي computational linguistcs
وأما اللسانيات المعلومية فهي ترجمة للمصطلح الفرنسي linguistque informatique
وعلم اللغة يرادف مصطلح اللسانيات في استخدام اللسانيين.
وخلاصة القول أنه على الباحثين اللسانيين العرب والمؤسسات المهتمة بهذا المجال اصطفاء مصطلح واحد لاستخدامه في الدراسات والبحوث بغية تكامل الجهود البحثية في هذا المجال والوصول إلى نتائج قيمة دون إعادة الجهود المبذولة من الآخرين في المجال نفسه ويظهر أن مصطلح اللسانيات الحاسوبية هو الأكثر شيوعاً وملائمة ليعتمد علماً على هذا الفرع من الدراسات اللسانية.
– تعريفات اللسانيات الحاسوبية
“في أول مؤتمر دولي يقام بشأنها عام 1965م عرّفت اللسانيات الحاسوبية بأنها علم جديد تتقاطع فيه اللسانيات مع جهاز صوري تفرزه العلوم المنطقية الرياضية ويخضع القيود التي تفرضها الآلات المعدة للمعالجة الآلية للمعلومة ويؤدي البحث في هذا المجال إلى إنشاء نموذج خوارزمي .
وفي الأدبيات العربية يحيل هذا المصطلح اللسانيات الحاسوبية عادة إلى المجال الذي ترتبط فيه اللسانيات أو علوم للغة العربية للغة من اللغات الطبيعية تدخل في علم مخصوص وليد التطورات التكنولوجية المتقدمة ألا وهو اللسانيات الحاسوبية مجالها البحثي دقيق وجديد يعرض لآخر النظريات والتطبيقات الحاسوبية المجربة على جميع اللغات” .
وله تعريف آخر يذكره د.عبد الرحمن العارف بقوله: “وإذا أردنا تعريف هذا العمل بشكل مختصر قلنا إنه العمل الذي يبحث في اللغة البشرية كأداة طيعة لمعالجتها في الالة الحسابات الإلكترونية الكمبيوتر وتتألف من مبادئ هذا العمل من اللسانيات العامة بجميع مستوياتها التحليلية الصوتية النحوية والدلالية ومن علم الحاسبات الإلكترونية ومن علم الذكاء الاصطناعي وعلم المنطق ثم علم الرياضيات” .
والذي نختاره هو التعريف الآتي: هو فرع من علم اللسانيات يبحث في الطرق والوسائل ويضع القواعد التي تساعد في جعل الآلة قادرة على معالجة اللغات البشرية بجميع مستوياتها حتى الوصول إلى نظام حاسوبي يضاهي القدرة البشرية في معالجة اللغة.
وذلك تبعا لارتباطه بعلم اللسانيات وماهية المجالات التي تشكل محور الدرس والبحث فيه.
واللسانيات الحاسوبية لها جانبان تدرس من خلالهما الجانب النظري والجانب العملي، “فالجانب النظري يهتم بتوصيف هذا الفرع من اللسانيات ووضع نظريات وقواعد تساهم في تحقيق غاياته التي وجد من أجلها، أما الجانب العملي فيطبق هذه النظريات والقواعد على اللغة ويربطها بالحاسب ويُظهر مدى اطرادها وانضباطها ويساهم أيضاً في اكتشاف ثغراتها من أجل تطويرها وتعديلها من أجل الوصول لأفضل النتائج” .
وسوف نتعرف على استخدامات اللسانيات الحاسوبية في الفصل الآتي.
- الفصل الثاني: استخدامات اللسانيات الحاسوبية
إن مجالات استخدام اللسانيات الحاسوبية متعددة وهي قابلة للتوسع والدخول في مجالات أخرى أما أهم المجالات التي تستخدم فيها اليوم فهي:
1- الإحصاء اللغوي: ويمكن أن يكون للجذور اللغوية والأسماء والأفعال والمشتقات وغير ذلك.
2- التحليل الصرفي الآلي: إن هذه المهمة تفيد جدا الباحثين والدارسين في القرآن والمعاجم والكتب اللغوية وذلك في عمليات الإحصاء للجذور ومشتقاتها واستخلاص نتائج دقيقة تصف أداء المؤلف إسلوبيا.
3- الترجمة الآلية: والتي تعتمد على الحاسوب في الترجمة من لغة إلى أخرى وقد وصلت إلى مستوى متطور في هذه الأيام.
4- الدراسات المقارنة والتقابلية: هي من مناهج الدراسات اللسانية والاستفادة من القدرة التخزينية للحواسيب وسرعة المعالجة تفيد جدا في هذا المجال.
5- التدقيق الإملائي والنحوي: وهي من أصعب العمليات في إكسابها للحاسوب إذ لا يمكن الاعتماد الكامل على الحاسوب في التدقيق اللغوي ولا بد أن يراجعه مختص بعد ذلك.
6- تعليم العربية للناطقين بغيرها: إن هذا المجال سيفيد كثيرا جدا من نتائج الدراسات التقابلية بين اللغات والدراسات المقارنة أيضا مما يجعل تعليم اللغة أبسط وأسرع.
7- تحويل النص إلى كلام والكلام إلى نص: تعد هذه العملية أكثر العمليات نفعا من تطبيقات اللسانيات الحاسوبية لأنها ستكون مجالا للاستخدام من قبل جميع الناس بينما ينتفع بالعمليات الأخرى بعص الفئات دون البعض.
وننبه إلى بعض الأمور التي يظن البعض أنها من مواضيع اللسانيات الحاسوبية وهي ليست كذلك: “فلا يعد من مجال اللسانيات الحاسوبية تعليم الحاسوب باللغة العربية على غرار ما تقوم به معاهد تعليم الحاسوب في الدول العربية سواء كانت المادة المدروسة تعنى بطريقة استخدام برامج الحاسوب أو تصميم تلك البرامج وتعديلها أو صيانة الأجزاء الصلبة منه حيث يكون الحاسوب عندئذ مادة الدرس وتكون العربية وسيط التعليم ولغة التخاطب.
ولا يعد من تخصص اللسانيات الحاسوبية ما بات يعرف بمصطلح تعليم اللغة بمساعدة الحاسوب الذي يعنى بثلاث مجالات هي تعليم اللغة الثانية بمساعدة الحاسوب واختبارات اللغة الثانية بمساعدة الحاسوب وأبحاث تعلم اللغة الثانية بمساعدة الحاسوب.
حيث يعد الحاسوب في هذا التخصص وسيلة من وسائل تعليم اللغة الثانية شأن السبورة وجهاز العرض فوق الرأسي والبطاقات واللوحات وأشرطة التسجيل السمعية والبصرية ويتميز الحاسوب بقدرته على توفير إمكانات كل تلك الوسائل مجتمعة إلى جانب إمكانية التعلم الذاتي الذي لا يستعين فيه الطالب بمعلم.
ذلك لا يعد من صميم اللسانيات الحاسوبية الأبحاث التقنية التي تعنى بآليات تخزين المعلومات في وسائط التخزين الحاسوبية المختلفة التي وثبت وثبات سريعة لتنتقل من القرص المرن إلى القرص الصلب فالمدمج فالذاكرة الضوئية المتميزة بصغر الحجم وضخامة السعة.
إذ يعد الحاسوب في هذا المجال مجرد وعاء للغة شأن الورقة البيضاء أو سعف النخل وألواح الخشب بادئ أمر التدوين” .
الفصل الثالث: اللغة العربية والحوسبة – واقع وتحديات –
تعاني العربية اليوم مشكلة وجودية بسبب تأخر أصحابها عن مواكبة التطور الرقمي والتقني وجعله مستوعبا في لغتهم الأم الأمر الذي سيؤدي إلى إقدام الأجيال على الاهتمام باللغات الأجنبية وتعلمها بغية التمكن من التعامل مع الوسائل التقنية الحديثة ويبتعدون عن لغتهم الأم
لأنها لا تحقق لهم ذلك ولولا تعهد الله للقرآن والذكر بالحفظ ونزوله باللغة العربية لقلنا إنها اليوم في مرحلة الاحتضار وليس ذلك لقصور منها أو ضعف فيها إنما لتقصير أهلها في خدمتها من أجل أن تخدمهم فيما بعد،
فقضية العجز عن مواكبة التطور العلمي ليست مشكلة اللغة العربية بل ليست مشكلة أي لغة إذ تستطيع اللغات التعبير عن العلوم إذا بذلت الجهود التي تمكنها من ذلك ولنا في الواقع أمثلة لذلك. فها هي العبرية تنهض من جديد بفضل الجهود التي بذلت في سبيل ذلك بعد أن كادت تموت
وأضحت اليوم لغة العلوم المختلفة وبها تدرس المواد العلمية في المدارس والجامعات الصهيونية.
وها هي الكردية تحيا بعد أن كانت ميتة في إقليم كردستان العراق فكيف تقدر العبرية والكردية على مواكبة العلوم وتعجز العربية.
ولو استعرضنا الدول التي تعد الاهتمام بلغتها أساسا وطنيا وقوميا لوجدنا أنها بذلت الجهود التي تمكن تلك اللغة من استيعاب العلوم ومواكبة التطور وهذا واضح جدا في فرنسا وفي إسبانيا أيضا إذ يشغلهما أيضا هم آخر غير توظيف لغتهم للتعبير عن العلوم هو مواجهة هيمنة اللغة الإنكليزية لذلك أقرت فرنسا قانونا يمنع إقامة أي مؤتمر ناطق باللغة الإنكليزية على أراضيها.
إذن وبعد الرد على شبهة عجز العربية عن مواكبة التطور نوصف واقع اللغة العربية وعلاقتها بالوسائل التقنية الحديثة ومدى تمثيلها على الشابكة (الإنترنت).
فقد نشر موقع الجزيرة نقلا عن الاتحاد العالمي للاتصالات أن نسبة المحتوى الرقمي باللغة العربية لا يتجاوز 3% على الشابكة وهي نسبة متدنية كما هو ظاهر وينبئك هذا عن التدني الموجود في المجالات التقنية الأخرى كالبرمجة بالعربية أو استخدام العربية كلغة لصياغة البريد الإلكتروني أو أسماء المواقع أو الأوامر البرمجية في البرامج المختلفة.
فإذا كان هذا واقع المحتوى العربي فما بالكم بحوسبة اللغة العربية؟ إنه بالتأكيد أدنى من ذلك لأن الحوسبة مرحلة تالية للوجود الرقمي وهذا الوجود هو ما يدفع لعملية الحوسبة فكلما ازداد الوجود الرقمي للغة معينة ازدادت الحاجة لحوسبتها.
وحوسبة اللغة تعني جعل الحاسوب قادرا على معالجة اللغة إفرادا وتركيبا وممارسة التدقيق الإملائي والنحوي عليها واللغة العربية من هذه الناحية متأخرة جدا فأنت عندما تفعل التدقيق النحوي والإملائي في برنامج تحرير النصوص “وورد” مثلا فإنه لا يطبق أيا من القواعد المعروفة في الإملاء والنحو إنما يعرض الكلمة على القاموس الذي زود به وخزن في الملفات الخاصة بالبرنامج.
لذلك لا يفرق بين كلمة “المسلمين” و “المسلمون” لأن كلا الكلمتين موجودة في القاموس وتجده يخطئك عندما تكتب “سألتكما” لأنّ قاموسه فيه الفعل سأل وبعض مشتقاته وحالات اتصاله ببعض الضمائر لذلك لا ينتفع بهذه الخدمة كتّاب العربية على النحو الذي ينتفع به كتّاب غيرها من اللغات.
وإن من أهم الواجبات على خدام اللغة العربية والمختصين بها في هذا الوقت العمل على تجاوز العقبات والصعوبات التي تعيق حوسبة اللغة العربية وذلك بوضع حد للفكر المتصلب الجاهلي وابتكار الأساليب المساعدة في الحوسبة والملائمة لخصائص العربية.
وسنتعرف في الفصل الآتي على جهود الذين سبقوا في هذا المجال وحملوا هذا الهم فقدموا للعربية خدمة كبيرة نسأل الله تعالى أن يثيبهم عليها أعظم الثواب.
- الفصل الرابع: جهود سابقة في اللسانيات الحاسوبية العربية
لقد خاض في المجال العديد من الدارسين بعضهم مختص في علم اللغة وبعضهم مهتم أو مختص في علوم الحاسب محب للغة أمته وقدم هؤلاء جهوداً وإسهامات عدة.
إن ما قام به الدكتور إبراهيم أنيس لا يمكن لأحد أن ينكره ولا أن ينكر جهود جامعة الكويت في السبعينات لكن إذا أردنا عرض مراحل التطور لعلم اللغة الحاسوبي في الدراسات العربية المعاصرة أمكن القول بأن كتاب الدكتور نبيل علي “اللغة العربية والحاسوب” الذي صدر عام 1988م يعد أول مؤلف يتناول موضوع اللسانيات الحاسوبية مطبقة على أنظمة اللغة العربية صوتاً وصرفا ونحوا ومعجما مع المعالجة الآلية لهذه النظم اللغوية جميعها.
وبعد نشر هذا الكتاب بسنوات ثمان صدر كتاب د.عبد ذياب العجيلي “الحاسوب واللغة العربية” وهو كما يقول الدكتور نهاد الموسى: “خطوة جزئية إيجابية نحو معالجة مسائل متنوعة من العربية بلغة برولوج وهو يمثل جهدا حميدا في هذا الاتجاه”.
و”الواقع إنّ خير دليل على الإسهامات التي يقدمها علم اللسانيات الحاسوبية لمعرفة اللغات البشرية هو الدراسة التي قدمها الدكتور محمد مراياتي بالتعاون مع زملائه العاملين في مركز الدراسات والبحوث العلمية في سورية تلك الدراسة التي تدور حول إحصائية الجذور العربية فقد درس مراياتي الجذور العربية المنتشرة في المعاجم والقواميس العربية القديمة دراسة حديثة معتمداً بذلك على الحاسبات الإلكترونية التي تساعد كثيراً في ضبط العملية الإحصائية والسرعة العلمية فيها
وهو ما دفع الدكتور مراياتي لأن يحصي النسب المئوية للجذور الثنائية والثلاثية والرباعية والخماسية في اللغة العربية وقد دفعه أيضاً لأن يحصي الدرجات المئوية التي يمكن فيها للأصوات العربية أن تندمج مع بعضها البعض أو تنفصل عن بعضها بعضاً ثم القوانين التي تحكم هذا الدمج والانفصال.
الواقع إن هذه الدراسات الإحصائية لجذور الكلمات العربية مهمة بحيث يمكن استخدام نتائجها في الترجمة الآلية من اللغة العربية إلى اللغة الأجنبية الأخرى أو بالعكس ولا سيما من حيث مقابلة المركبات الصوتية العربية مع المركبات الصوتية الأجنبية ومن حيث التحليل والتركيب وقد دعا الدكتور مراياتي هذا الإجراء تنافر الأصوات العربية وانسجامها وإمكانية اكتشاف مثل هذا التنافر والانسجام مبرمجا في الحاسبات الإلكترونية”.
“وآخر هذه المؤلفات في اللسانيات الحاسوبية كتاب الدكتور نهاد الموسى “العربية نحو توصيف جديد في ضوء اللسانيات الحاسوبية” الذي صدر سنة 2000 م ويعد هذا الكتاب أول مؤلف في هذا العلم اللغوي الحديث يصدر عن متخصص في اللغة العربية وعلومها.
ولذا فهو يمثل نقلة نوعية في توظيف اللسانيات الحاسوبية لخدمة علوم اللسانيات العربية والكتاب كما يذكر مؤلفه أنه محاولة في الانتقال من وصف العربية إلى توصيفها وذلك في ضوء الأطروحة العامة للسانيات الحاسوبية.
وقد اشتمل الكتاب على رؤى حاسوبية حاول من خلالها المؤلف إسقاطها على أنظمة العربية وخاصة النحو والصرف والمعجم إضافة إلى التصويب الأخطاء النحوية والصرفية و والإملائية.
إنّ هذه الجهود التي تمت ضمن هذا الإطار فردية الطابع لكنّ ذلك لم يدم طويلاً إذ سرعان ما أصبحت متعددة الأطراف بعد أن احتضنتها المراكز والمعاهد التقنية والجمعيات الحاسوبية في الوطن العربي وخارجه والمؤسسات والشركات التجارية المحلية” .
- الفصل الخامس: رؤيتي واقتراحاتي لحل مشكلة حوسبة اللغة العربية:
قبل البدء في عرض رؤيتي لحل مشكلة حوسبة اللغة العربية أذكر هنا نموذجاً اقترحه د.وجدان ليكون منهج اللسانيات الحاسوبية.
– اقتراحات د.وجدان :
فيما يلي تفصيل يقدم تصوراً تأسيسيا لمنهجية التناول تتعدد فيه المقاربات تبعا لتباين الأنظمة اللغوية الجزئية التي تتكامل فيما بينها وتشكل تلك الأنظمة مجتمعة النظام الكلي للغة العربية
أولاً: توصيف النظام الفوناتيكي:
تؤول العربية في نظامها الصوتي إلى أربعة وثلاثين فونيما ثمانية وعشرون صامتا تتمثل في حروب الأبجدية العربية وستة صوائت تمثلها الحركات الثلاث القصيرة الفتحة والكسرة والضمة والحركات الثلاث الطويلة حروف المد ويعنى في الجانب الفوناتيكي بتوصيف تلك الأصوات آحادا على المستوى الأكوستيكي الفيزيائي، والبادي أن توصيف الأصوات منفردة على هذا النحو سيفضي إلى نتائج دقيقة لا تقبل اللبس وأن حدوداً فاصلة قاطعة …ستميز كل صوت عن بقية الأصوات .
ثانيا: توصيف النظام الفونولوجي:
تخضع الفونيمات العربية لقواعد فونولوجية تحكم تتابعها في سياق الكلمة أو الجملة وقد يطرأ على الفونيم تغيير في صفته تأثراً بما يسبقه أو ما يليه من الفونيمات ويعني ذلك أن التوصيف الفوناتيكي لأصوات العربية لا يكفي وحده ليمكن الحاسوب من تمييز الفونيمات وأنه يحتاج إلى توصيف آخر لما يعتري فونيمات العربية في سياقها الوظيفي (التضعيف – التجانس والإدغام – ال الشمسية)
ثالثاً: توصيف النظام المورفولوجي:
ينبغي ابتداءً أن نلمح إلى أن توصيف النظام المورفولوجي يهدف إلى تمكين الحاسوب من التعامل مع المورفيمات الوحدات الصرفية التي تشكل التراكيب اللغوية المتنوعة وينبغي ونحن في هذا الصدد التمييز بين مطلبين متمايزين المطلب الأول المتمثل في القدرة على التوليد أي صوغ الأبنية اللغوية السليمة بخطوات إجرائية محددة على نحو شامل مستقص والمطلب الثاني الذي يمكن الحاسوب من التحليل بتعيين المعاني الصرفية وتفكيك التراكيب اللغوية إلى وحداتها الصرفية الصغرى حين ترد في سياق الجملة أو في سياق النص.
رابعاً: توصيف النظام الإعرابي:
يلزمنا بادئ الأمر تصنيف كلم العربية إلى المبني والمعرب ذلك أن المبني سيستدخل في الحاسوب على هيئة لا تتغير …وسيفضينا ذلك إلى حصر جهدنا على الاسم المعرب والفعل المعرب.
خامساً: توصيف النظام الدلالي:
يمثل توصيف النظام الدلالي للغة العربية نواة المعالجة الآلية وعموده الفقري ذلك أن جل عمليات المعالجة الآلية للتراكيب اللغوية تستند بشكل من الأشكال عليه وتحيل إليه ويعد عند المعنيين باللسانيات الحاسوبية أعسر المباحث تناولا لتعلق دلالات الألفاظ بداهة بالفهم البعيد المنال عن الحاسوب.
ولعل الأولى ونحن في سبيل إنشاء هذا النظام الدلالي أن نستعين ببنك للنصوص العربية الفصيحة يتم اختيار نصوصه سلفا وفق معايير علمية يرتضيها المتخصصون في العربية.
-وصف خصائص اللغة العربية الخط والتشكيل النحو الدلالة:
تتميز اللغة العربية بالعديد من الخصائص التي تشرفها على غيرها من اللغات ونذكر هنا ما له علاقة بعملية الحوسبة فمنها:
أنها لغة معربة، واشتقاقية، غنية بالمفردات، وفيها أكثر من نوع من الجمل، ويمكن التقديم والتأخير لأركان الجملة، والتعبير عن المعنى الواحد بصياغات عديدة، ويكثر في أساليبها الاستعارات والإنزياحات اللغوية، ويتميز الخط العربي بالإيجاز في استخدام الحروف فمن ذلك الاكتفاء بحرف واحد عندما يتكرر نفسه متتاليا مثل: “داود” و “يحي” وتحذف ياء المتكلم في كثير من المواضع مثل: “يا رب” و “يا قوم” وكون الحرف له عدة أشكال تختلف في حال الاتصال والانفصال، وأهم من ذلك التعبير عن الصوائت القصيرة بأشكال صغيرة توضع على الحروف ليس كباقي اللغات التي تعبر عنها بمحارف خاصة.
وهذه الخصائص تعطي للغة غنى تعبيريا واسلوبيا يشرفها ويرفع منزلتها مقارنة باللغات الأخرى، لكن بالنسبة للآلة تشكل هذه الخصائص تحدياً وصعوبة في إدراكها ومعالجتها
وذلك لأن الحاسوب له خصائصه التي سنعرضها الآن ونوضح لماذا تشكل خصائص اللغة تحدياً له.
– خصائص الحاسوب
السعة الكبيرة: وقد مرت بمراحل عديدة حتى صار بالإمكان تخزين الكم الهائل من المعلومات والبيانات والملفات باختلاف أنواعها على شريحة صغيرة لا يتجاوز حجمها ظفر الإصبع.
المعالجة السريعة: قد تكون هذه الميزة أهم خصائص الحاسوب وهي التي كان لها الدور الأكبر في التفجر المعرفي ولطالما تفاخر الناس على أقرانهم بتطور هذه الميزة في حواسيبهم الشخصية.
الخوارزميات: يعتمد الحاسوب في أداء وظائفه على خوارزميات ومعادلات تنظم خطوات تعامله مع الأوامر والبيانات والملفات وتكون هذه الخوارزميات قد أعدت مسبقاً ووضعت في نظام الحاسب كما يوجد لكل برنامج خوارزميات خاصة به تتناسب مع المهمة التي أعد لها لذلك يمكن وصف نظام الحاسوب بأنه نظام رياضي.
وهناك صفة أخرى للحاسوب ينبغي التنبيه لها كي نتعامل معه بطريقة صحيحة وهي أنه غبي او عاجز عن الفهم.
وذلك أنك عندما تعرف الاسم بأنه ما كان مثل رجل فرس حائط فإن الإنسان يقيس عليه كل أسماء العربية التي تعبر عن الموجودات لكن هيهات للحاسوب أن يدرك ذلك ولا سبيل إلا بعملية إحصائية تنص على وصف كل الكلمات الدالة على اسم بأنها اسم وإدراجها في الحاسوب
-اقتراح المنهج الأنسب:
إن أنسب المناهج في عملية حوسبة اللغة العربية هو المنهج الذي يراعي الخصائص التي ذكرناها لكل من اللغة العربية والحاسوب لأن ذلك سيقودنا إلى وضع الخوارزميات المعبرة عن الوقائع اللغوية والتي يستطيع الحاسوب معالجتها.
والمنهج يجب أن يكون كالآتي:
اتباع ما اقترحه الدكتور وجدان في أولاً وثانياً أي توصيف النظام الصوتي والنظام المعجمي للغة العربية بما يناسب الحاسوب وبعد اطلاعي على جهود محمد مراياتي أرى أن يكون جهده في التوصيف للنظام الصرفي هو المرحلة التالية.
بالإضافة لما قدمه الدكتور نبيل علي في هذا المجال، أما بعد ذلك فلا بدّ من تزويد الحاسوب بكم هائل من النصوص العربية المشكولة بالكامل القابلة للمعالجة “بنك نصوص لغوية” قبل البدء بالتوصيف الإعرابي النحوي والإملائي والدلالي،
وذلك بغية تسهيل عملية وضع الخوارزميات وتوصيفها لتكون مطردة وسهولة كشف ثغرات الخوارزمية لتعديلها وتجاوزها.
ونضرب مثالاً على ذلك بقاعدة التقاء الساكنين إذ سنعطي إرشادا للحاسوب أنه عندما يلتقي ساكنان سيحذف الساكن الأول ونعطيه مثالاً:
سعت = سعى +ت
ثم نعطيه أمراً بالبحث عن مواضع التقاء الساكنين في النصوص المدخلة فيه من قبل
فيخرج لي كلمة “الضالّين” مثلاً فأعدل على الخوارزمية ذلك بشرط أن لا يكون الحرف الثاني مضعفا.ويخرج لي أيضاً تركيب “عهدي الظالمين” فأضيف للقاعدة إذا كان الساكنان في كلمتين فإنه يحذف لفظا ويبقى رسما.وبهذا يكون توصيف القاعدة شاملاً.
ويلاحظ أني لن أحتاج توصيف حالات التخلص من التقاء الساكنين بالتحريك لأن الحاسوب أصلاً لن يعترض عليها إذ أدخلت فيه خالية من التقاء الساكنين.
وبهذا الطرح أكون قد وفرت وقتي في استقصاء حالات التقاء الساكنين وإدخالها في واحدة واحدة وتجنبت ما قد ألقاه من تناقض وصعوبة في التوصيف والتفريق بين واو الجماعة التي نحركها عند التقاء الساكنين بالضم ونحذفها لفظا أو كتابة ولفظا إذا كانت غير واو الجماعة.
الأمر الذي سيضطرني إلى وضع توصيف للواوات ومتى تكون جماعة أو أصلية أو غير ذلك ثم توضيح الحالات المشتركة، ثم أعود إلى قاعدة التقاء الساكنين، وأضع لها التوصيف المناسب إذا استطعت الانتهاء من الحالات الاستثنائية والخاصة.
ويظهر من الذي ذكرته تناسب الطريقة التي ذكرتها مع خصائص الحاسوب وخصائص العربية فقد استفدت من سعة الحاسوب الكبيرة ومعالجته السريعة، وتخلصت من تعدد احتمالات دلالة الكلمة على فعل أو اسم أو ماض وأمر باعتمادي النصَ المشكولَ وكمّا هائلاً من النماذج والوقائع اللغوية مما يجعل وجود تعبير مخالف لما قعدته نادراً جداً
فما هي أسس هذا المنهج؟
أولاً: الاستفادة من الجهود المبذولة في دراسات النظام الصوتي والمعجمي للغة العربية مع التأكيد على وضع رمز لتصنيف الكلمة كاسم أو فعل أو حرف وربما احتجنا بعض التصنيفات الفرعية كضمير واسم إشارة واسم موصول أيضاً
كما هو موجود في القواميس الإنكليزية.
ثانياً: اعتماد النص المشكول بالكامل قبل البدء بعمليات التوصيف وذلك لأن الحركات في العربية تعادل حروفا مرسومة في غيرها.
ثالثاً: تخزين كم هائل من النصوص العربية المشكولة بالكامل القابلة للمعالجة بنك نصوص لغوية في ذاكرة الحاسوب.
رابعاً : البدء بالتوصيف الصرفي والنحوي والإملائي مستفيدين من الجهود السابقة والبناء عليها.
خامساً : أرى أن توصيف المستوى الدلالي سيظل التحدي الكبير في وجه اللسانيات الحاسوبية وربما يقدم نحو النص مساعدة وتيسيرا في هذا المجال إذا تطور أكثر، لكني أنبه لعملية مفيدة جداً في هذه الناحية بعد أن صار متوفراً عندي كمّ هائل من النصوص العربية المشكولة.
وهي عملية مقاطعة النصوص مع بعضها البعض مما يتيح للحاسوب معرفة كيفية اصطفاف الكلمات في الأساليب العربية ونماذج عديدة لصياغة العبارة العربية، لنفيد من ذلك في توصيف المستوى الدلالي.
ولا بدّ قبل ختام هذا الفصل من الحديث عن ربط الجهود السابقة والاستفادة من جهود مبذولة في مجالات أخرى حيث أرى أنّ أولاً وثانياً قد صارا جاهزين بفضل الجهود السابقة ولا تحتاج إلاّ بعض التكملات وتنسيقها معاً لخدمة هذا المنهج ولعل سائلا يسأل: كم سنة تريد حتى ننجز بنك النصوص اللغوية المشكولة؟ ألست تبالغ في هذا المقترح؟
والجواب: أنه جاهز بفضل جهود العاملين على توفير الكتب بطلاب العلم ضمن برامج وتطبيقات تساعدهم على البحث وأخص هنا “المكتبة الشاملة” لأنها تقدم لك النص مشكولا وبدون تشكيل ولا يجهل من سمع باسمها فقط ضخامة الملفات والنصوص التي تحويها فعندما نضم هذا الجهد للجهود السابقة ونطبق ما اقترحته من خطوات سنحصل على نتائج قيمة جدا.
- الخاتمة
إن التطور التكنولوجي الذي لا يتوقف بل تزداد سرعته يوما بعد يوم يضاعف التحدي أمام الأكاديميين في هذه الأمة لإيجاد وسائل تواكب ظاهرة التسريع التي وسمت هذا العصر واللسانيات الحاسوبية وسيلة مهمة جدا في الاستجابة الحضارية لمستجدات وما تزال بحاجة إلى جهود كبيرة لتنميتها وتوظيفها في خدمة العربية وأهلها وعلومها .
إلا أن الاستفادة والجمع بين جهود الجميع من ساهم في هذا المجال وما يقرب منه بما يتناسب مع خصائص العربية وصفات الحاسوب لم تتكامل يوما كما هي في هذا البحث مع حفظ الفضل لمن سبق أسأل الله أن يتقبل مني هذا الجهد في سبيل ذلك إنه ولينا ونصيرنا والحمد لله رب العالمين.
المراجع:
1- توظيف اللسانيات الحاسوبية في خدمة الدراسات اللغوية العربية -جهود ونتائج ، د.عبد الرحمن بن حسن العارف – مجلة مجمع اللغة العربية الأردني– الأردن – عدد73 – 2007
2- فعالية اللسانيات الحاسوبية العربية، د.ديدوح عمر – مجلة الآداب واللغات – جامعة قاصدي مرياح – الجزائر – عد8 -2009
3- اللسانيات الحاسوبية العربية – المنهج والإطار، د.وحدان محمد صالح كنالي – بحث قدم في المؤتمر الدولي الثاني للغة العربية في دبي – 30/ جمادى الآخرة/ 1434
4- اللسانيات الحاسوبية مشكل المصطلح والترجمة، د.رضا بابا أحمد – جامعة تلمسان – الجزائر – بلا تاريخ
امل من الاخت شيما وكل من تخصصه حاسوبيات لغوية أرجو مراسلتي عبر بريدي الالكتروني :
[email protected]
أنا طالبة ماستر قسم تكنولوچيا تعليم وتخصصي في اللغة العربية وأريد أن تقترح علي عنوانا يمكن تطبيقه عمليا بشكل مبسط ويرتبط أيضا بمتعلمي العربية لغير الناطقين بها
انا طالبة ماستر اريد موضوعا لمذكرتي في مجال اللسانيات الحاسوبية وأرجو المساعدة
يمكنك العودة إلى نافذة لسانيات أو نافذة رقمنة ومعلوميات على موقع المنصة
ستجدين ما يُفيدك .. نرجو لك عميم التوفيق
السلام عليكم انا طالبة دكتوراه شعبة دراسات لغوية تخصص لسانيات تطبيقية هل يمكن مساعدتي في اختيار موضوع حسب هذا التخصص فقد تعذر علي ايجاد موضوع لهذا التخصص لصعوبة توفر المراجع فحبذا لو ساعدتموني اذا استطعتم جعلها الله في ميزان حسناتكم وشكرا
يمكنك الاشتغال حول موضوع؛ المعالجة الآلية للغات .. اللغة العربية نموذجاً
نرجو لك وافر التوفيق