مدقق نحوي

المدقق النحوي بمصطلحات الحوسبة، هو برنامج أو جزء من برنامج يحاول التحققَ من الصحة النحوية للنص. المدقق النحوي غالباً ما يضاف كخاصية في برنامجٍ أكبرَ، مثل معالجات النصوص، ولكن هناك أيضاً تطبيقات مستقلة يمكن تفعيلها من خلال البرامج التي تعمل مع النصوص القابلة للتحرير.

أبي ورد يدقق قواعد اللغة الإنجليزية باستخدام Link Grammar

تطبيق التدقيق النحوي يقوم باستخدام معالجة اللغات الطبيعية.

التاريخعدل

أول "مدقق نحوي" كان يتمثل ببساطة في تلك البرامج التي تتحقق من علامات الترقيم والتناقضات في التنسيق بدلاً من إيجاد أخطاء نحوية فعلية. الأول كان يسمى نظامَ منضدة الكاتب (Writers workbench)، وكان يتمثل بمجموعة من أدوات الكتابة المضمنة مع نظام Unix وتعود للسبعينات.[1][2] حقيبة النظام كانت تشمل حزمةً منفصلةً من عدة أدوات للتحقق من مشاكل الكتابة المختلفة. أداةُ الإسلوب كانت تتحقق من الألفاظ المبتذلة، أو إساءة استخدام العبارات في النص. الأداة تقوم بإخراج قائمة من العبارات المشتبه بها، وتقديم اقتراحات لتحسين الكتابة. أما أداة التنسيق (Style) فكانت تحلل تنسيق كتابة نص معين. وقد كانت تقوم بعدد مِنَ اختبارات القراءة على النص وإخراج نتائجها، وتعطي بعض المعلومات الإحصائية عن جمل النص.

أما شركة آسبن للبرامجيات (Aspen) من ألباكركي، فقد ظهر إصدارها الأقدم من مدقق الأسلوب والتنسيق للحاسبات الشخصية، غراماتيك Grammatik, في عام 1981. غراماتك كان متاحاً لأول مرة لـراديو شاك - TRS-80، ولاحقاً كان له إصدارات لكل من CP/M و IBM PC. شركة ريفيرينس للبرامجيات الكائنة في سان فرانسيسكو، اشترت غراماتيك في عام 1985. واستمر تطويره، وأصبح مدققاً نحوياً فعلياً يمكنه الكشف عن أخطاء الكتابة والأخطاء التي تتجاوز أسلوب تدقيق التنسيق البسيط.

برامج مبكرة أخرى للأسلوب والتنسيق ضمت أدوات للتنقيط، التنسيق، تصحيح القواعد. بينما بدأت الأشكال الأولية من هذه البرامجيات كمدققات بسيطة للتنسيق وعلامات التنقيط، وجميعها أضافت درجاتٍ مختلفةً من المعالجة اللغوية، وطورت مستوى معيناً من قدرات التدقيق القواعدي الصحيح.

حتى عامِ 1992، المدققاتُ اللغوية بيعت ضمن برامج. لا يزال هناك عدد كبير من مختلف برامج معالجة النصوص المتاحة في وقتها، مع WordPerfect و Microsoft Word مثلاً وهما أعلى برنامجين من حيث الأسهمُ عندئذ. في عام 1992، مايكروسوفت قررت أن تضيف التدقيق النحوي كإضافة لبرنامج وورد والإضافة مرخصة من كوريكت تيكست CorrecText ، أما المدقق النحوي هوتون ميفلين الذي لم يكن قد تم تسويقه كمنتج مستقل. ووردبرفكت ردت على تحرك مايكروسوفت باقتنائه من شركة ريفيرينس للبرامجيات، وهو السليل المباشر لغراماتيك Grammatik والذي لا يزال مدرجاً مع برنامج وورد بيرفيكت.

هناك البرامجيات الحرة و مفتوحة المصدر للتدقيق النحوي مثل أدوات اللغة التي يمكن استخدامها من ويكيميديا مختبرات على مقالات ويكيبيديا.[3]

المسائل التقنيةعدل

أقدم برامج فحص نمط الكتابة كانت تفحص الكلماتِ المبتذلة، النمطية، أو إساءة استعمال العبارات في النص. وكانت هذه العملية قائمة على مطابقة أنماط بسيطة. قلب البرنامج كان قائمة من عدة مئات أو آلاف من العبارات التي تعتبر كتابة ضعيفة من قبل العديد من الخبراء. قائمة العبارات المشتبه بها تضمنت عبارات بديلة لكل عبارة. برنامج التحقق كان ببساطة يقوم بتفكيك النص إلى جمل، ويتحقق أي منها يتطابق مع عبارة في قاموسه، وكان يؤشر العبارات المشتبه بها ويظهر العبارات البديلة. هذه البرامج يمكن أن تقوم أيضا ببعض التدقيقات الميكانيكية. على سبيل المثال، فإنها عادة تؤشر تضاعف الكلمات، تضاعف الترقيم وبعض أخطاء رسملة الاحرف وغيرها من الاخطاء الميكانيكية البسيطة.

المدقق النحوي الحقيقي هو أكثر تعقيدا. فبينما لغة برمجة الكمبيوتر قد تكون محددةً جداً بتعابيرها ونحوها، لا ينطبق هذا الأمر على اللغات الطبيعية. على الرغم من أنه من الممكن كتابة قواعد كاملة  بعض الشيء للنحو الرسمي للغة الطبيعية، فإنه عادة ما يكون هناك الكثير من الاستثناءات في الاستخدام الحقيقي فلا يقدم النحو الرسمي سوى الحد الأدنى من المساعدة في الكتابة للمدقق النحوي. واحد من أهم أجزاء المدقق النحوي للغات الطبيعية هو قاموس كل الكلمات في اللغة، جنبا إلى جنب مع أجزاء الكلام من كل كلمة. حقيقة أن الكلمات الطبيعية يمكن أن تأخذ العديد الأجزاء المختلفة من الكلام تزيد من تعقيد أي مدقق نحوي. على المدقق النحوي أن يجد كل جملة في النص، وأن يبحث عن كل كلمة في القاموس، ثم أن يقوم بتحليل الجملة إلى شكل يطابق قواعد اللغة. باستخدام مختلف القواعد، البرنامج بعدها يمكنه الكشف عن الأخطاء المختلفة، الأعداد، ترتيب الكلمات، وهكذا.

ومن الممكن أيضا للكشف عن بعض إشكاليات الاسلوب في النص.

العناصر البرمجية المطلوبة للمدقق النحوي ترتبط ارتباطا وثيقا ببعض قضايا البرمجة والتطوير والتي تحتاج إلى تعريفها من أجل برامج التعرف على الصوت. في التعرف على الصوت، التحليل يمكن استخدامه للمساعدة في التنبؤ حول الكلمة الأكثر احتمالية أن تكون صحيحة على أساس جزء من كلمة و موقع الكلمة في الجملة. في التدقيق النحوي، التحليل يتم الكشف عن الكلمات التي تفشل في اتباع القواعد السليمة.

مؤخرا,  ركزت الأبحاث على تطوير الخوارزميات القادرة على تمييز الاخطاء النحوي بناء على سياق الكلمات المحيطة بها. المدقق النحوي القائم على سياق الكلمات يظهر في Microsoft Office 2010, Microsoft Office 2007,[4] Google Wave,[5] Ghotit ، [6] Grammarly,[7][8][9] SpellCheckPlus.com, GrammarCheck.net VirtualWritingTutor.comو WhiteSmoke .

التدقيق النحوي للغة العربيةعدل

معظم الأبحاث حول معالجة اللغة الطبيعية العربية مكرسة لمرحلة التحليل الصرفي النحوي دون الانتباه إلى مشكلة التدقيق النحوي[10]، لذا لا تتواجد أدوات للتدقيق النحوي الآلية للغة العربية سوى تدقيق بعض الجمل البسيط في برنامج مايكروسوفت وورد بدءا من عام 2003 م، ومعظم تلك التدقيقات تكون لإزالة العلامات الزائدة كالمسافات أو الفاصة وعلامات الإستفهام [10]

انتقاداتعدل

المدقق النحوي يعتبر نوع من الأدوات المساعدة لكتابة اللغة الاجنبية التي يستطيع غير الناطقين باللغة أن يدققوا كتاباتهم فيها،  لتحديد الأخطاء النحوية.[11] ومع ذلك، كما هو الحال مع غيرها من برامجيات المساعدة على الكتابة،  فإن المدققات النحوية تنتقد عندما تفشل في عدد من الأخطاء أو ان تؤشر النص الصحيح على أنه خاطئ. اللغوي  جيفري K. Pullum زعم أن المدققات النحوية بشكل عام تؤدي اضراراً أكثر من الفوائد: "في أغلب الاحيان، تقبل النصيحة من المدقق النحوي في الحاسوبسوف يجعل النص اسوأ بكثير، وفي بعض الأحيان يجعله غير متماسك إلى حد كبير."[12]

انظر أيضاعدل

المراجععدل

  1. ^ M. Stutz: Living language. نسخة محفوظة 20 يونيو 2017 على موقع واي باك مشين.
  2. ^ A. Walker: The Linux Cookbook نسخة محفوظة 03 يناير 2018 على موقع واي باك مشين.
  3. ^ LanguageTool instance on WikiMedia Labs
  4. ^ Walt Mossberg (4 January 2007). "Review". Wall Street Journal. مؤرشف من الأصل في 30 يونيو 2007. اطلع عليه بتاريخ 24 سبتمبر 2010. الوسيط |CitationClass= تم تجاهله (مساعدة)
  5. ^ "Google Operating System". googlesystem.blogspot.com. مؤرشف من الأصل في 27 يناير 2019. اطلع عليه بتاريخ 25 سبتمبر 2010. الوسيط |CitationClass= تم تجاهله (مساعدة)
  6. ^ Dr. Linda Tauscher (April 21, 2011). "Contextual Spell Checker Evaluation". Assistive Technology And Accessibility. مؤرشف من الأصل في 5 مارس 2019. اطلع عليه بتاريخ 14 أبريل 2012. الوسيط |CitationClass= تم تجاهله (مساعدة)
  7. ^ Geeta Padmanabhan (September 21, 2011). "Cool tool". الصحيفة الهندوسية. The Hindu Group. مؤرشف من الأصل في 19 يناير 2013. اطلع عليه بتاريخ 24 ديسمبر 2012. الوسيط |CitationClass= تم تجاهله (مساعدة); غير مسموح بالترميز المائل أو الغامق في: |newspaper= (مساعدة); غير مسموح بالترميز المائل أو الغامق في: |ناشر= (مساعدة)
  8. ^ "Grammarly - Visual Tool". مؤرشف من الأصل في November 1, 2015. اطلع عليه بتاريخ November 1, 2015. الوسيط |CitationClass= تم تجاهله (مساعدة)
  9. ^ Cheryl Conner (October 21, 2012). "I Don't Tolerate Poor Grammar". فوربس (مجلة). Forbes publishing. صفحات 1–2. مؤرشف من الأصل في 04 أكتوبر 2017. اطلع عليه بتاريخ 24 ديسمبر 2012. الوسيط |CitationClass= تم تجاهله (مساعدة); غير مسموح بالترميز المائل أو الغامق في: |magazine= (مساعدة); غير مسموح بالترميز المائل أو الغامق في: |ناشر= (مساعدة); تحقق من التاريخ في: |تاريخ أرشيف= (مساعدة)
  10. أ ب Shaalan, Khaled (2005). "Arabic GramCheck : a grammar checker for Arabic" (PDF). scholar.cu.edu.eg. مؤرشف من الأصل (PDF) في 3 أبريل 2018. الوسيط |CitationClass= تم تجاهله (مساعدة)
  11. ^ Bustamante, F.R., & León, F.S, (1996).
  12. ^ Geoffrey K. Pullum (October 26, 2007). "Monkeys will check your grammar". Language Log. مؤرشف من الأصل في 11 سبتمبر 2017. اطلع عليه بتاريخ 08 مارس 2010. الوسيط |CitationClass= تم تجاهله (مساعدة)