مستخدمة:OKBot/إملاء/سكربتات

مهمة التدقيق الإملائي خليط ما بين العمل اليدوي والآلي، ولذا تدخل فيها عدة خطوات وعدة سكربتات -جميعها حرة- أهما اثنان:

  • xml_spell_check.py: وهو سكربت كتبته ليفحص قاعدة بيانات الموسوعة (تحديدا ملف arwiki-*-pages-meta-current.xml الذي يحتوي النسخة الأخيرة من جميع الصفحات) باحثًا عن تعبير نمطي محدد (قائمة التعابير النمطية المستهدفة موجودة في كل قسم على حدة.) بعد فحص قاعدة البيانات يُولّد السكربت قائمة بالنتائج يمكن العثور على تعليمات السكربت بتشغيل: 'python xml_spell_check.py -h' وستظهر قائمة بالخيارات مع شرح لكل خيار.
    سيناريو الاستخدام: إذا أردت أن تبحث عن الكلمات التي ينطبق عليها وزن إستفعال، فالتعبير النمطي سيكون: \\bإست\w\wا\w\\b بعد فحص قاعدة البيانات ستنتج قائمة بالنتائج منها "استخدام" و"استعمال".
  • replace.py: بعد توليد قائمة الكلمات التي توافق نمطًا تعبيريا معينا وبعد مراجعتها للتأكد أن تلك الكلمات يمكن تصحيحها آليا (بغض النظر عن السياق) يمكن تشغيل سكربت replace.py الموجود في مكتبة pywikibot. توجد تعليمات مخصصة عن كيفية تشغيل هذا السكربت في صفحته.

أحيانا يرسل المتطوعون أعمالهم على نحو يتطلب معالجة خاصة قبل تطبيقه على الموسوعة، ولأجل ذلك أكتب أحيانا سكربتات لهذه الغاية قد تغني عن replace.py وقد ينتج عنها استنباط مزيد من التصحيحات الدقيقة. هذه السكربتات لحالات مخصصة جدا ولا أظن أن نشرها سيفيد أحدًا.