جربت لتوليد قائمة الأخطاء الإملائية في التاء المربوطة وسيلة جديدة تختلف عما سبقها من طرق لاستخراج الأخطاء الإملائية؛ إذ افترضت أنه إذا وردت كلمتينكلمتان متشباهتينمتشباهتان إلا أن واحدة منهما تنتهي بتاء مربوطة والأخرى تنتهي بهاء، وكان تكرار الكلمة التي تنتهي بالتاء المربوطة في مقالات الموسوعة كلها يفوق نظيرتها بثلاث أضعاف فمن المحتمل جدا أن تكون الكلمة المنتهية بالهاء خطأ إملائيا. بعد اختبار القائمة تبين أن كثير من الكلمات التي تنتهي بهاء ليست إلا ضمائر صحيحة (مثلا مدرسة ونظيرتها مُدرّسه). لاستثناء هذه الصيغ الصحيحة اشترطت أن تكون الكلمتين معرفتين بأل، فكانت النتيجة دقيقة جدًا. تطبيق هذه القائمة يُصحّح 41593 خطأ إملائيا على ويكيبيديا العربية (بناء على قاعدة بيانات 14 يوليو 2014).