تسلسل الهروب

الهروب تسلسل ( تسلسل الهروب) هو سلسلة من بضع بايتات و/أو رموز موجودة في سلسلة من النص و لعب دور خاص في المكان الذي كان موجودا. يُعرض رمز المقدمة لهذا الغرض، عموما رمز التحكم 0x1B ESC ( الهروب).

التاريخ عدل

أُدخلت فكرة رمز الهروب في قانون بودو. Anecdotiquement ، إذا كان أحد يرى أن - 1 و + 0, تسلسل الهروب من قانون بودو هي بالفعل قيمة 0x1B.

يتضمن كود 8-بت من وزارة الدفاع وظيفة Special في نفس الأحكام في وقت مبكر من عام 1961.[1]

التطبيق عدل

تُستخدم هذه التكنولوجيا في سياقات مختلفة ؛ وعلى وجه الخصوص :

  • ISO 2022 ;
  • VT100 ;
  • ANSI.SYS ;
  • رمز بودو.

هناك ما لا يقل عن 157 ترميز أحرف مختلفة الوصول إليها من قبل تسلسل الهروب.[2]

في لغة C و C++ تسلسل ASCII الهروب هي:[3]

  • \' اقتباس أحادية. سداسي عشري قيمة: 0x27 ;
  • \" علامة اقتباس. سداسي عشري قيمة : 0x22 ;
  • \? علامة استفهام . قيمة ست عشرية : 0x3f ;
  • \\ - مائل. قيمة ست عشرية : 0x5c ;
  • \0 حرف null. عرافة القيمة : 0x00 ؛
  • \a حرف نداء مسموع. سداسي عشري قيمة : 0x07 ;
  • \b مسافة للخلف (backspace). سداسي عشري قيمة : 0x08 ;
  • \f صفحة جديدة. عرافة القيمة : 0x0c ;
  • \n سطر جديد. سداسي عشري قيمة : 0x0a ;
  • \r إرجاع. عرافة القيمة : مخطط الشفرة ست عشرية 0x0d ;
  • \t التبويب الأفقي. سداسي عشري قيمة : 0x09 ;
  • \v عمودي علامة التبويب. سداسي عشري قيمة : 0x0b ;
  • \nnn ثماني القيمة التعسفي. ثماني القيمة : nnn ؛
  • \xnn قيمة ست عشرية هو إجراء تعسفي. سداسي عشري قيمة : nn ;
  • \unnnn قيمة Unicode التعسفي. قد يؤدي عدة شخصيات. معرف Unicode U+nnnn ;
  • \Unnnnnnnn Unicode القيمة التعسفي. قد يؤدي عدة شخصيات. معرف Unicode U+nnnnnnnn.

هذه التسلسلات مفيدة في ملف التلاعب النص في وحدة من ويندوز, لينكس,قالب:Etc.

القيود المفروضة على POSIX القياسية عدل

POSIX لا تحدد أي طريقة قياسية للدلالة الحرفي الشخصيات من قبل الرمز العددي الشخصيات في اللعبة أن تكون أكثر من 8 بت (على سبيل المثال Unicode). أيضا عدد من تطبيقات POSIX متوافق Unicode أو ISO 10646 سوف تقبل أيضا تسلسل \uNNNN (حيث NNNN يدل على 4 أرقام ست عشرية من نقطة رمز Unicode حرف خطة multingue الأساسية) أو \U -NNNNNNNN (حيث NNNNNNNN يشير إلى 8 أرقام ست عشرية من نقطة رمز Unicode أي حرف في اللعبة).

معيار لا تحدد ما إذا كانت الشخصيات المعينة من قبل رمز عشري الرجوع إلى تلك من الملف المصدر أو إذا كان الرمز هو نتيجة الشفرة من شخصية مشفرة مجموعة من المدخلات إلى مجموعة مشتركة مثل (Unicode). Unicode أو ASCII-على أساس هو دائما تقريبا تستخدم الداخلية الترميز، ولكن هذا ليس صحيحا دائما على أنظمة الترميز على أساس EBCDIC مع التعبيرات العادية POSIX.

بالإضافة إلى مجموعات أحرف 8 بت قد تختلف على نطاق واسع، خاصة في منطقة عالية (غير ASCII) تفسير أحرف التحكم (اعتمادا على النظام المستخدم). هذا هو التوافقية المشكلة التي يتم حلها في معظم الأحيان باستخدام، أدوات معالجة النصوص، مجموعة أحرف الداخلية مشترك واحد Unicode-على أساس الترميز مجموعة من الشخصيات من المدخلات إلى هذا الترميز الداخلي المشترك : مع هذا النظام، التعبيرات يمكن أن تصبح مستقلة من ترميز مجموعة الأحرف المستخدمة في الوثائق المختلفة.

الملاحظات والمراجع عدل

  1. ^ Standard ASCII de 1963, §A.8.1 Control Subset Structure.
  2. ^ "Registre international des jeux de caractères codés". مؤرشف من الأصل في 2013-10-18.
  3. ^ Séquences d'échappement - cppreference.com نسخة محفوظة 08 فبراير 2018 على موقع واي باك مشين.

الملاحق عدل

مقالات ذات صلة عدل

  • حرف تحكم
  • ASCII
  • Unicode
  • [[{{{1}}}|{{{1}}}]] [[:en:{{{1}}}|[الإنجليزية]]] (العلاقات), تسلسل الهروب يستخدم في أجهزة المودم للتبديل إلى وضع 'البيانات' وضع 'الأوامر'.
  • بت حشو

المراجع عدل