لا فهرسة

قيمة في العلامات الوصفية لبوتات الإتش تي إم إل تمنع بوتات البحث من فهرسة الصفحة، وبالتالي عدم ظهورها في نتائج البحث.
(بالتحويل من Noindex)

noindex (لا فهرسة) هي قيمة في الوسوم الوصفية [الإنجليزية] لبوتات الإتش تي إم إل تمنع بوتات البحث من فهرسة الصفحة، وبالتالي عدم ظهورها في نتائج البحث.[1][2]. تتضمن الأسباب التي قد تجعل المرء يرغب في استخدام هذه العلامة الوصفية توجيه البوتات بعدم فهرسة قاعدة بيانات كبيرة جدًا، أو صفحات الويب المؤقتة جدًا، أو صفحات الويب قيد التطوير، أو صفحات الويب التي يرغب الشخص في الاحتفاظ بها بشكل أكثر خصوصية، أو الطابعة و إصدارات الصفحات الملائمة للجوال. نظرًا لأن عبء احترام علامة noindex الخاصة بموقع الويب يقع على عاتق مؤلف بوت البحث، فقد لل يُلتزم بهذه العلامات في بعض الأحيان. كما يختلف أحيانًا تفسير علامة noindex قليلًا من شركة محرك بحث إلى أخرى.

عدم فهرسة الصفحات بأكملها

عدل
<html>
<head>
  <meta name="robots" content="noindex">
  <title>Don't index this page</title>
</head>

القيم المحتملة لمحتوى العلامة الوصفية هي: "none" و"all" و"index" و"noindex" و"nofollow" و"follow". من الممكن أيضًا الجمع بين القيم،[1] على سبيل المثال:

التوجيهات الخاصة بالبوت

عدل

يمكن تقييد توجيه noindex فقط على برامج بوت معينة عن طريق تحديد قيمة "name" مختلفة في العلامة الوصفية. على سبيل المثال، لحظر بوت غوغل على وجه التحديد،[3] حدد:

<meta name="googlebot" content="noindex">

أو، لحظر بوت بينغ، حدد:

<meta name="bingbot" content="noindex">

أو لحظر بوت بايدو، حدد:

<meta name="baiduspider" content="noindex">

ملف robots.txt

عدل

يمكن استخدام ملف robots.txt لمنع الزحف.

عدم فهرسة جزء من الصفحة

عدل

من الممكن أيضًا استبعاد جزء من صفحة الويب، على سبيل المثال نص التنقل، من الفهرسة بدلًا من الصفحة بأكملها. هناك تقنيات مختلفة للقيام بذلك. من الممكن استخدام عدة معًا. من غير المعروف أن عنكبوت الفهرسة الرئيسي في غوغل، غوغل بوت ، يتعرف على أي من هذه التقنيات.

العلامة <noindex>

عدل

قدم محرك البحث الروسي ياندكس علامة <noindex> جديدة تمنع فهرسة المحتوى بين العلامات. للسماح لكود المصدر بالتحقق من صحته، <! --noindex--> بدلاً من ذلك يمكن استخدام: [4]

<p>
Do index this text.
<noindex>Don't index this text.</noindex>
<!--noindex-->Don't index this text.<!--/noindex-->
</p>

تتعرف عناكب الفهرسة الأخرى أيضًا على علامة <noindex> ، بما في ذلك أتومز.[5]

تنسيق ميكروفورمات

عدل

توجد مواصفات مسودة تنسيقات ميكروفورمات لعام 2005 بنفس الوظيفة. يبحث ملف تعريف استبعاد البوت عن السمة والقيمة "class=robots-noindex" في علامات HTML: [6]

<p>Do index this text.</p>
<div class="robots-noindex">Don't index this text.</div>
<span class="robots-noindex">Don't index this text.</span>
<p class="robots-noindex">Don't index this text.</p>

من الممكن أيضًا الجمع بين القيم، [7] على سبيل المثال:

<div class="robots-noindex robots-follow">Text.</div>

ياهو!

عدل

في عام 2007، قدمت ياهو! وظائف مماثلة للتنسيق المصغر في عنكبوتها. ومع ذلك، فإن عنكبوت ياهو! غير متوافق من حيث أنه يبحث عن قيمة class="robots-nocontent" وعن هذه القيمة فقط: [8]

<p>Do index this text.</p>
<div class="robots-nocontent">Don't index this text.</div>
<span class="robots-nocontent">Don't index this text.</span>
<p class="robots-nocontent">Don't index this text.</p>

نقطة مشاركة

عدل

يستبعد iFilter الخاص بـ شير بوينت 2010 المحتوى الموجود داخل علامة <div> مع السمة والقيمة class="noindex". لم تُستبعد عناصر <div> الداخلية في البداية، ولكن ربما تغير هذا. ومن غير المعروف أيضًا ما إذا كان من الممكن تطبيق السمة على علامات أخرى غير <div> . [9]

<p>Do index this text.</p>
<div class="noindex">Don't index this text.</div>

تعليقات منظمة

عدل

جهاز بحث جوجل

عدل

يستخدم جهاز بحث جوجل [الإنجليزية] التعليقات المنظمة: [10]

<p>
Do index this text.
<!--googleoff: all-->
Don't index this text.
<!--googleon: all-->
</p>

تستخدم عناكب الفهرسة الأخرى أيضًا تعليقاتها المنظمة.

انظر أيضا

عدل

المراجع

عدل
  1. ^ ا ب Robots and the META element, Official W3 specification
  2. ^ About the Robots <META> tag
  3. ^ Using meta tags to block access to your site, Google Webmasters Tools Help
  4. ^ "Using HTML tags". webmaster → help. ياندكس. Section: <noindex> tag. اطلع عليه بتاريخ 2013-03-25.
  5. ^ "General Search FAQ". Help. Atomz. 2013. Section: How do I exclude parts of my site from being searched?. مؤرشف من الأصل في 2021-12-08. اطلع عليه بتاريخ 2013-03-23. Need to prevent parts of individual pages from being searched? If you want to exclude portions of a page from indexing, surround the text with <noindex> and </noindex> tags. This is useful, for example, if you want to exclude navigation text from searches.(التسجيل مطلوب) 
  6. ^ Janes، Peter (18 يونيو 2005). "Robot Exclusion Profile". Microformats. اطلع عليه بتاريخ 2013-03-24.
  7. ^ Janes، Peter (18 يونيو 2005). "Robot Exclusion Profile". Microformats. اطلع عليه بتاريخ 2013-03-24.Janes, Peter (June 18, 2005). "Robot Exclusion Profile". Microformats. Retrieved March 24, 2013.
  8. ^ Garg، Priyank (2 مايو 2007). "Introducing Robots-Nocontent for Page Sections". Yahoo! Search Blog. ياهو!. مؤرشف من الأصل في 2014-08-20. اطلع عليه بتاريخ 2013-03-23.
  9. ^ "Control Search Indexing (Crawling) Within a Page with Noindex". Microsoft Developer. مايكروسوفت. 7 يونيو 2010. مؤرشف من الأصل في 2017-11-04. اطلع عليه بتاريخ 2017-11-04.
  10. ^ "Administering Crawl: Preparing for a Crawl". Google Search Appliance. Google Inc. 23 أغسطس 2012. Section: Excluding Unwanted Text from the Index. مؤرشف من الأصل في 2012-11-23. اطلع عليه بتاريخ 2013-03-23.