جوجل بوت: الفرق بين النسختين

تم إضافة 2٬382 بايت ، ‏ قبل 11 شهرًا
لا يوجد ملخص تحرير
ط (بوت:إصلاح رابط (1))
وسم: تعديل مصدر 2017
{{بطاقة برمجية}}
| الاسم = جوجل بوت
| الاسم الأصلي = Googlebot
| الشعار = Google 2015 logo.svg
| لقطة =
| تعليق =
| لقطة طويلة =
| المؤلف = [[جوجل]]
| المطور = [[جوجل]]
| الإصدار =
| آخر إصدار =
| تاريخ آخر إصدار =
| آخر إصدار تجريبي =
| تاريخ آخر إصدار تجريبي =
| تحديد متواتر =
| لغة البرمجة =
| نظام التشغيل =
| المنصة =
| الحجم =
| لغات =
| الحالة =
| النوعية = [[زاحف الشبكة]]
| الترخيص =
| الموقع = [https://developers.google.com/search/docs/advanced/crawling/googlebot Googlebot FAQ]
}}
 
جوجل بوت {{إنج|Googlebot}} هو برنامج من نوع [[زاحف الشبكة]] والذي تستخدمه جوجل، حيث يقوم بجمع المستندات من [[شبكة عنكبوتية عالمية|الويب]] لإنشاء فهرس يمكن البحث فيه لمحرك بحث جوجل. يُستخدم هذا الاسم للإشارة إلى نوعين مختلفين من برامج زاحف الشبكة: زاحف سطح المكتب (لمحاكاة مستخدمي سطح المكتب) وزاحف الجوال (لمحاكاة مستخدم الهاتف).<ref>{{Cite web|url=https://support.google.com/webmasters/answer/182072?hl=en|title=Googlebot|last=|first=|date=2019-03-11|website=Google|accessdate=2019-03-11}}</ref>
'''جوجل بوت''' أو '''غوغل بوت''' (زواحف جوجل أو عناكب جوجل) {{إنج|Googlebot}} هو [[روبوت|بوت]] وظيفته التغلغل داخل مواقع الويب وفهرسة الكلمات الموجودة فيها، بحيث يظهر الموقع في نتائج [[محرك بحث|محرك البحث]] [[بحث جوجل|جوجل]] إذا توفرت فيه الكلمة المبحوث عنها.<ref>{{استشهاد ويب|عنوان=Googlebot's Javascript Interpreter: A Diagnostic|مسار=http://www.thegooglecache.com/white-hat-seo/googlebots-javascript-interpreter-a-diagnostic/| مسار أرشيف = https://web.archive.org/web/20170518193212/http://www.thegooglecache.com/white-hat-seo/googlebots-javascript-interpreter-a-diagnostic/ | تاريخ أرشيف = 18 مايو 2017 }}</ref><ref>{{استشهاد ويب|عنوان=How Googlebot crawls JavaScript|مسار=http://searchengineland.com/tested-googlebot-crawls-javascript-heres-learned-220157/| مسار أرشيف = https://web.archive.org/web/20180615152854/https://searchengineland.com/tested-googlebot-crawls-javascript-heres-learned-220157 | تاريخ أرشيف = 15 يونيو 2018 }}</ref><ref>[https://www.webcitation.org/5Zc32GZiy?url=http://ipid.shat.net/ WebCite query result<!-- عنوان مولد بالبوت -->] {{Webarchive|url=https://web.archive.org/web/20171112201018/https://www.webcitation.org/5Zc32GZiy?url=http://ipid.shat.net/ |date=12 نوفمبر 2017}}</ref>
 
== طريقة عمله ==
أغلب مواقع [[محرك بحث|محركات البحث]] تقوم بواسطة برنامج يسمى [[عنكبوت ويب]] «web spider» بتجميع قوائم بالكلمات الموجودة على الشبكة وتسمى هذه العملية [[زحف ويب]] «web crawling»، وبذلك فعندما تبحث عن كلمة معينة فأنها تبحث عنها في تلك القوائم المعدة من قبل العنكبوت.
من المحتمل أن يتم الزحف إلى موقع ويب بواسطة كل من جوجل بوت سطح المكتب و جوجل بوت الجوال. يمكن التعرف على النوع الفرعي لبرنامج جوجل بوت من خلال النظر في سلسلة وكيل المستخدم في الطلب. ومع ذلك، يلتزم كِلا نوعي الزاحف برمز المنتج نفسه (الرمز المميز المفيد) في ملف robots.txt، وبالتالي لا يستطيع المطور استهداف جوجل للجوال أو جوجل لسطح المكتب باستخدام ملف robots.txt بشكل انتقائي.
 
إذا رغب [[مدير موقع|مشرف الموقع]] في تقييد المعلومات الموجودة على موقعه المتاح لبرنامج جوجل بوت، أو [[زاحف الشبكة|عنكبوت]] آخر حسن التصرف، فيمكنه القيام بذلك باستخدام التوجيهات المناسبة في ملف [[معيار استبعاد الروبوتات|robots.txt]] ،<ref name="tools">{{cite web|url=https://search.google.com/search-console/about|title=Google Search Console|last=|first=|date=|website=Google.com|access-date=}}</ref> أو عن طريق إضافة {{وإو|العلامة الوصفية|Meta element}} <code><nowiki><meta name="Googlebot" content="nofollow" /></nowiki></code> إلى صفحة الويب.<ref>{{Cite web|url=https://search.google.com/search-console/about|title=Google Search Console|website=search.google.com|access-date=2019-03-11}}</ref> يمكن التعرف على طلبات جوجل بوت إلى [[خادم ويب|خوادم الويب]] من خلال سلسلة {{وإو|وكيل مستخدم|User agent}} تحتوي على "جوجل بوت" وعنوان مضيف يحتوي على "googlebot.com".
لو أراد [[مدير موقع|مشرف محرك بحث]] «webmaster» تقيد بعض المعلومات على المواقع التي يشرف عليها بمنع [[زاحف الشبكة|زواحف محركات البحث أو العناكب]] مثل غوغل بوت فإنه يقوم بذلك عن طريق التوجيهات المناسبة من خلال ملف «robot.txt» وهو [[معيار استبعاد الروبوتات]]،<ref name="tools">
{{استشهاد ويب|عنوان=Webmaster Tools |مسار=https://support.google.com/answer/182072?hl=en-GB | مسار أرشيف = https://web.archive.org/web/20090309155500/http://www.google.co.uk:80/intl/en_uk/webmasters/bot.html | تاريخ أرشيف = 9 مارس 2009 | وصلة مكسورة = yes }}
</ref> أو عن طريق إضافة [[عنصر بيانات وصفية]] «Meta Tag» التالي لصفحة الويب المطلوبة :<ref name="tools"/>
<div dir="ltr">
<code><nowiki><meta name="Googlebot" content="nofollow" /></nowiki></code>
</div>
 
حاليًا، يتبع جوجل بوت [[عنصر (لغة ترميز النص الفائق)|روابط المواقع]] وروابط الملفات..<ref name="tools"/> هناك أدلة متزايدة على أن جوجل بوت يمكنه تشغيل أكواد جافا سكريبت وتحليل المحتوى الناتج عن أكواد [[أجاكس]] أيضًا.<ref>{{Cite web|title=Understand the JavaScript SEO basics {{!}} Search for Developers|url=https://developers.google.com/search/docs/guides/javascript-seo-basics|access-date=2020-07-26|website=Google Developers|language=en}}</ref> هناك العديد من النظريات المتعلقة بمدى تقدم قدرة جوجل بوت على معالجة جافا سكريبت، وتتراوح الآراء بين الحد الأدنى من القدرة المستمدة من مترجمين مخصصين.<ref>{{cite web|url=https://www.youtube.com/watch?v=LXF8bM4g-J4|title=How Google Search indexes JavaScript sites - JavaScript SEO|last=Splitt|first=Martin|website=YouTube|url-status=live|archive-url=|archive-date=|access-date=}}</ref> حاليًا، يستخدم جوجل بوت خدمة عرض الويب (WRS) والتي تستند إلى محرك عرض [[كروميوم (متصفح ويب)|كروميوم]] (الإصدار 74 بتاريخ 7 مايو 2019).<ref>{{Cite web|url=https://webmasters.googleblog.com/2019/05/the-new-evergreen-googlebot.html|title=The new evergreen Googlebot|website=Official Google Webmaster Central Blog|language=en|access-date=2019-06-07}}</ref> يكتشف جوجل بوت الصفحات عن طريق تجميع جميع الروابط في كل صفحة يعثر عليها. ثم يقوم بتتبع هذه الروابط إلى صفحات الويب الأخرى. يجب ربط صفحات الويب الجديدة من صفحات أخرى معروفة على الويب ليتم الزحف إليها وفهرستها أو إرسالها يدويًا بواسطة مشرف الموقع.
== طريقة عمل هذا العنكبوت ==
 
غالبًا ما يلاحظ مُشرفي المواقع الذين لديهم [[استضافة الويب|خطط استضافة ويب]] ذات نطاق بيانات منخفض أن جوجل بوت يستهلك قدرًا هائلاً من نطاق البيانات. وقد يتسبب ذلك في تجاوز مواقع الويب لحد النطاق الترددي وإزالتها مؤقتًا. هذا أمر مزعج بشكل خاص {{وإو|موقع متطابق|Mirror site|نص=للمواقع المتطابقة}} والتي تستضيف مساحة كبيرة بمقياس [[جيجابايت]] من البيانات. توفر جوجل خدمة "[[أدوات مشرفي محركات البحث جوجل|تحكم البحث]]" والتي تتيح لمالكي مواقع الويب التحكم في معدل الزحف.<ref>{{cite web|url=https://www.google.com/webmasters/|title=Google - Webmasters|publisher=Google.com |date= |accessdate=2012-12-15}}</ref>
# تقوم أولاً هذه العناكب بزيارة [[خادم (توضيح)|الخوادم]] التي تتمتع بعدد كبير من الزيارات (عليها ضغط) والمواقع المشهورة.
# ثم يقوم بتفصيل الكلمات في هذا الموقع والمواقع الأخرى وبزيارة جميع الوصلات في معظم المواقع، وبذلك يكون العنكبوت قد زار معظم المواقع وجميع الوصلات الموجودة بها وقام بتصنيف شامل لجميع الكلمات الموجودة بها وهذه الطريقة متبعه من قبل موقع [[جوجل]] الشهير وبحسبة بسيطه إذا علمنا ان كل عنكبوت يستطيع تصفح 25 صفحة بالثانية بذلك إذا قمنا بتشغيل 4 عناكب فاننا نحصل على 100 صفحة بالثانية والتي ينتج عنها حوالي 600 [[كيلوبايت|كيلو بايت]] في الثانية.
 
وبذلك يمكننا ان نتصور الكم الهائل من المعلومات يتم تجميعه في الثانية الواحدة بالنسبة لموقع مثل جوجل.
 
== مراجع ==
 
{{مراجع}}
 
== وصلات خارجية ==
 
* [https://support.google.com/webmasters/answer/182072 موقع جوجل بوت الرسمي]