سايت سير إكس (بالإنجليزيةCiteSeerX ) (المعروف سابقًا باسم CiteSeer ) هو محرك بحث عام ومكتبة رقمية للأوراق العلمية والبحثية، خاصة في مجالات علوم الحاسوب وعلم المعلومات.

سايت سير إكس
معلومات عامة
المنظمة الرئيسية
الموضوع الرئيس
لغة البرمجة
مستودع الشفرة المصدرية
موقع الويب
citeseerx.ist.psu.edu (الإنجليزية) عدل القيمة على Wikidata
الرخصة

يهدف محرك البحث سايت سير إلى تحسين النشر والوصول للمؤلفات الأكاديمية والعلمية. ويقدمها خدمة غير ربحية التي يمكن استخدامها بحرية من الجميع، واعتبر جزءاً من حركة الوصول المفتوح التي تحاول تغيير وسيلة النشر العلمية والبحثية للسماح بوصول أكبر للمؤلفات العلمية. قدم سايت سير البيانات الوصفية لمبادرة الأرشفة المفتوحة لجميع المستندات المفهرسة وروابط المستندات المفهرسة مجاناً عندما كان ذلك متاحاً لمصادر أخرى للبيانات الوصفية مثل الببليوغرافيا الرقمية ومشروع المكتبة وبوابة جمعية آلات الحوسبة لتعزيز فكرة البيانات المفتوحة، كما يشارك بياناته لأغراض غير تجارية بموجب رخص المشاع الإبداعي.[5]

يعد سايت سير سلفاً لأدوات البحث الأكاديمية مثل جوجل سكولار ومحرك مايكروسوفت الأكاديمي.[6] تجمع محركات البحث شبيهات سايت سير عادةً وتؤرشف المستندات المتاحة للعموم في المواقع، ولا تدخل مواقع الناشرين. لهذا السبب، تكون ملفات الكُتَّاب المتاحة بشكل مجاني الأكثر تواجداً في الفهرس.

غير هذا الموقع اسمه إلى ريسيرش إنديكس (فهرس البحث) في أحد المراحل ومن ثم أعاده إلى الاسم الأول.[7]

نبذة تاريخية

عدل

CiteSeer و CiteSeer.IST

عدل

أنشأ الباحثون لي جايلز وكيرت بولاكر وستيف لورانس محرك البحث سايت سير عام 1997 أثناء وجودهم في معهد أبحاث NEC (الآن مختبرات NEC )، في مدينة برينستون، في نيو جيرسي في الولايات المتحدة الأمريكية. كان هدف من إنشائه هو الدخول إلى الوثائق الأكاديمية والعلمية على الويب وحصادها واستخدام فهرسة الاقتباس المستقلة للسماح بالاستعلام عن طريق الاستشهاد أو المستند، وترتيبها حسب تأثير الاستشهاد.

أصبح محرك البحث متاحاً للعموم عام 1998 وامتلك العديد من الميزات التي لم تكن متاحة في محركات البحث العادية أنذاك، وتتضمن:

  • الفهرسة الذاتية التلقائية التي تنشئ فهرس استشهادات يمكن استخدامه للبحث في المؤلفات وتقييمها.
  • يمكن حساب إحصائيات الاستشهاد والوثائق ذات الصلة لجميع المقالات المذكورة في قاعدة البيانات، وليس فقط المقالات المفهرسة.
  • ربط مرجعي يسمح بتصفح قاعدة البيانات باستخدام روابط الاستشهاد.
  • يظهر فهرس الاستشهاد فهرس الاستشهادات في ورقة محددة، مما يسمح للباحث أن يتصفح بسرعه وسهولة ما يقوله الباحثون حول مقال مهم.
  • تعرض الوثائق ذات الصلة باستخدام الاستشهاد والمقاييس القائمة على الكلمات ويتم عرض ببليوغرافيا نشطة ومحدثة باستمرار لكل وثيقة.

حصل سايت سير على براءة اختراع أمريكية برقم # 6289342 ، بعنوان " فهرسة الاقتباس الذاتي وتصفح الأدب باستخدام سياق الاستشهاد " ، في 11 سبتمبر 2001. أودعت براءة الاختراع في 20 مايو 1998 ، ولها الأولوية في 5 يناير 1998. براءة اختراع مستمرة (براءة الاختراع الأمريكية رقم 6738780) في 16 مايو 2001 ، ومُنح في 18 مايو 2004.


بعد مختبرات إن أي سي الاميركية، استضافته الشبكة العنكبوتية العالمية باسم CiteSeer.IST عام 2004 من كلية علوم وتكنولوجيا المعلومات، جامعة ولاية بنسلفانيا ، ويحوي أكثر من 700000 وثيقة. لتعزيز الوصول والأداء والبحث، تم دعم إصدارات مماثلة من سايت سير في جامعات مثل معهد ماساتشوستس للتكنولوجيا وجامعة زيورخ وجامعة سنغافورة الوطنية . ومع ذلك ، ثبت أن هذه الإصدارات من محرك البحث صعبة الصيانة ولم تعد متوفرة. نظرًا لأن سايت سير لا يقوم إلا بفهرسة الأوراق المتاحة مجانًا على الويب وليس لديه إمكانية الوصول إلى البيانات الوصفية للناشر، فإنه يعرض عددًا أقل من الاقتباسات من المواقع ، مثل الباحث العلمي من جوجل ، الذي يحتوي على بيانات تعريف للناشر.

لم يحدث سايت سير بشكل كامل منذ عام 2005 بسبب القيود في تصميمه الهندسي. كان يحتوي على عينة تمثيلية من وثائق البحث في علوم الحاسوب والمعلوماتية، ولكنه كان محدودًا في التغطية لأنه كان مقصورًا على الأوراق المتاحة للعامة، عادةً على الصفحة الرئيسية للمؤلف ، أو تلك التي قدمها المؤلف. للتغلب على بعض هذه القيود ، تم تصميم بنية معيارية ومفتوحة المصدر لـ CiteSeer - CiteSeer X.

CiteSeerX

عدل

حل CiteSeer X محل CiteSeer وأعيد توجيه جميع الاستعلامات إلى الموقع الجديد.[8] CiteSeerX هو محرك بحث عام ومكتبة رقمية ومستودع للأوراق العلمية والأكاديمية بشكل أساسي المتعلقة بعلوم الحاسوب وعلم المعلومات.[8] فيما توسع مجال عمل محرك البحث مؤخرًا ليشمل مجالات علمية أخرى مثل الاقتصاد والفيزياء وغيرها. أُصدِر عام 2008 ، وكان يعتمد بشكل كبير على محرك بحث CiteSeer السابق والمكتبة الرقمية، كما طُوِّر ببنية أساسية جديدة مفتوحة المصدر، تعتمد على حزمة سير SeerSuite، وخوارزميات جديدة وتطبيقاتها. طورَّه الباحثان إسحاق كونسيل و لي جايلز في كلية علوم وتقنية المعلومات، في جامعة ولاية بنسلفانيا . وتواصل دعم الأهداف التي حددتها CiteSeer لتتبع ارتباطات وحصاد الوثائق الأكاديمية والعلمية على شبكة الويب العامة واستخدام استعلام الاقتباس من خلال الاستشهادات وترتيب المستندات حسب تأثير الاستشهادات. طوره ومازال يساهم في تطويره كل من لي جايلز وبراسينجيت ميترا وسوزان جوش ومين-ين كان وبراديب تيريجودا وخوان بابلو فرنانديز راميريز وبكتادا تريراتبيتوك وجيان وو ودوغلاس جوردان وستيف كارمان وجاك كارول وجيم يانسن وشويى زينج. في الآونة الأخيرة ،أضيفت ميزة البحث المجدول.[9] تموله مؤسسة العلوم الوطنية وناسا وأبحاث مايكروسوفت.

مازال محرك البحث CiteSeer X يصنف ضمن أفضل مستودعات التخزين عالمياً، فيما حصد المرتبة الأولى في يوليو 2010،[10] ويملك حالياً أكثر من 6 ملايين وثيقة مع ما يقارب ستة ملايين مؤلف فريد و 120 مليون استشهاد. يشارك هذا المحرك برمجياته وبياناته وقواعدها وبياناته الوصفية مع باحثين آخرين بواسطة أمازون إس 3 و rsync.[11] صممت هيكليته وبرمجياته المعيارة مفتوحة المصدر الجديدة على Apache Solr وأدوات أباتشي الأخرى وغيرها من الأدوات مفتوحة المصدر التي تسمح باختبار الخوارزميات الجديدة في تجميع وتصنيف وفهرسة واستخلاص المعلومات. كانت برمجتمع متاحاً سابقاً على سورس فورج لكنها نقلت وأصبحت الآن على غيت هاب.

يخزن محرك البحث CiteSeer X بعض الملفات التي مسحها ضوئياً بصيغة كتاب إلكتروني، وتتضمن كل صفحة من الملف رابط قانون الألفية للملكية الرقمية الذي يمكن استخدامه للإبلاغ عن انتهاكات حقوق النشر.[12]

ميزات محرك البحث

عدل

الاستخراج الآلي للمعلومات

عدل

يستخدم CiteSeer X أدوات استخراج المعلومات المؤتمتة ، والتي عادةً ما تكون مبنية على أساليب التعلم الآلي مثل ParsCit ، لاستخراج البيانات الوصفية للوثائق العلمية مثل العنوان والمؤلفين والملخص والاستشهادات وما إلى ذلك. على هذا النحو ، هناك أخطاء في بعض الأحيان في المؤلفين والعناوين. محركات البحث الأكاديمية الأخرى لديها أخطاء مماثلة.

الزحف المركز

عدل

يقوم CiteSeer X بالزحف إلى المستندات العلمية المتاحة للعموم بشكل أساسي من صفحات الويب الخاصة بالمؤلف والموارد المفتوحة الأخرى ، وليس لديه حق الوصول إلى البيانات الوصفية للناشر. على هذا النحو ، فإن عدد الاقتباسات في CiteSeer X عادة ما يكون أقل من تلك الموجودة في جوجل سكولار و محرك البحث الأكاديمي من مايكروسوفت الذين لديهم حق الوصول إلى البيانات الوصفية للناشر.

البيانات

عدل

تشارك بيانات CiteSeer X بانتظام بموجب ترخيص المشاع الإبداعي غير التجاري، الترخيص بالمثل مع الباحثين في جميع أنحاء العالم، وتستخدم في العديد من التجارب والمسابقات الأخرى. بفضل نقطة التجميع لمحرك البحث CiteSeer X بالتي هي بروتوكول مبادرة الأرشيف المفتوح لحصاد البيانات الوصفية، [13] فإن هذا المحرك هو أرشيف حر وتفهرس محتوياته لتكون مستودعاً مؤسسياً لمحركات البحث الأكاديمية، على سبيل المثال مستخدمي محرك البحث BASE و Unpaywall.

الاستعمال

عدل

لدى CiteSeer X ما يقرب من مليون مستخدم في جميع أنحاء العالم بناءً على عناوين بروتوكلات إنترنت فريدة ويحصد ملايين الزيارات يوميًا. بلغ عدد التنزيلات السنوية لملفات الكتب الإلكتروينة الخاصة بالوثائق ما يقرب من 200 مليون في عام 2015.

محركات البحث الأخرى المبنية على حزمة سير

عدل

وُسِّع نموذج محرك البحث سايت سير ليشمل الوثائق الأكاديمية في الأعمال التجارية مع SmealSearch وفي الأعمال التجارية الإلكترونية مع eBizSearch. ومع ذلك ، لم يتم الحفاظ عليها من قبل رعاتهم. يمكن العثور على نسخة قديمة من كلاهما في BizSeer.IST لكنه لم يعد في الخدمة. كما أنشئت أنظمة بحث ومستودعات أخرى تشبه سير للكيميا ، Chem X Seer وعلم الآثار ، ArchSeer. تم إنشاء ملف آخر للبحث عن ملفات robots.txt ،وهو BotSeer . كل هذه الأشياء مبنية على أداة مفتوحة المصدر SeerSuite ، والتي تستخدم مفهرس مفتوح المصدر لوسين .

انظر أيضاً

عدل

المراجع

عدل
  1. ^ وصلة مرجع: http://csxstatic.ist.psu.edu/home. الوصول: 24 يناير 2019.
  2. ^ "Open Access Directory". جامعة سيمونز. اطلع عليه بتاريخ 2019-11-17.
  3. ^ "The citeseerx Open Source Project on Open Hub: Languages Page". اطلع عليه بتاريخ 2018-02-19.
  4. ^ وصلة مرجع: https://github.com/SeerLabs/CiteSeerX/blob/master/LICENSE.txt.
  5. ^ "CiteSeerX Data Policy". مؤرشف من الأصل في 2012-01-05. اطلع عليه بتاريخ 2015-11-10.
  6. ^ Kodakateri Pudhiyaveetil، Ajith؛ Gauch، Susan؛ Luong، Hiep؛ Eno، Josh (2009). "Conceptual recommender system for CiteSeerX". ACM Press. New York, New York, USA: 241. DOI:10.1145/1639714.1639758. ISBN:978-1-60558-435-5. مؤرشف من الأصل في 2022-10-19.
  7. ^ Lawrence، Steve (2001). "ResearchIndex: Inside the world's largest free full-text index of scientific literature". Proceedings of the international conference on Knowledge capture - K-CAP 2001. ص. 3. DOI:10.1145/500737.500740. ISBN:1581133804. S2CID:19592721.
  8. ^ ا ب "About CiteSeerX". مؤرشف من الأصل في 2010-07-22. اطلع عليه بتاريخ 2010-05-07.
  9. ^ "The CiteSeerX Team". Pennsylvania State University. مؤرشف من الأصل في 2018-07-26. اطلع عليه بتاريخ 2018-05-01.
  10. ^ "Ranking Web of World Repositories: Top 800 Repositories". Cybermetrics Lab. يوليو 2010. مؤرشف من الأصل في 2010-07-24. اطلع عليه بتاريخ 2010-07-24.
  11. ^ "About CiteSeerX Data". Pennsylvania State University. مؤرشف من الأصل في 2012-01-05. اطلع عليه بتاريخ 2012-01-25.
  12. ^ For example, "CiteSeerx – DMCA Notice". مؤرشف من الأصل في 2022-03-18. The document with the identifier "10.1.1.604.4916" has been removed due to a DMCA takedown notice. If you believe the removal has been in error, please contact us through the feedback page, along with the identifier mentioned in this page. {{استشهاد بدورية محكمة}}: الاستشهاد بدورية محكمة يطلب |دورية محكمة= (مساعدة)
  13. ^ Hirst، Tony (8 ديسمبر 2011). "Using OAI-PMH as a Single Record Level Query Interface to Citeseer". مؤرشف من الأصل في 2020-11-24. اطلع عليه بتاريخ 2020-04-25.

قراءة معمقة

عدل

وصلات خارجية

عدل