بحيرة بيانات

بحيرة البيانات[1] هي نظام أو مستودع للبيانات المخزنة بتنسيقها الطبيعي/الخام[2] تكون عادة كائنات كبيرة الحجم أو ملفات. يغلب أن تكون بحيرة البيانات مخزنًا واحدًا للبيانات تتضمن النسخ الأولية من بيانات النظام المصدر وبيانات الاستشعار والبيانات الاجتماعية وما إلى ذلك[3] والبيانات المحولة المستخدمة لمهام مثل إعداد التقارير والتصور والتحليلات المتقدمة وتعلم الآلة. يمكن أن تتضمن بحيرة البيانات بيانات منظمة من قواعد البيانات العلائقية (الصفوف والأعمدة)، والبيانات شبه المنظمة (القيم المفصولة بفواصل والسجلات و لغة التوصيف القابلة للتوسعة وجسون) والبيانات غير المهيكلة (مثل رسائل البريد الإلكتروني والمستندات وملفات صيغة المستندات المنقولة) والبيانات الثنائية (الصور والصوت والفِديو). [4] يمكن إنشاء بحيرة بيانات «محليًا» (داخل مراكز بيانات المؤسسة) أو «في السحابة« (باستخدام الخدمات السحابية من الموردين مثل Amazon أو Microsoft أو Oracle Cloud أو Google ).

المراجع عدل

  1. ^ معجم البيانات والذكاء الاصطناعي (PDF) (بالعربية والإنجليزية)، الهيئة السعودية للبيانات والذكاء الاصطناعي، 2022، ص. 58، QID:Q111421033
  2. ^ "The growing importance of big data quality". The Data Roundtable. 21 نوفمبر 2016. مؤرشف من الأصل في 2023-04-22. اطلع عليه بتاريخ 2020-06-01.
  3. ^ "What is a data lake?". aws.amazon.com. مؤرشف من الأصل في 2023-07-31. اطلع عليه بتاريخ 2020-10-12.
  4. ^ Campbell، Chris. "Top Five Differences between DataWarehouses and Data Lakes". Blue-Granite.com. مؤرشف من الأصل في 2023-03-30. اطلع عليه بتاريخ 2017-05-19.