بيانات مظلمة

 البيانات المظلمة[1] هي البيانات التي يتم الحصول عليها من خلال مختلف بيانات شبكة الكمبيوتر، ولكنها لا تستخدم في أي طريقة استخلاص رؤى أو صنع القرار.[2][3] قدرة الشركة على جمع البيانات يمكن أن يتجاوز الإنتاجية التي نحتاجها في تحليل البيانات. في بعض الحالات قد لا تكون الشركة حتى على علم أن البيانات يتم جمعها.[4]  التقديرات تشير إلى أن ما يقرب من 90 في المئة من البيانات التي تم إنشاؤها بواسطة أجهزة الاستشعار وأجهزة التحويل التناظرية إلى الرقمية التحويلات لم تستخدم.[5]

يزعم أن معالجات IBM Watson يمكن استخدامها في تحليل البيانات المظلمة.

في المختصر البيانات المظلمة يمكن أن تتضمن المعلومات التي تجمعها أجهزة الاستشعار والمعلوماتية.[6]

الشركات تحتفظ بالبيانات المظلمة للعديد من الأسباب، ويقدر أن معظم الشركات تحلل 1% من البيانات الخاصة بهم.[7] في كثير من الأحيان يتم تخزينها من أجل الامتثال التنظيمي[8] وحفظ السجلات. وتعتقد بعض المنظمات أن البيانات المظلمة يمكن أن تكون مفيدة لهم في المستقبل عندما يحصلوا على تكنولوجيا أفضل في التحليل وذكاء الأعمال.[9] بسبب أن عملية التخزين غير مكلفة، يمكن تخزين البيانات بسهولة ويسر. ومع ذلك، تخزين وتأمين البيانات عادة ما ينطوي على زيادة النفقات (أو حتى خطر) من احتمال عودة الربح.

التحليل عدل

الكثير من البيانات المظلمة غير مهيكلة، وهو ما يعني أن المعلومات في صيغ  قد يكون من الصعب تصنيفها، أو قراءتها من خلال جهاز الكمبيوتر ومن ثم تحليلها. غالبا ما يكون السبب في أن الأعمال لا تقوم بتحليل  البيانات المظلمة بسبب كمية الموارد التي تستهلكها وصعوبة وجود هذه البيانات وتحليلها. وفقا ادورية الكمبيوتر الأسبوعية 60% من المنظمات يعتقدون أن تقنيات ذكاء الأعمال الخاصة بهم «غير كافية» و 65% يقولون أن لديهم «إلى حد ما نهج إدارة المحتوى غير المنظم».[10]

العديد من الشركات في هذا القطاع تبحث في إنشاء «أنظمة الكمبيوتر الإدراكية» التي هي قادرة على تحليل منظم للبيانات المظلمة. فإن أنظمة IBM Watson يعتبر من الأنظمة في المستقبل التي من شأنها أن تكون قادرة على تحليل هذه البيانات غير المهيكلة وتكون قادرة على نتائج مجدية من شأنها الاستفادة من الكثير من البيانات المظلمة، لكن في الوقت الحاضر  إما أن يكون من المستحيل أو من الصعب جدا القيام بهذا الأمر.[11] من حيث النظم الحالية، IBM أعان عن نظام عنها IBM سبارك، «يمكن استخراج الرؤى من هذه المعلومات على تقريبا. ما يمكن الشركات من بناء منتجات البيانات الغنية، والخدمات التي تستخدم تلك المعلومات إلى تحويل تجربة العملاء.» وعلاوة على ذلك، أنها تعطي تعريفا أوسع حتى من البيانات المظلمة، كما يتضمن البيانات التي لا يتم تنفيذها حاليا من قبل أنظمة الحوسبة ولكن يمكن أن يكون، على سبيل المثال في القانون.

العلاقة مع البيانات المظلمة عدل

بيانات مفيدة قد تصبح بيانات مظلمة بعد أن تصبح غير ذات صلة، كما أنها ليست معالجة سريعة بما فيه الكفاية. وهذا ما يسمى «الرؤى القابلة للتلف» في «تدفق البيانات الحي». على سبيل المثال الموقع الجغرافي لأحد العملاء، ومن المعروف أن الأعمال التجارية يمكن أن تجعل العرض على أساس الموقع، ومع ذلك إذا كانت هذه البيانات يتم معالجتها على الفور، قد تكون في غير محلها في المستقبل. وفق IBM حوالي 60 في المئة من البيانات تفقد قيمتها على الفور.  تحليل البيانات فورا وتركها تتحول إلى 'مظلمة' يمكن أن يؤدي إلى خسائر كبيرة للمنظمة من حيث لا يمكن تحديد الهوية.[12]

التخزين عدل

وفقا لصحيفة نيويورك تايمز90% من الطاقة المستخدمة من قبل مراكز البيانات يضيع.[13] إذا لم تكن البيانات المخزنة، تكاليف الطاقة يمكن توفيرها. وعلاوة على ذلك، هناك تكاليف مرتبطة بالمعلومات  تحت الاستخدام وبالتالي الفرص الضائعة. وفقا لداتا ماشن (مؤسسة نرويجية) «منظمات بيئات التخزين من أوروبا والشرق الأوسط تتكون من 54 في المئة البيانات المظلمة، 32 في المئة زائدة، بيانات عفا عليها الزمن وتافهة، و 14 في المئة بيانات الأعمال الهامة. بحلول عام 2020، يمكن أن تضيف ما يصل إلى مبلغ 891 مليار دولار في تخزين وإدارة التكاليف التي يمكن تجنبها.»[14]

التخزين المستمر للبيانات المظلمة يمكن ان يضع المؤسسة في خطر، خاصة إذا كانت هذه البيانات حساسة. في حالة خرق هذا يمكن أن يؤدي إلى مضاعفات خطيرة. يمكن أن تكون مصاعفات مالية وقانونية خطيرة، قد يضر بسمعة المنظمة. على سبيل المثال، خرق سجلات خاصة من العملاء يمكن أن يؤدي إلى سرقة المعلومات الحساسة التي يمكن أن يؤدي إلى سرقة الهوية. مثال آخر يمكن أن يكون خرق شركة تملك معلومات حساسة، على سبيل المثال فيما يتعلق بالبحث والتطوير. هذه المخاطر يمكن تخفيفها عن طريق تقييم ومراجعة ما إذا كانت هذه البيانات مفيدة مع استخدام التشفير القوي والأمن، إذا ثبت إمكانية التخلص منها، فينبغي أن يتم التخلص منها بطريقة غير قابلة للاستعادة.[15]

المستقبل عدل

يعتبر عموما أنه مع تقدم أنظمة الحوسبة من أجل تحليل البيانات، سترتفع قيمة البيانات المظلمة. وقد لوحظ أن «البيانات والتحليلات ستكون الأساس للثورة الصناعية الحديثة». طبعا هذا يتضمن البيانات التي تعتبر حاليا «مظلمة» حيث ليس هناك ما يكفي من الموارد. كل هذه البيانات التي يتم جمعها يمكن أن تستخدم في المستقبل لتحقيق أقصى قدر من الإنتاجية والقدرة لدى الشركات لتلبية المستهلكين. علاوة على ذلك، العديد من الشركات لا يدركون قيمة البيانات المظلمة الآن، على سبيل المثال في مجال الرعاية الصحية والتعليم، فالشركات التي تتعامل مع كميات كبيرة من البيانات تساعد في «خدمة الطلاب والمرضى في الطريقة الاستهلاكية والخدمات المالية لتحقيق هدفهم السكان».[16]

المراجع عدل

  1. ^ معجم البيانات والذكاء الاصطناعي (PDF) (بالعربية والإنجليزية)، الهيئة السعودية للبيانات والذكاء الاصطناعي، 2022، ص. 56، QID:Q111421033
  2. ^ "Dark Data". Gartner. مؤرشف من الأصل في 2019-03-31.
  3. ^ Ed Tittel (24 سبتمبر 2014). "The Dangers of Dark Data and How to Minimize Your Exposure". CIO. مؤرشف من الأصل في 2019-01-15.
  4. ^ "The API Briefing: the Challenge of Government's Dark Data". digitalgov.gov. مؤرشف من الأصل في 2018-01-16.
  5. ^ "Digging up dark data: What puts IBM at the forefront of insight economy | #IBMinsight". SiliconANGLE (بالإنجليزية الأمريكية). Archived from the original on 2018-07-11. Retrieved 2015-11-03.
  6. ^ Teradata. "TeradataVoice: Factories Of The Future: The Value Of Dark Data". Forbes. مؤرشف من الأصل في 2016-08-02.
  7. ^ The big data challenge of transformation for the manufacturing industry نسخة محفوظة 06 مارس 2018 على موقع واي باك مشين.
  8. ^ Are you using your dark data effectively نسخة محفوظة 16 يناير 2017 على موقع واي باك مشين.
  9. ^ "Dark Data: What is it and Why Should I Care?". www.r1soft.com. مؤرشف من الأصل في 2017-11-13. اطلع عليه بتاريخ 2015-11-02.
  10. ^ "Dark data could halt big data's path to success". ComputerWeekly. مؤرشف من الأصل في 2019-04-10. اطلع عليه بتاريخ 2015-11-03.
  11. ^ "IBM Cognitive Colloquium Spotlights Uncovering Dark Data - InformationWeek". InformationWeek. مؤرشف من الأصل في 2018-12-29. اطلع عليه بتاريخ 2015-11-03.
  12. ^ Gutierrez، Daniel. "Deriving Value from Data Before It Goes Dark". insideBIGDATA. مؤرشف من الأصل في 2018-08-13. اطلع عليه بتاريخ 2015-11-04.
  13. ^ Glanz، James (22 سبتمبر 2012). "Data Centers Waste Vast Amounts of Energy, Belying Industry Image". The New York Times. ISSN:0362-4331. مؤرشف من الأصل في 2019-05-16. اطلع عليه بتاريخ 2015-11-02.
  14. ^ "Enterprises are Hoarding 'Dark' Data: Veritas - Datamation". www.datamation.com. مؤرشف من الأصل في 2017-10-04. اطلع عليه بتاريخ 2015-11-04.
  15. ^ "The Dangers of Dark Data and How to Minimize Your Exposure". CIO. مؤرشف من الأصل في 2019-01-15. اطلع عليه بتاريخ 2015-11-02.
  16. ^ "Leveraging Dark Data: Q&A with Melissa McCormack - Predictive Analytics Times - predictive analytics & big data news". Predictive Analytics Times (بالإنجليزية الأمريكية). Archived from the original on 2019-04-14. Retrieved 2015-11-04.