البيانات الضخمة هي مجموعة من البيانات التي تجمعها المؤسسة ويمكن البحث فيها عن معلومات، ولها استخدامات تحليلية متقدمة مثل التعلم الآلي والنمذجة التنبؤية، وقد أصبحت الأنظمة التي تعالج البيانات الضخمة وتخزّنها، والأدوات المساعِدة في الاستخدامات التحليلية للبيانات الضخمة من المكونات الشائعة لأنظمة إدارة البيانات في أية مؤسسة، وتضم هذه البيانات الضخمة 3 فئات:
- بيانات منظمة في مخطط أو جدول، مثل المعاملات والكشوف المالية.
- بيانات غير منظمة ذات بنية محددة سلفًا ولا يمكن أن تحللها قواعد البيانات العادية أو نماذج البيانات، مثل المستندات والنصوص وملفات الوسائط المتعددة.
- بيانات شبه منظمة لها بعض خصائص البيانات المنظمة لكنها تظل بدون بنية قياسية، مثل سجلات خوادم الويب وبيانات البث.
وللبيانات الضخمة عدة سمات أو معايير تُقيَّم على أساسها، لكن ثمة 6 معايير أساسية تُعرَف اختصارًا بـ 6 V’s:
- الحجم Volume: أي حجم البيانات المُستقاة من ذلك العدد اللانهائي من المصادر.
- التنوع Variety: ما إذا كانت البيانات منظمة أو غير منظمة أو شبه منظمة.
- السرعة Velocity: أي مدى سرعة إنتاج البيانات الضخمة.
- الموثوقية Veracity: أي درجة الثقة الممكنة في هذه البيانات.
- القيمة Value: أي مدى نفع البيانات بالنسبة للمؤسسة.
- القابلية للتغير Variability: أي الطرق المختلفة الممكنة لصياغة البيانات أو استخدامها.
ومن أمثلة استخدامات البيانات الضخمة:
- في قطاع الطاقة: لتحديد المواقع المُحتملة للتنقيب عن النفط والغاز، ومراقبة سير العمل في خطوط الأنابيب والشبكات الكهربائية.
- في شركات الخدمات المالية: لأغراض إدارة المخاطر والتحليل الفوري لبيانات السوق.
- في شركات التصنيع والنقل: لإدارة سلاسل التوريد وتحسين مسارات النقل والتوصيل.
- استخدامات أخرى مثل الاستجابة لحالات الطوارئ ومنع وقوع الجرائم وإدارة المدن الذكية.
ولهذا الشكل الضخم من البيانات أهمية كبرى للشركات والمؤسسات حيث تمنحها ميزة تنافسية عن غيرها، حيث تساعد في اتخاذ قرارات مستنيرة وتزيد من سرعة اتخاذها، وتتجسد أهميتها في 6 عناصر أساسية:
- تحليل أفضل وأكثر تعمقًا للمستهلكين.
- تحسين سير العمل.
- ذكاء تسويقي أعلى.
- ذكاء أعلى في التوصيات واستهداف العملاء.
- إدارة رشيقة لسلاسل التوريد.
- ابتكار مستند إلى البيانات.