زاهر هاشم
في أكتوبر 2015 وصل يورجن كلوب إلى تدريب فريق ليفربول الإنجليزي قادمًا من بروسيا دورتموند الألماني، وكان الفريق الإنجليزي الذي يمتلك فريقًا علميًا متخصصًا لتحليل البيانات، قد اعتمد على معطيات البيانات في اتخاذ قرار التوقيع مع كلوب.
وكان فريق تحليل البيانات في ليفربول بقيادة “إيان جراهام” الحاصل على دكتوراة في الفيزياء النظرية، قد استنتج أنه رغم الخسارة والأداء المخيب للآمال لفريق دورتموند في الدوري الألماني، فقد لعب دورتموند جيدًا ولكن الأداء لم يتطابق مع النتائج، وأن المدرب كلوب ليس مسئولًا عن تلك النتائج.
ويدرك فريق تحليل البيانات، أن كل تفصيلة داخل الملعب تؤثر في التسجيل عبر معرفة التفاصيل واستخدامها للتميز على المنافسين.
وكان جراهام الذي تمكن من بناء قاعدة بيانات تضم نحو 10 آلاف لاعب، قد أوصى ليفربول بضم اللاعب المصري “محمد صلاح” بناءً على أدائه خلال فترة لعبه سابقًا مع فريق تشيلي، وهذا ما حصل باستحواذ الفريق الإنجليزي على اللاعب المصري مقابل 42 مليون يورو.
لقد قاد تحليل البيانات الفريق الإنجليزي لزعامة القارة الأوربية وليصبح رقمًا صعبًا أمام الفرق المحلية والأوربية، ولعل هذه المقدمة تعطينا مثالًا واضحًا عن أهمية جمع البيانات وتحليلها في اتخاذ القرارات الصائبة وتحقيق النجاح والأرباح والرفاهية في المجتمع.
ويزداد حجم البيانات في العالم زيادة مطردة، حيث تؤدي حصيلة التفاعلات اليومية مع المنتجات والخدمات الرقمية، كأجهزة الكمبيوتر والهواتف المحمولة، ومنصات التواصل الاجتماعي، إلى تشكيل كمية هائلة من البيانات في كل لحظة، وتعرف هذه البيانات بـ «البيانات الضخمة».
ويشير مفهوم «البيانات الضخمة» (Big Data) بحسب تعريف منظمة الأمم المتحدة، إلى “تكديس موارد المعلومات المتزايدة بشكل كبير وتحليلها، على نحو يفوق قدرات التخزين والتحليل التي كانت تنتجها المعدّات والبرمجيات الأولى، وهو ما تحقق بفضل تطور قدرات تخزين البيانات واتساع نطاق موارد البيانات المتاحة”.
ويعّرف معهد ماكنزي العالمي «البيانات الضخمة» على أنها مجموعة من البيانات تكون بحجم يفوق قدرة أدوات قواعد البيانات التقليدية من التقاط، وتخزين، وإدارة وتحليل تلك البيانات.
ويمكن ببساطة الإشارة إلى البيانات الضخمة على أنها بيانات تولدت من خلال استخدامنا المتزايد للأجهزة الرقمية، والحاسبات، وكل ما هو متصل بشبكة الإنترنت.
ولا يقتصر الأمر على العمليات الرقمية الصرفة مثل مشاهدة وتحميل الفيديو، أو إجراء المكالمات، أو إرسال الرسائل النصية ورسائل البريد الإلكتروني والمرفقات، لكن الأمر يمتد ليشمل أعمالًا اعتيادية كثيرة في واقعنا، قد تبدو ظاهريًا أعمالًا غير مؤتمتة، لكنها في الواقع تستخدم التقنية، وتترك خلفها آثارًا رقمية وبيانات تتكدس في كل لحظة. على سبيل المثال فإن عمليات الشراء التقليدية من المتاجر أو طلب وجبة طعام مفضلة، غالبًا ما ترتبط بأعمال رقمية تدخل في تشكيل البيانات الضخمة.
لقد أدت ثورة المعلومات والاتصالات، وزيادة عدد أجهزة الكمبيوتر المتصلة بالإنترنت، وزيادة عدد مستخدمي الهواتف المحمولة، وارتباط معظم الأجهزة المنزلية والصناعية مع بعضها من خلال انترنت الأشياء، إلى إنتاج محتوى هائل يصل حاليًا إلى أكثر من 1.7 ترليون بايت من البيانات في الدقيقة الواحدة، منها ما تقوم بعض مراكز البيانات بتخزينه وتحليله، ومنها ما يتم مسحه لعدم أهميته.
خصائص البيانات الضخمة
تتسم طرق معالجه البيانات الضخمة بخصائص أخرى تختلف عن البيانات التقليدية وقواعد البيانات، ويعتبر الحجم وتنوّع الملفات والسرعة، من أهم هذه الخصائص.
فمن حيث الحجم يقدّر الخبراء وصول حجم البيانات على شبكة الانترنت هذا العام إلى ما يقرب من 40 ألف زيتابايت من البيانات الجاهزة للتحليل واستخلاص المعلومات، ويعادل الزيتابايت الألف بليون جيجابايت.
كما تتسم البيانات الضخمة بسرعة تدفقها وتداولها، على سبيل المثال يستقبل موقع تويتر نحو 500 مليون تغريدة يوميًا، الأمر الذي يتطلب سرعة تحليل البيانات الضخمة وقت وصولها وابتكار تقنيات خاصة لمعالجة تلك البيانات.
كذلك تتسم البيانات الضخمة بتنوّعها، وذلك مع تنوّع المنصات التي تولد هذه البيانات، مثل مواقع الانترنت والهواتف المحمولة وشبكات التواصل الاجتماعي، لذلك تختلف أشكال هذه البيانات بين الصور ومقاطع الصوت والفيديو والنصوص المكتوبة وغيرها.
البيانات الضخمة في خدمة المجتمع
تعتبر البيانات شريان الحياة لعملية اتخاذ القرارات، وتساعد تقنيات البيانات الضخمة على تعزيز عمل المؤسسات التجارية وتمكينها من وضع تحليلات مكيّفة ودقيقة للعملاء الممكنين والحاليين، وتحسين تجربة المستخدم، ومتابعة عمليات التصنيع، والتصدي لأوجه نقص الكفاءة خلال عمليات الإنتاج.
لقد أتاحت البيانات الضخمة لمؤسسات الأعمال زيادة أرباحها بشكل كبير وتعزيز وضعها التنافسي، وذلك من خلال معرفة رغبات الزبائن وميولهم بغرض توفير منتجات وخدمات بناءً على تلك الرغبات والميول، ما يؤدي إلى ضمان رضا العملاء، وبالتالي زيادة المبيعات والأرباح، إضافة إلى إمكانية توجيه الإعلانات الترويجية على الانترنت، من خلال تطبيقات تقوم بتحليل بيانات المستخدمين، وعمليات البحث والشراء السابقة، وتوجيه الإعلانات التي تتناسب مع تلك الاهتمامات والميول.
وفي القطاع الصحي تساهم البيانات الضخمة في التوصل إلى علاجات أكثر فاعلية لمجموعة من الأمراض المستعصية، من خلال جمع وتحليل بيانات المرضى من المستشفيات والعيادات الطبية، ما يؤدي إلى كشف تطور المرض في وقت مبكر.
كما يمكن للمؤسسات الصحية ومراكز الأبحاث الطبية، الاستفادة من البيانات الضخمة التي تتم مشاركتها من خلال الأجهزة القابلة للارتداء، مثل الساعات الذكية والأساور الذكية، وتحليل بيانات درجة حرارة الجسم وضغط الدم، وساعات ممارسة الرياضة وبيانات النبض ودقات القلب، وغيرها من البيانات التي يتم مشاركتها من خلال ارتباط هذه الأجهزة بشبكة الانترنت، حيث تقوم تطبيقات خاصة بتحليلها، بهدف كشف الواقع الصحي العام للمجتمع، دون حاجة معظمنا لزيارة الطبيب.
علاوة على ذلك، يمكن استخدام البيانات الضخمة، ومجسات إنترنت الأشياء لأغراض البحث والتطوير، وهناك العديد من المجالات التي تحقق فيها هذه القدرات منفعة كبيرة، مثل توقعات الأرصاد الجوية، والتنبؤ بالكوارث الطبيعية باستخدام البيانات المتعلِّقة بالجيولوجيا الطبيعية والبيانات الجغرافية من خلال تحليل البيانات السابقة ومقارنتها مع البيانات الحالية، الأمر الذي من شأنه اتخاذ إجراءات احترازية قبل وقوع الكارثة.
المخاوف تجاه البيانات الضخمة
تقوم العديد من تقنيات البيانات الضخمة وخوارزميات الذكاء الاصطناعي على تكنولوجيا مفتوحة المصدر، ما يجعلها متاحة مجانًا للاستخدام والتبادل والتكيف، وينشئ فرصًا للابتكار تلائم احتياجات كل قطاع أو فئة.
إلا أن هناك مخاوف متزايدة بشأن خصوصية البيانات وإساءة استخدامها، على سبيل المثال في مجال الرعاية الصحية، فعلى الرغم من الفوائد الكبيرة التي حققتها البيانات الضخمة في هذا المجال، فإن المخاوف تزداد بشأن الاستخدام الخاطئ لها، نتيجة الوصول إليها عبر قنوات غير مراقبة مثل استخدام محركات البحث في الحصول على إجابات طبية أو أدوية وعلاجات، ما قد يشكل خطرًا على صحة الإنسان.
كما يشكل الاستخدام غير القانوني للبيانات مخاوف شديدة بين أولئك الذين يقدرون خصوصيتهم، حيث قد تستخدم أرقام الهواتف والعناوين البريدية وبيانات بطاقات الائتمان بشكل غير قانوني فيما لو وصلت إلى جهات غير مصرح بالوصول إليها، أو حتى استخدام البيانات في عمليات غير قانونية مثل دراسة التوجهات والتأثير على الانتخابات السياسية وتوجيه آراء الناخبين تجاه قضية معينة أو شخص معين.
ومع ازدياد هذه المخاوف والتكهنات حول استخدام البيانات الضخمة من قبل الشركات والهيئات الحكومية وأصحاب العمل، تلجأ الشركات بشكل متزايد إلى الشفافية الكاملة في كيفية استخدامها للبيانات لاستهداف عملائها. وتعريف المستخدمين بما يتم جمعه من بيانات، وكيفية استخدام المعلومات التي تم جمعها.
ورغم المخاطر التي تنطوي عليها مشاركة البيانات، إلا أنه من خلال تسخير قوة البيانات الضخمة، واتخاذ التدابير والاحتياطات الضرورية تجاه هذه المخاطر، فإن أمام الحكومات والمؤسسات فرصة كبيرة لتطوير سياسات أكثر ذكاءً، تعمل على تحسين حياة الناس وتحقيق التقدم في المجتمع.
* إعلامي سوري، متخصص في الإعلام الإلكتروني والتواصل الاجتماعي
منشور في مجلة لغة العصر / عدد مارس 2020/ مؤسسة الأهرام
كن أول من يعلق على المقالة