مؤسسة علماء مصر
مؤسسة علماء مصر

5,332

تعرفنا في الجزء السابق على مزيد من التفاصيل عن البيانات العملاقة Big data وعن أهميتها التي تكمن في الفوائد المرجوة من تحليلها وتمكين الهيئات والأفراد من معرفة المزيد عن المشكلات المراد حلها والتنبؤ بها قبل أن تحدث، وكذلك تمكينهم من تحسين أداء العمل وتطوير التكنولوجيا والانتقال بها إلى آفاق أبعد بكثير مما هي عليه الآن، وتناولنا أيضًا بعضًا من الانتقادات التي وجهت لها من قبل العامة والعلماء.

في هذا الجزء سنتناول تفاصيل عن تحليل تلك البيانات والبرامج المستخدمة لذلك، وتوقعات حول دقة نتائج التحليلات وعواقب ذلك على الحياة المهنية للبشر.

الواقع يقول إنَّ الشركات التي ستتمكن من تحويل تلك البيانات إلى توقعات ذات قيمة هي التي سوف تبقى، بل وستتقدم الصفوف، بينما تلك التي تتعامل معها بسطحية فستتأخر للوراء. أما التي تتجاهلها تمامًا فسوف تتلاشى عما قريب. والحق أنه لا عذر للشركات ألا تستخدم تلك الخدمة المتاحة، فالأمر لا يستلزم تكلفة كبيرة بشكل عام (إلا في حالة تحليل بيانات مخصوصة) وعليه فإن أصغر الشركات يمكنها ذلك بالفعل عن طريق استئجار خدمة تحليل بيانات (SAAS software-as-a-service) بتكلفة زهيدة بدلًا من شراء رخصة برمجيات باهظة الثمن؛ مما يوفر لها فرصًا مكافئة.

ما هي البيانات التي يتم تحليلها؟

هناك فكرة مغلوطة ربما تخطر للشركات وهي أنَّه لمجرد وجود البيانات فإن ذلك يتيح لهم ببساطة الحصول على نتائج مثمرة. ففي الواقع السر لا يكمن في تجميع البيانات فإن ذلك يغرق مُتخذي القرار بمزيد من البيانات. ولكن السر يكمن في “البيانات ذات الصلة” relevant data. بمعنى أن الشركة لا بد وأن تقرر أولًا نوعية البيانات التي تريد أن تجمعها بما يتوافق مع أهدافها الاستراتيجية والأسئلة التي تبحث عن إجابة لها حتى يكون تحليل البيانات ذا إجابات دالة على مؤشرات نجاح التجارة. وهو الأمر نفسه الذي يجري تقليديًّا في الواقع مع البيانات الصغيرة ويطلق عليه مؤشرات الأداء الرئيسية (Key Performance Indicators KPI).

فإذا تم أخذ ذلك في الاعتبار, وتم اختيار المؤشرات المناسبة ستكون القيمة من وراء البيانات العملاقة حينها هي القصوى. ففي النهاية تلك المؤشرات تشمل هامش الربح ورضا العميل ونصيب السوق ونمو العائد وأداء الموظفين وهي كلها المكونات الحيوية لأي عمل. وعليه يجب التوقف عن جمع أي بيانات والتركيز فقط على البيانات التي تؤدي للتوقعات الصحيحة.

ما هي مراحل التحليل؟

في البداية تحصل الشركة على بيانات من مختلف الأنواع كتسجيلات للمبيعات، وقواعد بيانات العملاء، وردود أو تعليقات من قنوات التواصل الاجتماعي أو البريد الإلكتروني، وأي بيانات ترصد عن العمل الداخلي للشركة.

ففي البداية يجب تحديد ما تحتاجه فقط منها وليس تحليلها كلها كما شرحنا.

ولأن حجم البيانات أضخم من أن تستوعبه وتتعامل معه حاسبات أي شركة، فإن تلك البيانات تتم استضافتها على نظم تخزين ملفات موزعة (Distributed File System) في خوادم Servers الإنترنت، أو كما يطلقون عليها الآن السحابة Cloud؛ مما يضمن تخزينها بتكلفة زهيدة والوصول إليها ومعالجتها بسرعة أكبر بكثير من تخزينها في وحدة واحدة. أمثلة على نظم التخزين المتوفرة حاليًا هي Apache Hadoop Distributed file system، وGoogle File System.

وإما يكون التخزين فيها على شكل الجدولة التقليدية مثل Hadoop أو الخروج عن تلك القاعدة والتخزين بطريقة تناسب البيانات، وهو ما يطلق عليه NoSQL architecture المستخدم مع Amazon’s DynamoDB (التي تستخدم نظام جوجل) وMongoDB، وCassandra (التي يستخدمها فيسبوك) ولكل منها قواعد خصوصية وحماية مختلفة.

ثم تأتي مرحلة التحليل Analytics، والتي هي تختلف عن Analysis بالمناسبة لأن الأولى هي تحليل “في السياق” يعطي تنبؤات أو توصيات؛ بمعنى أنه يركز على المنهجية الكاملة وليس التحليل الرياضي فحسب. وهذا التحليل التنبؤي يشمل العديد من أساليب الإحصاء من النمذجة modeling ، وتعليم الآلة Machine learning ، والتنقيب عن البيانات Data mining ، وأدوات للتعرف على الأنماط أوتوماتيكيًّا automated pattern recognition tools لتحديد التوجهات ورسم الاستنتاجات.

والمثير أن أدوات التحليل الحديثة أصبحت غير مقتصرة على المحترفين نظرًا لصدور إصدارات أقل تعقيدًا تستخدم رسومًا وأرقامًا توضيحية للنواتج المحتملة. تلك الأدوات متوفر منها ما هو مجانًا ومفتوح المصدر مثل R وGNU Octave وApache Mahout (الذي صدر عنه Hadoop) ومنها ما هو تجاري مثل MATLAB وMathematica وFICO وغيرها. يمكنك التعرف على المزيد من خلال هذا الرابط

والمرحلة الأخيرة هي ترجمة التوقعات إلى لغة صناع القرار باستخدام رسوم توضيحية وتقارير توضح نوع التوصيات المقترحة ومدى التحسن المترتب عليها بالنسبة لبعض أو كل مؤشرات قياس الأداء. بذلك تكون الشركة فعلًا دخلت عالم البيانات العملاقة ويمكنها أن تحصد المنافع.

ولكن هناك تساؤلات حول دقة نتائج التحليلات وعواقب ذلك على الحياة المهنية للبشر.

حسنًا لا بد أن نعترف أن تحليل البيانات له فوائد رائعة. فالتزايد المستمر للبيانات يتيح فرصًا لم تكن موجودة من قبل للعلم والتجارة وللمجتمع ككل كما وضحنا بكثير من الأمثلة لأنها تساعد على رؤية الصورة الكبيرة، والفهم العميق، وتحسين آليات اتخاذ القرارات، وتقليل المخاطر، وتفادي الجرائم، والتواصل بكفاءة مع الموظفين والمستهلكين على حد السواء… إلخ.

ولكن من ناحية أخرى فإن تحسن القدرة على جمع وتحليل البيانات بهذا الشكل سيمكن من ميكنة أغلب الوظائف، وهذا لا يشمل الأعمال اليدوية أو غير الحرفية فقط، بل سيمتد للمحترفين أيضًا من الأطباء والصحفيين والمدربين الرياضيين وغيرهم.

والأمثلة موجودة بالفعل مثل

سائقي سيارات الأجرة: فسيارة جوجل ذاتية القيادة تستطيع من خلال المستشعرات وتحليل البيانات التي تلتقطها أن تبقى آمنة على الطريق لأميال.

موظفي المطارات: فجواز سفرك يتم مسحه ضوئيًّا والتأكد من كل بياناته ومطابقة صورته مع وجهك وفتح البوابات ذاتيًّا دون أدنى تدخل بشري.

الطيارين: فالطيار الآلي ليس ابتكارًا جديدًا لكن الطائرات العسكرية بدون طيار ستجعل من الطائرات المقاتلة آثارًا قديمة عما قريب.

الأطباء: صورة عالية الدقة ثلاثية الأبعاد للمريض وتدريب للروبوتات على عملية جراحية سيجعل تلك الجراحة ممكنة دون تدخل بشري وبلا أخطاء.

وحاسبات فائقة السرعة الآن قادرة على عمل تشخيص دقيق للأمراض اعتمادًا على معرفة طبية سابقة.

التمريض: الآن يمكن شراء حفاضات ذكية تقوم بإرسال رسالة على الهاتف الذكي عند الاحتياج لتغييرها، بل وتحليل محتواها وإرسال تحذيرات في حالة اكتشاف عدوى أو مشكلة صحية.

خدمة العملاء: فالحاسب الذي طورته IBM “واتسون” والذي استطاع الفوز على البشر في ألعاب المسابقات يمكنه ترجمة وفهم الأسئلة بلغة البشر الطبيعية والإجابة عليها بتحليل البيانات الهائلة في ذاكرته.

المدربين الرياضيين: كما أعطينا أمثلة في المقال السابق عن الكرات ذات المستشعرات والدراجات والساعات الذكية وغيرها من الأشياء التي أصبحت تقيس الأداء وتعطي استنتاجات عن كيفية تحسينه.

الصحفيين: قامت شركة باسم Narrative Science بإطلاق برمجية قادرة على كتابة مقالات صحفية رياضية مباشرة من إحصائيات المباريات، ونفس البرمجية يمكن استخدامها لكتابة رؤية عن أداء شركة ما من خلال معلوماتها المنتشرة على الإنترنت!

ولكن هل يعني ذلك أن البيانات العملاقة تحمل أزمة اقتصادية بدلًا من الرخاء والتطور؟

بالطبع لا. هناك دائمًا فرص جديدة. فكما شرحنا سابقًا أن هناك فجوة بين التطور المطرد للتكنولوجيا، وفهمنا، واستخدامنا لها؛ مما يشكل فرصة للبشر لتضييق تلك الفجوة، والمؤشرات تتوقع تعيين 4.4 مليون شخص حول العالم بوظائف ذات علاقة مباشرة بتحليل البيانات العملاقة. وعليه فإن من أهم المهن التي سيسطع نجمها مع انتشار البيانات العملاقة:
عالِم بيانات data scientist:

وهي قدرتك على التنبؤ بتوقعات فريدة من خلال تحليل البيانات العملاقة والخروج بالجواهر منها، وهي قدرة تأتي من خلفية أكاديمية ويطلب لتلك الوظيفة الحاصلون على درجة الدكتوراه، ولأنه أصبح مجالًا مهمًا يتقاضى العاملون به مرتبات كبيرة في ظل ندرة الخبرة المطلوبة فقد بدأت الجامعات في تقديم دورات مؤهلة بمقابل مادي كما في جامعتي ستانفورد وجون هوبكنز ومجانًا كما هو على موقع courser.

المهندس التقني Technical Architect:

وهو الشخص المسئول عن إدارة البيانات العملاقة من برمجة، واختبار، وإعداد النظم، وضبط الأداء. وذلك يستدعي معرفة بدقائق تقنية خاصة بنظم تخزين الملفات الموزعة ومهارات التحليل ونمذجة البيانات.

خبير تعليم الآلة Machine Learning Expert:

وهي المقدرة على تعليم الآلة على مختلف الوظائف كالتجميع والتنقيب عن البيانات وترجمتها… إلخ. وتحتاج مهارات برمجة وتحليل.

مهندس هادوب Hadoop Engineer:

المقدرة على التعامل مع برنامج Hadoop الذي هو العمود الفقري للتعامل مع البيانات العملاقة، لأنه برنامج مفتوح المصدر تقوم كل شركة بعمل بعض التعديلات التي تناسبها وإطلاق إصدار جديد، وتلك هي مهمة المهندس الذي يتميز بخبرة أكثر تعقيدًا من أقرانه في مجال تكنولوجيا المعلومات، ومعرفة أساسية بتكنولوجيات Hadoop وتكوينها الداخلي.

مسوّق تنفيذي للبيانات Data Marketing Executive:

وهي مسئولية التواصل مع المستهلكين عبر مواقع التواصل الاجتماعي وحصد الآراء والتوقعات من خلال المحادثات، وذلك يتطلب مهارات إدارة مشاريع قوية ومهارات عرض بشكل أساسي إلى جانب مهارات التواصل وتبسيط للمعلومات والنظريات التقنية.

وحتى لا نحصر الأمر في وظائف بعينها، فالأمر ببساطة أن هناك فرصً متاحة أمام كل الوظائف المتعلقة بتلك المهارات:

مهارات التحليل (ربط البيانات ذات الصلة بالسؤال المطلوب).

الإبداعية (انتهاج طرق جديدة لتطبيق تحليل البيانات).

مهارات الرياضيات والإحصاء (التعامل مع الأرقام حتى مع البيانات غير المهيكلة unstructured كالرسائل والصور).

مهارات علوم الحاسب (البرمجة بمختلف المستويات واللغات).

المهارات التجارية (فهم أهداف الشركة).

قدرات التواصل (مهارات العرض وكتابة التقارير ضمن الفريق ومع صناع القرار).

وعليه فإن كنت قد أثارك الفضول وقررت العمل على البيانات العملاقة فهناك مصادر مجانية تستطيع الحصول منها على تلك البيانات لتبدأ، تجدها هنا على هذا الرابط.

أما عن التكنولوجيات (الأجسام الذكية) المسئولة عن جمع تلك البيانات والتي تحدثنا عنها سابقًا (Internet of things) وعن الخصوصية والحماية للبيانات فتلك التفاصيل سوف نتناولها في المقالات القادمة.

للاطلاع على رابط المقال الأصلي من هنا