واجهت أوريل فورنيه– طالبة الدكتوراه بجامعة أركنساس- مجموعة معقدة من الحسابات، نظرًا إلى حجم البيانات التي حصلت عليها، والتي يَصعُب حسابها وتقديرها بالأدوات التقليدية، ما دعاها لتعلم «لغة البرمجة آر» والتي لم يعمل بها أو يتعلمها أي شخص آخر في مختبرها في جامعة أركنساس؛ لذا، بدأت أوريل التعلم على الإنترنت حتى أتقنت العمل على «لغة آر»، ليس هذا وحسب؛ بل ساعدت الباحثين الآخرين على تعلمها وفهمها جيدًا.

غالبًا ما تُستخدم «لغة آر» لإجراء الإحصاءات، ومن خلال معرفة القليل من الأكواد البرمجية؛ يحصل الباحثون على مجموعة كبيرة من حزم البرامج التي تعمل على أتمتة المهام المتكررة وتزيد من خيارات تجميع البيانات وتحليلها ومشاركتها وعرضها، فتعلم البرمجة أصبح أمرًا سهلًا وممكنًا، كما يمكنه أن يحسن بشكل كبير آفاق عمل الباحث، وذلك «يتطلب استثمارًا» كما تقول أوريل؛ وهذا لا يشمل الوقت فقط، بل يشمل أيضًا الجهد المستمر، والاستعداد لارتكاب الأخطاء والعثور عليها وإصلاحها.

Embed from Getty Images

قابلية تكرار أكثر من 100 خطوة

أدرك كلٌّ من روب فين المتخصص في علم «الأحياء الحسابي» في المعهد الأوروبي للمعلوماتية الحيوية في هينكستون، وفولكر ماير، المتخصص في علوم الكمبيوتر في مختبر أرجون الوطني في إلينوي، مدى تداخل عملهما، فكلاهما يدير منشآت تتيح للباحثين إجراء عمليات حسابية مكثفة تسمى «التحليل الجينومي»، والتي تسمح بإعادة بناء «المجتمعات الميكروبية» من الـ«دي إن إيه»، ولذلك قررا بدء تجربة مختلفة من نوعها.

كانت المشكلة الرئيسة التي تواجه روب وفولكر؛ أن «خطوط الأنابيب التحليلية»- الخطوات الحسابية المصممة بعناية لتحويل البيانات الأولية إلى معرفة علمية- كُتبت بلغات برمجية مختلفة؛ فكان فريق فولكر يستخدم نظامًا داخليًّا يسمى «آيه دبليو إيه»، بينما كان روب يعمل مع ما يقرب من 9500 سطر من أكواد بايثون، أحد أشهر لغات البرمجة الحالية وضمن الأكثر انتشارًا لسهولتها؛ لذا لم يكن هناك فرصة لدمج سطور بايثون مع نظام «آيه دبليو إيه» ليعملا سويًّا، وهذا كان سببًا لبحثهما عن أداة لحل هذه المعضلة، والتي تُوجت بتعرفهم إلى لغة سير العمل المشتركة؛ «سي دبليو إل».

تعد «سي دبليو إل» في الأساس لغة تبادل يمكن للباحثين استخدامها لمشاركة خطوط الأنابيب لأي نظام، والتي تهدف لجعل الأساليب الحسابية قابلة للتكرار وقابلة للصيانة والمشاركة. فبالنسبة لعلماء «الأحياء الحسابي» فإن خطوط الأنابيب غالبًا ما تشتمل على عشرات الخطوات المتكررة التي يجب توثيقها بدقة في كل مرة، ما يجعل فعل ذلك ليس سهلًا. وحسب تيتوس براون- المتخصص في «المعلومات الحيوية» بجامعة كاليفورنيا- فإن تمرير ست عينات من خلال خط أنابيب واحد- يتضمن تنزيل البيانات ومراقبة الجودة والتجميع والتعليق والتحليل- يتطلب «أكثر من 100 خطوة».

يدوِّن الباحثون سير العمل عادة باستخدام لغات البرمجة مثل بايثون، والتي تتضمن مراقبة سير العمل لمئات الآلاف من ملفات البيانات. ويقول ديفيس مكارثي- المتخصص في البيانات الحيوية في ​​معهد سانت فنسنت للأبحاث الطبية في فيتزروي بأستراليا- أن بايثون واللغة آر كانتا أكثر من كافِيين لتدفقات العمل البسيطة نسبيًّا التي استخدمها بصفته طالب دكتوراه. وهو ما يظهر أن لغات البرمجة أصبحت جزءًا أصيلًا من مهارات الباحثين وعملهم.

ومن الجدير بالذكر، أن مؤشرات بحث جوجل تظهر أنه منذ عام 2004م، وحتى عام 2013م، لم يكن معدل البحث على كلمة «بايثون» على محركها في المواقع العلمية والأكاديمية والمجال البحثي؛ إلا طفيفًا جدًّا. لكن من عام 2013م، أخذ المؤشر في الصعود ليصل إلى نسب كبيرة جدًّا في الوقت الحالي.

أما الغريب حقًّا؛ فهو قائمة الدول الأكثر بحثًا عن «بايثون» التي جاءت الخمس الأولى فيها لا تتضمن الولايات المتحدة ولا أي دولة أوروبية، وكان جميعها في آسيا وصولًا لإسرائيل في المركز الخامس، والتي جاءت على الترتيب:

  1. كوريا الجنوبية.
  2. سانت هيلانة (جزيرة مغمورة تقع في المحيط الأطلسي تابعة للتاج البريطاني).
  3. الصين.
  4. سنغافورة.
  5. إسرائيل.

الذكاء الاصطناعي.. عندما تتعلم الآلة العلم

عندما سعى فريق عالم الكمبيوتر كريستيان بيرجر للحصول على مشروعه حول خوارزميات سيارة ذاتية القيادة على الطريق، واجه عقبة كبيرة، فقد وجد العلماء، في جامعة جوتنبرج في السويد، عددًا هائلاً من الأوراق حول هذا الموضوع، ومن حسن الحظ وصل الفريق لأداة استكشاف الأوراق البحثية «iris.ai» والتي تعمل بالذكاء الاصطناعي.

فعن طريق وصف مكون من 300 إلى 500 كلمة لمشكلة البحث، أو إضافة رابط لورقة موجودة، تقوم الخدمة بإرجاع خريطة لآلاف المستندات المتطابقة، مجمعة حسب الموضوع. يقول كريستيان إن النتائج تقدم «نظرة عامة سريعة ودقيقة إلى ما يجب أن يكون ذا صلة بسؤال بحثي».

Embed from Getty Images

يقول جيوفاني كولافيزا، عالم البيانات البحثية في معهد آلان تورينج في لندن، الذي يدرس تحليل نصوص المنشورات العلمية: إن هذه الأدوات توفر «استرجاع المعلومات من أحدث ما توصلت إليه التكنولوجيا». ففي الوقت الذي تعمل فيه الأدوات التقليدية مثل «جوجل سكولر» مؤشرات استشهادية؛ فإن تلك الأدوات القائمة على الذكاء الاصطناعي يمكن أن تقدم رؤية أكثر اختراقًا للإرث العلمي، كما يساعد الكثير من الباحثين على التحقق من الفرضيات العلمية الموجودة. وكذلك الكشف عن الروابط المخفية بين النتائج، والتي يمكن من خلالها أن تقترح حتى فرضيات جديدة لتوجيه التجارب.

ومع ذلك، غالبًا ما تكون هذه الأدوات باهظة الثمن، ومحدودة بجزء من المؤلفات العلمية؛ فتقول سوزان فريك، أمينة مكتبة صحة الحيوان في جامعة ولاية واشنطن، التي كتبت مراجعة عن هذه الأدوات: إنها تعمل على «جذبك بسرعة إلى موضوع ما، ولهذا السبب يجب استخدامها جنبًا إلى جنب مع أدوات أخرى». ويؤكد كريستيان ما تقوله سوزان، بقوله: «إن استخدام أي محرك بحث بشكل أعمى لا يجيب عن كل سؤال تلقائيًّا».

عادةً ما تؤدي الخوارزميات التي تشغل هذه الأدوات وظيفتين؛ فهي تستخرج المحتوى العلمي، وتقدم خدمات متقدمة مثل تصفية نتائج البحث وتصنيفها وتجميعها. يوضح جيوفاني أن الخوارزميات التي تستخرج المحتوى العلمي غالبًا ما تستخدم «تقنيات معالجة اللغة الطبيعية (إن إل بي)»، التي تسعى إلى تفسير اللغة كما يستخدمها البشر، والتي تُمكِّن المطورين من استخدام التعلم الآلي.

ولتقديم خدمات أكثر تقدمًا؛ غالبًا ما تنشئ الخوارزميات «الرسوم البيانية المعرفية» التي توضح بالتفصيل العلاقات بين الكيانات المستخرجة وتعرضها للمستخدمين. على سبيل المثال؛ يمكن أن يقترح الذكاء الاصطناعي أن الدواء والبروتين مرتبطان إذا جرى ذكرهما في الجملة نفسها في البحث.

وفي نطاق آخر اعتمدت فيه العملية البحثية على الذكاء الاصطناعي، عمل عالم الأحياء مارك ترافرز وفريقه بمشروع تعافي الطيور البحرية المهددة بالانقراض بجامعة هاواي عن طريق جمع الضوضاء الناتجة عند اصطدام طائر بخط كهرباء. وفي عام 2011م، أراد مارك معرفة عدد هذه التصادمات التي تحدث في جزيرة كاواي في هاواي.

ومع جمع حوالي 600 ساعة من الصوت على مدار 25 يومًا، كان حساب التصادمات يدويًّا أمرًا غير عملي؛ لذا، أرسل مارك الملفات الصوتية، إضافة إلى البيانات الوصفية، مثل الأوقات والمواقع، إلى «Conservation Metrics» وهي شركة في كاليفورنيا تستخدم الذكاء الاصطناعي للمساعدة في مراقبة الحياة البرية، وكان برنامج الشركة قادرًا على اكتشاف التصادمات تلقائيًّا، وعلى مدار السنوات العديدة التالية زاد فريق مارك من حصاد البيانات إلى حوالي 75 ألف ساعة لكل موسم ميداني.

Embed from Getty Images

بالنسبة للعلماء الذين يدرسون الحياة البرية خاصة الأنواع المهددة بالانقراض ويعانون من نقص التمويل، يوفر الذكاء الاصطناعي بديلًا جذَّابًا لمعالجة كميات هائلة من البيانات، مثل الصور أو التسجيلات الصوتية. يقول دان ستويل، عالم الكمبيوتر في جامعة كوين ماري في لندن: «يمكن لطالب الدكتوراه أن يقضي أشهرًا قبل أن يتمكن من الاقتراب من الإجابة عن فرضيته يدويًّا». فعلى الرغم من سمعتها التي تتطلب مهارات حوسبة متقدمة، أصبح الذكاء الاصطناعي متاحًا الآن أكثر من أي وقت مضى، وذلك بفضل أدوات التوجيه ومكتبات البرمجة المخصصة.

معضلات تواجه الباحثين تحلها التكنولوجيا

تقول جونا داكليس، التي تدير ورش عمل في الحوسبة العلمية حول العالم، إنه باستخدام لغات البرمجة مفتوحة المصدر، مثل بايثون وآر، ومن خلال دمج البرامج على موقع مشاركة الأكواد البرمجية «جيت هوب»، يمكن للعلماء إجراء الكثير من الأبحاث في الوقت الحاضر، ويمكنهم فعل ذلك دون دفع رسوم ترخيص البرامج باهظة الثمن. وهو ما يفتح بوابة كبيرة أمام الباحثين في الدول النامية الذين لا يمكنهم الحصول على إمكانيات كبيرة مثل ما يحصل نظراؤهم في الولايات المتحدة وأوروبا.

ففي الوقت الذي أصبحت فيه أجهزة الكمبيوتر الفائقة باهظة الثمن- وهي أجهزة عملاقة ذات إمكانيات هائلة تُستخدم لمعالجة أحجام ضخمة من البيانات، ولديها قدرات كبيرة لتخزين المعلومات والبيانات- من ضروريات مراكز الأبحاث؛ لا يمكن للباحثين  في زيمبابوي مثلًا اقتناء أجهزة شخصية محمولة، لذلك تقترح باحثة الأمن السيبراني روزنتال شونيوا من زيمبابوي استخدام الهواتف المحمولة بدلًا من ذلك.

Embed from Getty Images

وتضيف روزنتال؛ «كل شخص لديه هاتف محمول»، والذي يمكِّن الباحثين في المواقع البعيدة من تحميل بياناتهم على الإنترنت؛ لذا فالباحث ليس مضطرًا لشراء كمبيوتر محمول، فمن الأرخص الاعتماد على النظام الأساسي للجوَّال؛ فبالنسبة للعديد من المهام، تكون الهواتف المحمولة قوية بما فيه الكفاية لمعالجة البيانات محليًّا، دون الحاجة إلى نقل البيانات إلى أجهزة كمبيوتر بعيدة أقوى. وفي هذا النطاق ابتكرت إحدى الطالبات تطبيقًا على أندرويد يحلل صور أوراق الطماطم لمساعدة المزارعين على تحديد ما إذا كان النبات في حالة صحية أو مريضًا، دون الحاجة إلى نقل البيانات. تقول روزنتال: «تمت جميع عمليات المعالجة بهذا التطبيق على الهاتف، ولم يُستخدم الإنترنت في هذه العملية».

إن تحفيز التطور التكنولوجي من خلال الاكتشاف العلمي أمر مقبول على نطاق واسع. لكن تحفيز العلم بالتكنولوجيا أمر مستجد ما زالت صورته تتكون. ومن خلال هذا التقرير حاولنا تقديم نطاقات تسهم في التلاقح المتبادل بين العلم والتكنولوجيا، وكيف أصبحت التكنولوجيا، خاصة الاعتماد على لغات البرمجة وتطبيقات الذكاء الاصطناعي لتطوير عمليات البحث العلمي، لبنة أساسية في الصروح العلمية حول العالم.

المصادر

تحميل المزيد