يمكن الاستفادة من خوارزميات تعلم الآلة لتحسين إحدى طرق العثور على الجينات التي تحفِّز نمو الأورام؛ وذلك لغربلة الكميات الهائلة من البيانات الجزيئية التي جُمعت من دراسات سلالات الخلايا السرطانية ونماذج الفئران والمرضى من البشر. وأظهر فريق يقوده الدكتور روبرت هوهندورف -من مركز العلوم البيولوجية الحاسوبية في جامعة الملك عبد الله للعلوم والتقنية (كاوست)- أنه يمكن تحديد الجينات المعروفة بأنها تؤدي دورًا رئيسيًّا في الإصابة بمرض السرطان، وانتقاء العشرات من الجينات الجديدة التي يُفترض أن لها دورًا في الإصابة بعشرين نوعًا مختلفًا من الأورام السرطانية، وذلك بواسطة نظام الذكاء الاصطناعي، الذي يمكن تغذيته ببيانات تربط بعض طفرات الحمض النووي بالأداء الوظيفي المتغير. هذا النهج التنبؤي -المتوافر المتاح مجانًا عبر الإنترنت- قد يساعد الأطباء السريريين في تصميم عقاقير مُخَصصة للأنواع الفرعية الجزيئية للمرضى. ويُمكِن كذلك أن تستخدمه شركات الأدوية في البحث عن أهداف علاجية جديدة. تقول سارة الثبيتي، المؤلفة الرئيسية للدراسة وطالبة الدكتوراة في مُختَبَر هوهندورف: «يُمكِن استخدام طريقتنا كإطار للتنبؤ بالجينات المُسَبِّبة للسرطان وإثبات دورها في أي قاعدة بيانات أو عينة سكانية حقيقية». وقد جرى العُرْف على الطريقة التقليدية التي ينتهجها العلماء للبحث عن الجينات التي لها دور سببي في الإصابة بالسرطان، عن طريق البدء ببيانات تسلسل الحمض النووي، ومن خلال الفهرسة واسعة النطاق لطفرات الورم المشتركة بين المرضى المصابين بنوع شائع من السرطان، وَثَّق المجتمع البحثي مئات الجينات التي تتسبب في ظهور الورم، ثم تجري الاستعانة بالمتابعة التَّجريبية لربط هذه الجينات وظيفيًّا بسمات السرطان. وعن الإضافة التي قدمها الفريق في هذا الإطار، توضح الثبيتي قائلة: «إن طريقتنا تقلِب النهج المتعارف عليه في البحث عن الجينات رأسًا على عقب؛ إذ تعتمد بالأساس على المعرفة، فتستعين ببيانات تسلسل الورم كوسيلة للتحقق. وهذا على عكس معظم المناهج التي تقوم على البيانات بالتضافر مع تفسير النتائج فيما يتصل بالمعرفة الراهنة». وكان مُعَدَّل اكتشاف الجينات الجديدة المُسَبِّبة للسرطان آخذٌ في الانخفاض سريعًا على مدار السنوات الأخيرة، الأمر الذي دفع الفريق للبحث عن إستراتيجية حاسوبية جديدة. فبدلًا من الاعتماد على بيانات التسلسل، تولَّى كلٌّ من الثبيتي وهوهندورف بناء نموذج لتعلُّم الآلة، يأخذ في الاعتبار العديد من السمات البيولوجية للجينات والمسارات المشارِكة في تكوين الورم. وجدير بالذكر يستخدم تعلُّم الآلة أمثلة عن المدخلات والمخرجات المتوقعة، وذلك من أجل التحسين المستمر واتخاذ قرارات دون أن تكون الآلة مبرمجة للقيام بذلك عبر سلسلة تعليمات في خطوات. وقد صمم الباحثون الخوارزمية التي تجري تغذية نظام الذكاء الاصطناعي بها، للتعرُّف على الأنماط الوظيفية والظاهرية التي تهيئ أحد الجينات لأداء دور في دفع تطور الورم. والخوارزمية هي مجموعة من العمليات الحاسوبية التي تأخذ عددًا من المدخلات وتنتج قيمة أو مجموعة من القيم التي تحوّل المدخلات إلى مخرجات. وقد تحقق الباحثون من فاعلية النموذج بالاستعانة بقاعدة بيانات متاحة للجمهور تضم نحو 27 ألف نوع مختلف من الأورام، فضلًا عن البيانات الوظيفية وبيانات التسلسل، ما يوضح أن الخوارزمية تصنف بدقة الجينات المعروفة المُسَبِّبة للسرطان، وتكتشف أكثر من 100 جين آخر محتمل، والعديد منها له أدوارٌ مُحَددة في أنواع معينة من الأورام. ثم أجرى الباحثون اختبارًا آخرَ لأداء الخوارزمية على البيانات الجزيئية التي جُمعت من مجموعتين من مرضى السرطان. المجموعة الأولى كانت من مستشفى جامعة الملك عبد العزيز في المملكة العربية السعودية، وتألَّفت من 26 عينة ورم جرى سحبها من أفراد يُعانون من نوع نادر من سرطان الرأس والعنق يُسمى سرطان البلعوم الأنفي. أما المجموعة الأخرى فقد تألفت من 114 عينةً من سرطان القولون والمستقيم، جرى سحبها من مرضى عولجوا في مستشفى جامعة برمنجهام في المملكة المتحدة. في كلتا مجموعتي المرضى، انتقى النموذج الجينات المُسَبِّبة المُرَشَّحة، التي كانت في كثير من الأحيان متطفرةً وتشترك في سمات مرضية مع جيناتٍ أخرى مسببة للسرطان. ويؤكد هوهندورف أهمية جهد الفريق المعني قائلًا: «هذا العمل مثالٌ جيد على التعاون العلمي داخل المملكة العربية السعودية، لكنه يُبيِّن أيضًا الحاجة إلى التعاون متعدد التخصصات بين علماء الكمبيوتر والباحثين السريريين وعلماء الأحياء».