
في مارس 2023، طرحت Google نسخة متقدمة من نموذجها الطبي، Med‑PaLM 2، بعد نجاح النسخة الأولى، وهو نموذج QA طبي مدرّب خصيصا للإجابة الدقيقة على الأسئلة المهنية في المجال الطبي.
Med‑PaLM 2 تجاوز المستوى البشري في اختبارات الرخصة الطبية الأمريكية (USMLE) وحقق نتائج على مستوى “الخبير”، متفوقا على نسخته السابقة بنسبة ملحوظة (sites.research.google).
ما هو Med‑PaLM 2؟
- نسخة مطوّرة من Flan‑PaLM 2، مدربة أوّلا على MultiMedQA – وهو معيار يجمع بين بيانات امتحانات طبية احترافية مثل MedQA، PubMedQA، MedMCQA، وأسئلة صحية استهلاكية (nature.com).
- بعد التعديلات، حقق النموذج دقة تصل إلى 86.5% على MedQA، بزيادة تقريبية 19% عن النسخة الأصلية، وبالمقارنة تلقى تقييمات تفوق الأطباء في 8 من 9 محاور تقييم سريرية (nature.com).
- تم تطويره باستخدام تقنيات مثل: fine-tuning طبي، ensemble refinement، واستدعاء متنقل (chain-of-retrieval) لتقوية الفهم الطويل الأمد والاستدلال الطبي (nature.com).
المميزات الأساسية
- دقة عالية في الاختبارات المهنية
- اجتاز اختبارات USMLE/MedQA بنسبة 86.5%، متجاوزا أداء الأطباء في أكثر من 8 محاور سريرية (researchgate.net).
- تقييم شامل ومتعدد الأبعاد
- تمت مقارنته مع الأطباء بناء على factuality, reasoning, potential harm, bias، مع تفوق مهم في معايير السلامة والموضوعية (researchgate.net).
- تنوع مصادر التدريب
- استخدم MultiMedQA المؤلف من سبعة مجموعات: MedQA, MedMCQA, PubMedQA, MMLU clinical topics، HealthSearchQA… (arxiv.org).
- تحسين طريقة التعلم والتعليم الطبي
- تم استخدام advanced prompting وتقنيات ensemble لإنتاج إجابة تدعم الاستدلال والسياق السريري المعمق (medium.com).
- نطاق متعدد ومحتمل الاستخدام السريري
- مع التوسع في نسخة Med‑PaLM M لدعم بيانات صور مثل الأشعة، ويعمل عبر Google Cloud ضمن مشروع MedLM لتعزيز التطبيقات الطبية الفعلية (sites.research.google).
الأهمية البحثية والتطبيقية
- قفزة نوعية في الذكاء الاصطناعي الطبي: تجاوز المستوى البشري وتقريب المسافات بين الإنسان والآلة في الخدمات الصحية.
- نموذج تقييم إطار شامل: يجمع بين الدقة، القدرة التفسيرية، وسلامة الاستخدام، ما يمثل منهجا نمطيا للمستقبل.
- قاعدة مستقبلية للبحث: استخدم كنموذج في البحوث الطبية المعتمدة على الذكاء الاصطناعي بحوث مثل Towards Expert‑Level وGeneralist Biomedical AI (nature.com).
المرجع:
Singhal, K. et al. (2023). Large Language Models Encode Clinical Knowledge. Nature 620, 172‑180. (medium.com, nature.com)
رابط النموذج (Google Cloud – MedLM / Med‑PaLM 2):
(pmc.ncbi.nlm.nih.gov)