اولین مورد ثبت شده سرطان لوزالمعده به قرن 18 برمی گردد. از آن زمان، محققان یک اودیسه طولانی و چالش برانگیز را برای درک این بیماری گریزان و کشنده آغاز کرده اند. تا به امروز، هیچ درمان سرطانی بهتر از مداخله زودهنگام وجود ندارد. متأسفانه، لوزالمعده که در عمق شکم قرار دارد، به ویژه برای تشخیص زودهنگام گریزان است.
دانشمندان آزمایشگاه علوم محاسباتی و هوش مصنوعی MIT (CSAIL) به همراه Limor Appelbaum، یک همکار تحقیقاتی در بخش تشعشع سرطان در مرکز پزشکی Beth Israel Deaconess (BIDMC)، مشتاق بودند تا بیماران بالقوه در معرض خطر را بهتر شناسایی کنند. آنها تصمیم گرفتند دو مدل یادگیری ماشینی را برای تشخیص زودهنگام آدنوکارسینوم مجرای پانکراس (PDAC)، شایع ترین شکل سرطان، توسعه دهند. برای دسترسی به یک پایگاه داده گسترده و متنوع، تیم با استفاده از داده های پرونده الکترونیکی سلامت از موسسات مختلف در سراسر ایالات متحده با یک شرکت شبکه فدرال همگام می شود. این مجموعه دادههای وسیع به اطمینان از قابلیت اطمینان و تعمیمپذیری مدلها کمک کرد و آنها را در طیف وسیعی از جمعیتها، مکانهای جغرافیایی و جمعیتشناسی قابل اجرا کرد.
دو مدل – شبکه عصبی “PRISM” و مدل رگرسیون لجستیک (یک تکنیک آماری برای احتمال) از روشهای فعلی بهتر عمل میکنند. مقایسه تیم نشان داد که در حالی که معیارهای غربالگری استاندارد حدود 10 درصد از موارد PDAC را با استفاده از یک آستانه خطر نسبی 5 برابر بالاتر شناسایی میکنند، Prism میتواند 35 درصد موارد PDAC را در همان آستانه تشخیص دهد.
استفاده از هوش مصنوعی برای تشخیص خطر سرطان پدیده جدیدی نیست – الگوریتمها ماموگرافی، سیتی اسکن برای سرطان ریه را تجزیه و تحلیل میکنند و از آنالیز پاپ اسمیر و تست HPV پشتیبانی میکنند تا چند کاربرد را نام ببرند. کای جیا، کاندیدای دکترا در مهندسی برق و علوم کامپیوتر (EECS) در این باره گفت: «مدلهای PRISM با توسعه و اعتبارسنجی آنها در پایگاه داده بزرگی از بیش از 5 میلیون بیمار، که از مقیاس بسیاری از مطالعات قبلی در این زمینه فراتر میرود، متمایز میشوند. MIT. ، وابسته به MIT CSAIL و اولین نویسنده دسترسی باز کاغذ در eBioMedicine تشریح کار جدید. این مدل از دادههای بالینی و آزمایشگاهی معمولی برای پیشبینیهای خود استفاده میکند و تنوع جمعیت ایالات متحده پیشرفت قابلتوجهی نسبت به سایر مدلهای PDAC است که معمولاً به مناطق جغرافیایی خاص محدود میشوند، مانند چند مرکز بهداشتی در ایالات متحده. با استفاده از یک تکنیک منظم سازی منحصر به فرد در فرآیند یادگیری، تعمیم پذیری و تفسیرپذیری مدل ها را بهبود بخشید.
دیوید آویگان، استاد دانشکده پزشکی هاروارد و مدیر مرکز سرطان و رئیس هماتولوژی و بدخیمیهای هماتولوژیک در BIDMC گفت: این گزارش رویکرد قدرتمندی را برای استفاده از دادههای بزرگ و الگوریتمهای هوش مصنوعی برای اصلاح رویکرد ما برای شناسایی پروفایلهای خطر سرطان ترسیم میکند. ، که در مطالعه شرکت نداشت. این رویکرد ممکن است منجر به راهبردهای جدیدی برای شناسایی بیماران در معرض خطر بالای بدخیمی شود که ممکن است از غربالگری متمرکز با پتانسیل مداخله زودهنگام بهره مند شوند.
دیدگاه های منشوری
سفر برای توسعه PRISM بیش از شش سال پیش آغاز شد، که توسط تجربه دست اول با محدودیتهای روشهای تشخیصی فعلی تقویت شد. Appelbaum، نویسنده ارشد که همچنین یک مربی در دانشکده پزشکی هاروارد و همچنین یک متخصص انکولوژیست پرتودرمانی است، میگوید: «تقریباً 80 تا 85 درصد از بیماران سرطان پانکراس در مراحل پیشرفته تشخیص داده میشوند که درمان دیگر گزینهای نیست». “این سرخوردگی بالینی باعث شد تا به کاوش در انبوهی از داده های موجود در پرونده الکترونیک سلامت (EHR) بپردازیم.”
همکاری نزدیک گروه CSAIL با Appelbaum درک بهتر جنبه های ترکیبی پزشکی و یادگیری ماشینی مشکل را امکان پذیر کرد و در نهایت منجر به مدلی بسیار دقیق تر و شفاف تر شد. او می افزاید: “فرضیه این بود که این سوابق حاوی سرنخ های پنهانی هستند – علائم و نشانه های ظریفی که می توانند به عنوان سیگنال های هشدار دهنده اولیه برای سرطان پانکراس عمل کنند.” “این استفاده ما از شبکه های EHR فدرال را در توسعه این مدل ها برای یک رویکرد مقیاس پذیر برای پیاده سازی ابزارهای پیش بینی خطر در مراقبت های بهداشتی هدایت کرد.”
هر دو مدل PrismNN و PrismLR دادههای EHR، از جمله جمعیتشناسی بیمار، تشخیصها، داروها، و نتایج آزمایشگاهی را برای تخمین خطر PDAC تجزیه و تحلیل میکنند. PrismNN از شبکه های عصبی مصنوعی برای تشخیص الگوهای پیچیده در ویژگی های داده مانند سن، سابقه پزشکی و نتایج آزمایشگاهی استفاده می کند که تخمین خطر احتمال PDAC را به دست می دهد. PrismLR از رگرسیون لجستیک برای تجزیه و تحلیل سادهتر استفاده میکند و یک امتیاز احتمالی PDAC بر اساس این ویژگیها ایجاد میکند. با هم، مدلها ارزیابی کاملی از رویکردهای مختلف در پیشبینی خطر PDAC از دادههای EHR یکسان ارائه میدهند.
تیم خاطرنشان می کند یکی از مهمترین نکات برای جلب اعتماد پزشکان، درک بهتر نحوه عملکرد مدل ها است که در این زمینه به عنوان تفسیرپذیر شناخته می شود. دانشمندان خاطرنشان کردند که در حالی که تفسیر مدلهای رگرسیون لجستیک ذاتاً آسانتر است، پیشرفتهای اخیر شبکههای عصبی عمیق را کمی شفافتر کرده است. این به تیم کمک کرد تا هزاران ویژگی پیشبینیکننده بالقوه استخراج شده از EHR یک بیمار را تا حدود 85 معیار حیاتی کاهش دهد. این شاخصها که شامل سن بیمار، تشخیص دیابت و افزایش دفعات مراجعه به پزشک است، بهطور خودکار توسط مدل شناسایی میشوند، اما با درک پزشکان از عوامل خطر مرتبط با سرطان پانکراس مطابقت دارند.
راه پیش رو
با وجود وعدههای مدلهای PRISM، مانند تمام تحقیقات، برخی از قطعات هنوز در حال پیشرفت هستند. فقط داده های ایالات متحده رژیم غذایی مدل فعلی است که نیاز به آزمایش و سازگاری برای استفاده جهانی دارد. تیم اشاره می کند که راه رو به جلو شامل گسترش کاربرد مدل به مجموعه داده های بین المللی و ادغام نشانگرهای زیستی اضافی برای ارزیابی دقیق تر خطر است.
“هدف بعدی ما تسهیل اجرای مدل ها در محیط های معمول مراقبت های بهداشتی است. جیا میگوید: چشمانداز این است که این مدلها در پسزمینه سیستمهای مراقبتهای بهداشتی، بهطور خودکار دادههای بیماران را تجزیه و تحلیل کنند و پزشکان را در مورد موارد پرخطر بدون افزایش حجم کاری، آگاه کنند. یک مدل یادگیری ماشینی که با سیستم EHR ادغام شده است، میتواند پزشکان را با هشدارهای اولیه در مورد بیماران در معرض خطر توانمند کند و به طور بالقوه مداخلات را مدتها قبل از ظاهر شدن علائم ممکن میسازد. ما مشتاق هستیم تا تکنیک های خود را در دنیای واقعی پیاده سازی کنیم تا به همه مردم کمک کنیم از زندگی طولانی تر و سالم تری برخوردار شوند.”
جیا این مقاله را با Applebaum و پروفسور MIT EECS و محقق اصلی CSAIL مارتین رینارد، که هر دو از نویسندگان ارشد مقاله هستند، نوشت. محققان این مقاله در طول مدتی که در MIT CSAIL بودند تا حدی توسط آژانس پروژههای تحقیقاتی پیشرفته دفاعی، بوئینگ، بنیاد ملی علوم و آزمایشگاههای آرنو حمایت شدند. TriNetX منابعی را برای این پروژه فراهم کرد و بنیاد پیشگیری از سرطان نیز از این تیم حمایت کرد.