GPT-4 ile Kliniklerin Fiziksel Muayene Rehberliği: Çalışma Sonuçları
Bir grup araştırmacı, GPT-4 büyük dil modellerinin güçlü performansının, gelecekte hekimlerin bilgi eksikliklerini doldurmaya ve tıbbi durumları teşhis etmeye yardımcı olabilecek bir araç olarak potansiyellerini gösterdiğini sonuçlandırdı. Araştırma, Tıbbi Yapay Zeka Dergisi’nde yayınlandı.
Fiziksel muayeneler, hastanın sağlığı hakkında kritik bilgileri açığa çıkarabilen önemli tanı araçlarıdır; ancak, bir klinik uzmanın o alanda özel eğitimden yoksun olması durumunda karmaşık durumlar gözden kaçabilir.
Önceki araştırmalar, teşhislerin sağlanmasına yardımcı olmak için LLM’lerin kullanılmasını incelemiş olsa da, fiziksel muayenelerdeki kullanımları henüz keşfedilmemiştir.
Bu boşluğu doldurmak için, Mass General Brigham araştırmacıları GPT-4 LLM’yi, hastanın belirtilerine dayalı fiziksel muayene talimatları önermeye yönlendirdi. Çalışma, LLM’lerin klinik uzmanlara fiziksel muayeneler sırasında yardımcı olma potansiyelini göstermektedir.
Uzman Görüşleri
“Kariyerinin başında olan tıbbi profesyoneller, sınırlı deneyimleri veya diğer bağlamsal faktörler gibi nedenlerden dolayı uygun hastaya özgü fiziksel muayeneyi gerçekleştirmede zorluklarla karşılaşabilirler,” dedi kıdemli yazar Dr. Marc D. Succi açıklamasında. Succi, Mass General Brigham’de inovasyon ve ticarileşme başkan yardımcısı ve Tıbbi Olarak Geliştirilmiş Çözümler Sağlık (MESH) İnkübatörü yürütücü direktörüdür.
Succi ve meslektaşları, “GPT-4’ü hastanın ana şikayetine dayalı fiziksel muayene talimatları önermeye yönlendirdi. Örneğin, ağrılı kalça. GPT-4’ün yanıtları, ardından doğruluk, kapsamlılık, okunabilirlik ve genel kalite açısından 1 ila 5 puan ölçeğinde üç devlet hastanesi doktoru tarafından değerlendirildi.”
Araştırmacılar, GPT-4’ün talimat vermede iyi performans gösterdiğini keşfettiler, mümkün olan puanların en az %80’ini aldı. En yüksek puan “Egzersiz Sırasında Bacak Ağrısı” için alındı ve en düşük puan “Alt Karın Ağrısı” içindi.
Neden Önemli?
Araştırmacılar, GPT-4’ün detaylı yanıtlar verdiğini belirterek, bazen önemli talimatları atladığını veya aşırı belirsiz olduğunu tespit ettiklerini, bu durumun bir insan değerlendiriciye ihtiyaç duyduğunu ifade ettiler.
Araştırma yazarları, hazır LLM’leri yardımcı tanı araçları olarak veya başvuran şikayetlere dayalı klinik olarak uygun fiziksel muayene önerileri sağlayarak kullanmanın potansiyelini gösterdiler.
Gelecekte, araştırma yazarları, “gerçek dünya hastalarıyla kullanılarak LLM’lerin geniş ve çeşitli bir klinik senaryo seti için ayarlanabileceğini ve GPT-4’ün teşhis kapasitesinde gözlemlenen boşlukları ele alabileceğini” sonuçlandırdılar.
Araştırmacılar ayrıca, LLM’lerin klinik karar desteklerinde daha büyük bir rol oynamasını bekliyorlar, bilgi boşluklarını doldurarak ve yeni tıp profesyonelleri için akademik bir araç olarak hizmet ederek, hekimlerin teşhis kapasitelerini artırabilirler.