Başlık: Açık Kaynaklı Yapay Zeka Aracı Tıbbi Tanıda Lider Modellerle Rekabet Ediyor

Yapay zeka, tıpta birçok şekilde dönüşüm yaratabilir, bunlardan biri de yoğun hekimlere güvenilir bir teşhis yardımcısı olarak işlev görebilme vaadidir. Son iki yılda, zor çözümlenmesi gereken karmaşık klinik mantık gerektiren tıbbi vakalarda kapalı kaynaklı yapay zeka modelleri, başarılı olmuştur. Özellikle, bu kapalı kaynaklı yapay zeka modelleri, herkes tarafından ayarlanabilir ve değiştirilebilir olan açık kaynaklı modellerden daha iyi performans sergilemiştir.

Açık kaynaklı yapay zeka yetişti mi?
Yanıt evet gibi görünüyor, en azından bir açık kaynaklı yapay zeka modeli için böyle. Yeni NIH tarafından finanse edilen bir araştırmanın sonuçlarına göre, Harvard Tıp Okulu’ndaki araştırmacıların liderliğinde ve Harvard’a bağlı Beth Israel Deaconess Tıp Merkezi ve Brigham and Women’s Hastanesi’ndeki kliniklerle işbirliği içinde yapılan bir araştırmada, bu açık kaynaklı yapay zeka aracının rakip bir model olan GPT-4 ile aynı performansı sergilediği gösterildi. Çalışmada, araştırmacılar, The New England Journal of Medicine’in haftalık zorlu klinik senaryolarını içeren 92 şaşırtıcı vakayı değerlendirmişlerdir.

Sonuçlar, açık kaynaklı yapay zeka araçlarının giderek rekabetçi hale geldiğini ve kapalı kaynaklı modellere değerli bir alternatif sunabileceğini göstermektedir.

“Bu, açık kaynaklı bir yapay zeka modelinin, doktorlar tarafından değerlendirildiği gibi zorlu vakalarda GPT-4 ile aynı performansı sergilediği ilk kez olduğu bilgimiz dahilindedir. Gerçekten de Llama modellerinin önde gelen kapalı kaynaklı modelle bu kadar hızlı bir şekilde yetişmesi şaşırtıcıdır. Hastalar, sağlık hizmeti sağlayıcıları ve hastaneler bu rekabetten faydalanabilirler.” Dedi.

Açık kaynaklı ve kapalı kaynaklı yapay zeka sistemlerinin artıları ve eksileri
Açık kaynaklı yapay zeka ve kapalı kaynaklı yapay zeka birkaç önemli yönüyle farklılık gösterir. İlk olarak, açık kaynaklı modeller, hastanenin özel bilgisayarlarında indirilip çalıştırılabilir, böylece hasta verileri yerinde tutulabilir. Kapalı kaynaklı modeller ise harici sunucularda çalışır ve kullanıcıların özel verileri harici olarak iletmelerini gerektirir.

“Açık kaynaklı model, birçok baş bilgi yöneticisi, hastane yöneticisi ve doktor için muhtemelen daha çekici olacaktır, çünkü verilerin hastaneden başka bir varlığa, hatta güvenilen birine bile gitmesiyle ilgili temel bir farklılık var.” Dedi çalışmanın baş yazarı Thomas Buckley, HMS Biyomedikal Bilgi Bilimleri Bölümü’nde yeni AI in Medicine izleğinde doktora öğrencisi.

İkinci olarak, tıp ve BT profesyonelleri, açık kaynaklı modelleri benzersiz klinik ve araştırma ihtiyaçlarını ele almak üzere ayarlayabilirken, kapalı kaynaklı araçlar genellikle daha zor uyarlanabilir.

Bu, Buckley’e göre, çok önemli. “Bu anahtar,” dedi Buckley. “Bu modelleri, temel düzeyde veya sofistike bir şekilde, yerel verileri ayarlamak için kullanabilirsiniz, böylece kendi doktorlarınızın, araştırmacılarınızın ve hastalarınızın ihtiyaçlarına göre uyarlanmış hale getirilirler.”

Üçüncü olarak, OpenAI ve Google gibi kapalı kaynaklı yapay zeka geliştiricileri, kendi modellerini barındırır ve geleneksel müşteri desteği sağlarken, açık kaynaklı modeller, model kurulumu ve bakım sorumluluğunu kullanıcılara bırakır. Ve en azından şimdiye kadar, kapalı kaynaklı modellerin elektronik sağlık kayıtları ve hastane BT altyapısıyla daha kolay entegre oldukları kanıtlanmıştır.

Açık kaynaklı yapay zeka ile kapalı kaynaklı yapay zeka: Zorlu klinik vakaları çözmek için bir puan tablosu
Açık kaynaklı ve kapalı kaynaklı yapay zeka algoritmaları, tıp kitapları, hakemli araştırmalar, klinik karar destek araçları ve anonimleştirilmiş hasta verileri gibi geniş veri kümelerinde eğitilir. Bu algoritmalar, bu materyalleri hızla tarayarak desenler öğrenir. Örneğin, patoloji slaytlarında kanserli ve iyi huylu tümörler nasıl görünür? Kalp yetmezliğinin ilk belirtileri nelerdir? Bir CT taramasında normal ve iltihaplı bir kolon arasındaki farkı nasıl ayırt edersiniz? Yeni bir klinik senaryo sunulduğunda, yapay zeka modelleri, gelen bilgileri eğitim sırasında öğrendikleri içeriğe karşı karşılaştırır ve olası teşhisler önerir.

Araştırmacılar, yeni çalışmalarının yazarı olan Adam Rodman liderliğindeki daha önce kullanılan 70 zorlu klinik NEJM vakasında GPT-4’ün performansını değerlendirmek için Llama’yı test ettiler ve yeni araştırma üzerinde birlikte yazar olan HMS iç hastalıkları asistan profesörüdür. Yeni çalışmada, araştırmacılar, Llama’nın temel eğitim döneminde 70 yayınlanmış vakadan bazılarını yanlışlıkla karşılaşmış olma olasılığını önlemek için eğitim döneminin sonundan sonra yayınlanan 22 yeni vakayı eklediler.

Açık kaynaklı model gerçekten derinlik gösterdi: Llama, vakaların %70’inde doğru teşhis koydu, GPT-4 için bu oran %64 idi. Ayrıca, doğru seçeneği ilk öneri olarak %41 zaman sıraladı, GPT-4 için bu oran %37 idi. 22 yeni vakayı içeren alt küme için, açık kaynaklı model daha yüksek puan aldı, doğru kararı %73 oranında verdi ve nihai teşhisi ilk öneri olarak %45 oranında belirledi.

“Doktor olarak, güçlü büyük dil modellerine dair odak çok fazla kapalı modellere odaklanmıştır ve bunları yerel olarak çalıştıramadığımız için,” dedi Rodman. “Çalışmamız, açık kaynaklı modellerin belki de aynı derecede güçlü olabileceğini gösteriyor, bu da doktorlara ve sağlık sistemlerine, bu teknolojilerin nasıl kullanıldığı konusunda çok daha fazla kontrol sağlıyor.”

Her yıl, ABD’de 795.000 hastanın teşhis hatası nedeniyle öldüğü veya kalıcı engellilik yaşadığı bildirilmiştir.

Hasta üzerindeki hemen etkinin ötesinde, teşhis hataları ve gecikmeleri sağlık bakım sistemine ciddi bir mali yük getirebilir. Yanlış veya geç teşhisler gereksiz testlere, uygun olmayan tedavilere ve bazı durumlarda, zamanla daha zor ve pahalı bir şekilde yönetilebilecek ciddi komplikasyonlara yol açabilir.

“Mevcut sağlık altyapısında akıllıca kullanıldığında ve sorumlu bir şekilde entegre edildiğinde, yapay zeka araçları yoğun hekimler için değerli yardımcılar ve güvenilir teşhis yardımcıları olabilir, hem teşhisin doğruluğunu hem de hızını artırabilirler.” Dedi Manrai. “Ancak, bu teknolojilerin doktorlar için çalışmasını sağlamak için doktorların bu çabaları yönlendirmeleri son derece önemlidir.”

Kaynak:Journal referansı:Buckley, T. A., et al. (2025). Karışık Teşhisler için Sınır Açık Kaynaklı ve Kapalı Kaynaklı Büyük Dil Modellerinin Karşılaştırılması. JAMA Sağlık Forumu. doi.org/10.1001/jamahealthforum.2025.0040.