Back to Search Start Over

Makine öğrenmesi kullanarak düşük kaynaklı diller için radyoloji raporu sınıflandırması : Beyin kanaması tespiti üzerine bır örnek olay incelemesi

Authors :
Bayrak, Gıyaseddin
Ganiz, Murat Can
Marmara Üniversitesi
Fen Bilimleri Enstitüsü
Bilgisayar Mühendisliği Anabilim Dalı
Bilgisayar Mühendisliği Bilim Dalı
Publication Year :
2023

Abstract

Radyoloji raporları hastalık teşhis ve yönetim sürecinde önemli bir role sahiptir. Bazı durumlarda radyoloji raporu, hastayı tedavi eden doktorun derhal harekete geçmesi gereken kritik bir bulguya işaret edebilir. Yapay Zeka, özellikle Doğal Dil İşleme modelleri kullanılarak bu tür vakaların radyoloji raporlarından tespit edilmesi sürecinin otomatikleştirilmesi çok önemlidir, daha hızlı karar verilmesini sağlar ve hayat kurtarabilir. Bu, Türkçe radyoloji raporlarında beyin kanaması tespiti bağlamında kritik bulguları tespit etmeye yönelik yeni bir çalışmadır. Denetimli modellerin eğitimi için yaklaşık 30.000 etiketli Beyin Kanama Bilgisayarlı Tomografi (CT) raporu ve eğitim öncesi ve ince ayar kelime yerleştirme ve dil modelleri için yaklaşık 190 bin rapor kullanıyoruz. Bildiğimiz kadarıyla bu çalışma, büyük ölçekli Türkçe radyoloji raporlarının kullanıldığı ilk çalışmadır. Ayrıca, bu tezde, önceden eğitilmiş dil modellerinde ince ayar yapmanın ve statik kelime kalıplama vektörlerinin başarım üzerindeki etkisini gösterilmiştir ve alana özgü verileri kullanarak ince ayarın sınıflandırma başarımını iyileştirdiği sonucuna varılmıştır. Radiology reports play a vital role in the disease diagnosis and management process, and on certain occasions, they may contain critical findings that require immediate action by the treating physician. Automating the process of detecting such cases using Artificial Intelligence, specifically Natural Language Processing models, can significantly improve the speed of decision-making and potentially save lives. This thesis presents a novel study on detecting critical findings related to brain hemorrhage in Turkish radiology reports. We used approximately 30,000 labeled Brain Hemorrhage Computed Tomography (CT) reports to train supervised models and around 190,000 reports for pre-training and fine-tuning word embeddings and language models in mono-lingual and cross-lingual settings. To the best of our knowledge, this is the first study to utilize a large scale of Turkish radiology reports. Additionally, we demonstrate the impact of adapting pre-trained language models and static embeddings to the domain on the performance, finding that fine-tuning using domain-specific data improves classification accuracy.

Details

Language :
English
Database :
OpenAIRE
Accession number :
edsair.od......3098..28dd81571b30a9810eb0d4b91427bcd1