151. Interobserver Variability and Diagnostic Performance in US Assessment of Thyroid Nodule According to Size
- Author
-
Hee Jung Moon, Hye Sun Lee, Yoon Jeong Choi, Jung Hyun Yoon, Jin Young Kwak, Dong-Wook Kim, Seo Jin Park, Eun Kyung Kim, Eun Ju Son, and So Hee Park
- Subjects
Adult ,Male ,Thyroid nodules ,medicine.medical_specialty ,Adolescent ,Biopsy, Fine-Needle ,Thyroid Gland ,Tumor burden ,Sensitivity and Specificity ,Diagnosis, Differential ,Young Adult ,Maximum diameter ,medicine ,Humans ,Radiology, Nuclear Medicine and imaging ,Thyroid Neoplasms ,Thyroid Nodule ,Ultrasonography, Interventional ,Aged ,Retrospective Studies ,Observer Variation ,business.industry ,Thyroid ,Retrospective cohort study ,Nodule (medicine) ,Middle Aged ,medicine.disease ,Tumor Burden ,medicine.anatomical_structure ,Female ,Radiology ,medicine.symptom ,Ultrasonography ,Nuclear medicine ,business ,Kappa - Abstract
To evaluate the interobserver variability for US assessments of thyroid nodules and analyze the diagnostic performances of US assessments in thyroid nodules according to nodule size.This was an IRB-approved retrospective study with waiver of informed consent. A total of 400 surgically-confirmed thyroid nodules were included. Nodules were divided into 4 groups by size; group 1 (nodule size 5 mm), group 2 (5 mm ≤ nodule size 10 mm), group 3 (10 mm ≤ nodule size 20 mm), and group 4 (nodule size ≥ 20 mm). Three experienced (7 - 10 years) radiologists retrospectively reviewed the US images. Agreement of each US descriptor and final US assessment, and diagnostic performances were calculated in each group and compared.Composition represented substantial or good agreement (k = 0.719 - 0.89). Margin showed the lowest agreement (k = 0.322 - 0.365). Individual kappa values for final assessment according to nodule size were as follows: group 1 (k = 0.674), group 2 (k = 0.596), group 3 (k = 0.674), and group 4 (k = 0.673). Specificity, PPV, and accuracy were significantly different among the groups with different size (p value 0.05) and lowest in group 1. NPV, specificity, PPV and accuracy except PPV of observer 3 increased with nodule size (p 0.05).Interobserver agreements were relatively good (k = 0.637) in final US assessment regardless of nodule size in experienced radiologists. High false-positive rate was observed in US assessment in nodules less than 5 mm in maximum diameter.ZIEL:: Die Bewertung der Interobserver-Variabilität und die Analyse der diagnostischen Leistungsfähigkeit bei der US-Beurteilung von Schilddrüsenknoten entsprechend der Größe.Es handelt sich um eine vom IRB genehmigte, retrospektive Studie mit Verzicht auf Einwilligung nach Aufklärung. Eingeschlossen wurden insgesamt 400 operativ bestätigte Schilddrüsenknoten. Die Knoten wurden je nach Größe in 4 Gruppen unterteilt: Gruppe 1 (Knotengröße 5 mm), Gruppe 2 (Knotengröße ≥ 5 mm bis 10 mm), Gruppe 3 (Knotengröße ≥ 10 mm bis 20 mm) und Gruppe 4 (Knotengröße ≥ 20 mm). Drei Radiologen mit 7- bis 10-jähriger Erfahrung bewerteten retrospektiv die US-Bilder. Die Übereinstimmung jedes US-Deskriptors, die US-Endbewertung sowie die diagnostische Leistungsfähigkeit wurden jeder Gruppe berechnet und miteinander verglichen.Die Struktur zeigte eine beachtliche bis gute Übereinstimmung (κ = 0,719 – 0,89). Die Begrenzung zeigte die niedrigste Übereinstimmung (κ = 0,322 – 0,365). Die individuellen Kappa-Werte der Endbewertung nach Knotengröße betrugen: In Gruppe 1 (κ = 0,674), in Gruppe 2 (κ = 0,596), in Gruppe 3 (κ = 0,674) und in Gruppe 4 (κ = 0,673). Spezifität, PVW und Genauigkeit zeigten signifikante Unterschiede zwischen den Gruppen unterschiedlicher Größe (p-Wert 0,05) und waren jeweils in Gruppe 1 am niedrigsten. Abgesehen vom PVW bei Beobachter 3 stiegen NVW, Spezifität, PVW und Genauigkeit mit zunehmender Knotengröße (p 0,05) an.Die Interobserver-Übereinstimmungen erfahrener Radiologen waren unabhängig von der Knotengröße in der Endbewertung relativ gut (κ = 0,637). Eine hohe Rate an falsch positiven Ergebnissen wurde bei der sonografischen Beurteilung von Knoten unter 5 mm maximalem Durchmesser beobachtet.
- Published
- 2012