Yetişkinlerde primer hiperparatiroidizm tahmini: Makine öğrenimi modellerinin rolü
Abstract
Giriş ve Amaç: Primer hiperparatiroidizm (PHPT), paratiroid bezlerin aşırı parathormon (PTH) salgılaması sonucu kalsiyum-fosfor metabolizma bozukluğu ile karşımıza çıkan diyabet ve hipotiroididen sonra 3. sıklıkta görülen endokrin patolojidir. Primer hiperparatiroidizm çoğunlukla asemptomatiktir; genellikle rutin laboratuvar testlerinde rastlanan PTH veya kalsiyum (Ca) yüksekliği esnasında saptanır. Parathormonun yüksekliğinin tek sebebi PHPT değildir. Parathormon yüksekliğe sebep olan sekonder hiperparatiroidizm (SHPT) sebepleri de vardır. Parathormon yüksekliğine sebep olan tanın konması klinisyen için zorlayıcı olabilir. Çalışmamızın amacı; makine öğrenimi yöntemlerinin PHPT tanısındaki doğruluk düzeylerini değerlendirmek ve geleneksel istatiksel analiz yöntemlerine göre üstünlüğü olup olmadığını belirlemeye çalıştık. Gereç ve Yöntem: Çanakkale Onsekiz Mart Üniversite Hastanesi Endokrin Polikliniğe Ocak 2018 ve Ekim 2022 tarihleri arasında başvurup 18 yaş üstü ve 85 yaş altı serum PTH yüksek olan hastalar retrospektif olarak değerlendirildi. Bu hastaların yaş, cinsiyet, serumda PTH, albümine göre düzeltilmiş Ca, fosfor, 25-OH vitamin D ve CKD-EPI(Chronic Kidney Disease Epidemiology Collaboration) denklemine göre hesaplanmış glomerüler filtrasyon hızı (GFR) parametreleri analizde kullanıldı. Gebe, aktif malignitesi, organ yetmezliği olan, GFR 60 altında, bir kez PTH yüksekliği saptanan ve kesin tanı konulamayan 376 hasta çalışmadan çıkarıldı. Toplam 274 hasta çalışmamıza dahil edildi. Primer hiperparatiroidizm 74 hasta, SHPT 200 hasta olarak sınıflandırıldı. Çalışmamızda yedi ayrı makine öğrenim modeli kullanıldı. Makine öğrenim yöntem performansları karşılaştırıldı. D vitamin parametresi olmadan da makine öğrenimi modellerinin performanslarına bakıldı. Bulgular: Primer hiperparatiroidi olan hastaların ortanca yaş 60.0 ve SHPT olan hastaların ortanca yaş 59.0'dı ve yaşlar arasında anlamlı fark yoktu (p=0.793). Her iki grupta kadın cinsiyet hâkimdi; ancak cinsiyet dağılımları arasında fark yoktu (%87.8 vs. %88, p=0.971). Primer hiperparatiroidi olan hastaların düzeltilmiş Ca değerleri SHPT olan hastalara göre daha yüksekti (ortanca: 10.6 vs. ortanca: 9.2, p=<0.001). Primer hiperparatiroidi olan hastaların PTH değerleri de SHPT olan hastalara göre daha yüksekti ( ortanca: 144.6 vs. ortanca: 83.3, p=<0.001). D vitamini içeren yedi ayrı makine öğrenimi modelinin AUC değerleri birbirine benzerdi ve PHPT riskini tahmin etmede başarılı olduğu görüldü. Modellerinin en yüksek AUC değeri %99 oranında genelleştirilmiş doğrusal modelde (GLM) görüldü. En düşük AUC ise %94 ile gradyan artırma karar ağacı (GBDT) modeliydi. F1 skorları birbirinden farklıydı; en yüksek F1 skoru %85 ile karar ağacı (DT) modeli olarak çıktı. En düşük F1 skoru %65 ile rastgele orman (RF) modeliydi. D vitamini parametresini kullanmadan yedi makine öğrenimi modelinin yine AUC değerleri birbirine benzerdi ve PHPT riskini tahmin etmede başarılı olduğu görüldü. En yüksek AUC değeri %96 ile RF modelinde görüldü. En düşük %89 ile GLM ve Naive Bayes (NB) modeliydi. F1 skorları birbirinden farklıydı; en yüksek F1 skoru %82 ile DT modeliydi. En düşük F1 skoru %62 ile GLM oldu. Sonuç: Çalışmamıza göre makine öğrenimi modelleri klasik istatistik yöntemlerinden olan lojistik regresyon (LR) modelinden daha yüksek performans göstererek PHPT riskini daha iyi tahmin edebileceği ortaya çıktı. En iyi performans gösteren ve en yüksek oranda PHPT tahmin eden makine öğrenimi metodu DT modeli oldu. Çalışmamızda D vitamini olmadan da PHPT tanısının makine öğrenimi yöntemleriyle başarılı bir şekilde saptanabileceğini gösterdik. Bu modeller arasında da en iyi performans gösteren yöntem yine DT modeli oldu. Introduction and Purpose: Primary hyperparathyroidism (PHPT) is the third most common endocrine pathology after diabetes and hypothyroidism, which presents with calcium-phosphorus metabolism disorder as a result of excessive parathormone (PTH) secretion by the parathyroid glands. Primary hyperparathyroidism is mostly asymptomatic; It is usually detected during the elevation of PTH or calcium (Ca) found in routine laboratory tests. Primary hyperparathyroidism is not the only reason for high PTH. There are also secondary hyperparathyroidism (SHPT) causes that cause PTH elevation. Diagnosing the cause of high PTH may be challenging for the clinician. The aim of our study; We tried to evaluate the accuracy of machine learning methods in the diagnosis of PHPT and to determine whether they have superiority over traditional statistical analysis methods. Material-Method: Patients who were admitted to Çanakkale Onsekiz Mart University Hospital Endocrine Polyclinic between January 2018 and October 2022 and had elevated serum PTH over the age of 18 and below the age of 85 were evaluated retrospectively. Age, gender, serum PTH, adjusted for albümin Ca, phosphorus, 25-OH vitamin D and glomerular filtration rate (GFR) parameters calculated according to the CKD-EPI (Chronic Kidney Disease Epidemiology Collaboration) equation of these patients were used in the analysis. 376 patients who were pregnant, with active malignancy, organ failure, under GFR 60, with elevated PTH once and for whom a definitive diagnosis could not be made were excluded from the study. A total of 274 patients were included in our study. Primary hyperparathyroidism was classified as 74 patients, SHPT as 200 patients. Seven different machine learning models were used in our study. Machine learning method performances were compared. The performances of the machine learning models were also examined without the vitamin D parameter. Findings: The median age of the patients with primary hyperparathyroidism was 60.0 and the median age of the patients with SHPT was 59.0 years, and there was no significant difference between the ages (p=0.793). Female gender predominated in both groups; however, there was no difference between gender distributions (87.8% vs. 88%, p=0.971). Patients with PHPT had higher corrected Ca values than patients with SHPT (median: 10.6 vs. median: 9.2, p=<0.001). Parathormone values of patients with PHPT were also higher than those with SHPT (median: 144.6 vs. median: 83.3, p=<0.001). Seven separate machine learning models containing vitamin D had similar AUC values and were successful in predicting the risk of PHPT. The highest AUC value of the models was seen in the generalized linear model (GLM) with a rate of 99%. The lowest AUC was the gradient boost decision tree (GBDT) model with 94%. F1 scores varied; The decision tree (DT) model had the highest F1 score with 85%. The lowest F1 score was the random forest (RF) model with 65%. The AUC values of the seven machine learning models, again, without using the vitamin D parameter, were similar to each other and were successful in predicting the risk of PHPT. The highest AUC value of 96% was seen in the RF model. The lowest was the GLM and Naive Bayes (NB) model with 89%.F1 scores varied; The highest F1 score was the DT model with 82%.The lowest F1 score was GLM with 62%. Conclusion: According to our study, it turned out that machine learning models can better predict PHPT risk by outperforming the logistic regression (LR) model, which is one of the classical statistical methods. The machine learning method that performed the best and predicted the highest rate of PHPT was the DT model. In our study, we showed that the diagnosis of PHPT can be successfully detected by machine learning methods even without vitamin D. Among these models, the best performing method was again the DT model.
URI
https://tez.yok.gov.tr/UlusalTezMerkezi/TezGoster?key=j_Fjwp4JS4mk97Puqti8rmtjxJCciXjouybL2LadJyLZ8CRvRnOG5okJ9mukM0Y2https://hdl.handle.net/20.500.12428/5212