Objective: Modeling right-censored data becomes a challenging task in survival analysis, due to having an incomplete data structure. When the response variable is rightcensored, classical estimation methods cannot be used directly. Therefore, the censorship problem should be solved before the modeling process. The purpose of this study is to solve the censorship problem with synthetic data transformation and to make a comparison between the partial linear model (PLM) and feed forward neural networks (FFNN), two popular modeling procedures in recent years, in terms of model residuals. Thus, it is to study the behavior of methods. Material and Methods: This paper aims to estimate the effects of explanatory variables on a right-censored response variable whose distribution is unknown by two different methods, PLM and FFNN based on the spline smoothing method. The spline smoothing method is a mathematical approximation method used in PLM estimation. FFNN is a machine learning method that has become very popular recently and produces satisfactory models. To overcome the censorship problem, the right-censored response variable for the two mentioned methods has been replaced with synthetic data. Synthetic data transformation is a widely used censorship resolution method that allows censorship presence to be included in the prediction process. Results: To achieve the aim of the study, both simulation and real data studies were carried out and the results were presented. Conclusion: Kidney weakness data is used as an example of real data. When the results are examined, it is seen that FFNN is superior to PLM in both numerical studies.
Keywords: Feed forward neural networks; smoothing spline; partially linear models; right-censored data
Amaç: Eksik bir veri yapısına sahip olması nedeniyle sağdansansürlenmiş verilerin modellenmesi, sağkalım analizinde zor bir işlemdir. Yanıt değişkeni sağdan sansürlendiğinde, klasik tahmin yöntemleri doğrudan kullanılamaz. Bu nedenle modelleme sürecinden önce sansür problemi çözülmelidir. Bu çalışmanın amacı, sansür problemini sentetik veri dönüşüm ile çözerek literatürde son yıllarda popüler olarak kullanılan 2 modelleme prosedürü olan kısmi doğrusal model [partial linear model (PLM)] ve ileri beslemeli sinir ağları [feed forward neural networks (FFNN)] arasında model artıkları açısından bir karşılaştırma yapmak ve böylece yöntemlerin davranışlarını incelemektir. Gereç ve Yöntemler: Bu makale, açıklayıcı değişkenlerin, dağılımı bilinmeyen sağdan sansürlü bir yanıt değişkeni üzerindeki etkilerini, splayn düzleştirme yöntemine dayalı PLM ve FFNN olmak üzere 2 farklı yöntemle tahmin etmeyi amaçlar. Splayn düzleştirme yöntemi, PLM tahmininde kullanılan matematiksel yaklaştırma yöntemidir. FFNN ise son zamanlarda oldukça popülerleşen ve tatmin edici modeller üreten bir makine öğrenmesi yöntemidir. Sansür sorununun üstesinden gelmek için bahsedilen 2 yöntem için sağdan sansürlü yanıt değişkeni sentetik verilerle değiştirilmiştir. Sentetik veri dönüşümü, sansür varlığını tahmin sürecine dâhil edilmesini sağlayan yaygın kullanılan bir sansür çözüm yöntemidir. Bulgular: Çalışmanın amacına ulaşmak için hem simülasyon hem de gerçek veri çalışmaları yapılmış ve sonuçlar sunulmuştur. Sonuç: Gerçek veri örneği olarak böbrek zayıflığı verisi kullanılmıştır. Sonuçlar incelendiğinde, her iki sayısal çalışmada da FFNN'nin PLM'ye üstünlük sağladığı açıkça görülmektedir.
Anahtar Kelimeler: İleri beslemeli sinir ağları; splayn düzleştirme; kısmi doğrusal modeller; sağdan-sansürlü veri
- Green PJ, Silverman BW. Nonparametric Regression and Generalized Linear Model. 1st ed. London: Chapman & Hall; 1994. [Crossref]
- Hardle W. Applied Nonparametric Regression. 1st ed. Cambridge: Cambridge University Press; 1990.
- Koul H, Susarla V, Van Ryzin J. Regression analysis with randomly right-censored data. The Annals of Statistics. 1981;9(6):1276-85. [Crossref]
- Leurgans S. Linear models, random censoring and synthetic data. Biometrika. 1987;74:301-9. [Crossref]
- Qin G, Jing B. Asymptotic properties for estimation of partial linear models with censored data. Journal of Statistical Planning and Inference. 2000;84(1-2):95-110. [Crossref]
- Orbe J, Ferreira E, Nú-ez-Antón V. Censored partial regression. Biostatistics. 2003;4(1):109-21. [Crossref] [PubMed]
- Aydın D, Yılmaz E. Modified estimators in semi-parametric regression models with right-censored data. Journal of Statistical Computation and Simulation. 2018;88:1470-98. [Crossref]
- Faraggi D, Simon RA. Neural network model for survival data. Statistics in Medicine. 1995;14:73-82. [Crossref] [PubMed]
- Biganzoli E, Boracchi P, Mariani L, Marubini E. Feed forward neural networks for the analysis of censored survival data: a partial logistic regression approach. Stat Med. 1998;17(10):1169-86. [Crossref] [PubMed]
- Biganzoli E, Boracchi P, Marubini E. A general framework for neural network models on censored survival data. Neural Netw. 2002;15(2):209-18. [Crossref] [PubMed]
- Azadeh A, Keramati A, Tolouei H, Parvari R, Pashapour S. Estimation and optimization of right-censored data in survival analysis by neural network. International Journal of Business Information Systems. 2013;14:322-34. [Crossref]
- Kalderstam J, Edén P, Bendahl PO, Strand C, Fernö M, Ohlsson M. Training artificial neural networks directly on the concordance index for censored data using genetic algorithms. Artif Intell Med. 2013;58(2):125-32. [Crossref] [PubMed]
- Stute W. Nonlinear censored regression. Statistica Sinica. 1999;9:1089-102. [Link]
- Kaplan EL, Meier P. Nonparametric estimation from incomplete observations. Journal of the American Statistical Association. 1958;53(282):457-81. [Crossref]
- Werbos PJ. Beyond regression: new tools for prediction and analysis in the behavioral sciences [PhD thesis]. Cambridge: Harvard University; 1974. Erişim Tarih: 2022 [Link]
- Nagl S. Neural network models of protein domain evolution. Hyle. 2000;6:143-59. [Link]
- Kadılar C, Şimşek M, Aladağ CH. Forecasting the exchange rate series with ANN: the case of Turkey. Istanbul University Journal of Econometrics and Statistics. 2009;9:17-29. [Link]
- McGilchrist CA, Aisbett CW. Regression with frailty in survival analysis. Biometrics. 1991;47(2):461-6. [Crossref] [PubMed]
- Zain AM, Haron H, Qasem SN, Sharif S. Regression and ANN models for estimating minimum value of machining performance. Applied Mathematical Modelling. 2012;36(4):1477-92. [Crossref]
- Adamowski J, Karapataki C. Comparison of multivariate regression and artificial neural networks for peak urban water-demand forecasting: evaluation of different ANN learning algorithms. Journal of Hydrologic Engineering. 2010;15(10):729-43. [Crossref]
.: Process List