Regression methods are one of any data analysis concerned with describing the relationship between a response variable and one or more explanatory variables. The logistic regression analysis defines the relation between dichotomous outcome variable and the set of independent variables that contains both continuous and discrete variables. There are some special problems when the response variable is dichotomous. In linear regression model, the error terms are assumed to have a normal distribution with a constant variance for all observations. But in logistic regression model, the error terms are not normal nor a constant variance when the response variable is dichotomous. The general method of estimation for logistic regression model is maximum likelihood. The method of maximum likelihood yields values for the unknown parameters which maximize the probability of obtaining the observed set of data. In order to apply this method, it is necessary to construct the likelihood function firstly. In order to determine whether the parameter is significant to the model or not, Deviance of the model containing the independent variable must be compared with Deviance of the model without the independent variable. This change in D is called G statistic. Odds ratio (Ω) is used to construe the coefficients. There are many factors for patients with lung cancer. The logistic regression method is used for reducing the ratio of cancerous patients and selecting the variables in the model. In order to obtain a solution in this study, univariate analysis of each variable is applied to cancer data. The SPSS software package is used and results are evaluated.
Regresyon yanıt değişkeni ile bir ya da birden fazla açıklayıcı değişkenler arasındaki ilişkiyi bulan veri analiz yöntemlerinden biridir. Lojistik Regresyon analizi ikili yanıt değişkeni ile hem sürekli hem de kesikli değişkenlerden oluşan bağımsız değişkenler kümesi arasındaki ilişkiyi tanımlar. Doğrusal regresyonda hata teriminin bütün gözlemler için sabit varyansla normal dağılır. Fakat yanıt değişkeni ikili olduğu zaman kullanılan lojistik regresyonda ise hata teriminin sabit varyansla dağılmadığı bazı özel durumlar ortaya çıkabilir. Bu lojistik regresyon modeli için genel kestirim yöntemi en çok olabilirliktir. En çok olabilirlik yöntemi gözlenen veri kümesini elde etmenin olasılığını maksimum yapan bilinmeyen parametrelerin değerlerini verir. Bu yöntem için ilk önce en çok olabilirlik fonksiyonunun bulunması gerekmektedir. Modeldeki herhangi bir bağımsız değişkenin önemine karar vermek için model denkleminde o bağımsız değişkenin bulunduğu ve bulunmadığı durumlardaki sapma (Deviance) değerleri karşılaştırılır. Sapma içindeki bu değişim G istatistiği olarak adlandırılır. Farklılıkların oranı (Odds Ratio, Ω) katsayılarının yorumlanması için kullanılır. İnsanlarda akciğer kanseri olmayı etkileyen birçok faktör vardır. Lojistik regresyon analizi kanser olmanın oranın azaltmak için modelde yer alan değişkenleri seçmek amacıyla kullanılmıştır. Bu uygulamada bunun sonucunun elde edilmesi için uygulanan lojistik regresyon analizinin adımları SPSS paket programı ile yapılmıştır ve hemen arkasından sonuçlar yorumlanmıştır.
En Çok Olabilirlik Farklılıkların Oranı (Ω) İkili Lojistik Regresyon Olabilirlik Oran Testi
Primary Language | Turkish |
---|---|
Subjects | Quantitative Decision Methods |
Journal Section | Research Articles |
Authors | |
Publication Date | August 15, 2004 |
Published in Issue | Year 2004 Volume: 3 Issue: 2 |