Conference Paper
BibTex RIS Cite

Binary Logistic Regression and an Aplication

Year 2004, Volume: 3 Issue: 2, 23 - 38, 15.08.2004

Abstract

Regression methods are one of any data analysis concerned with describing the relationship between a response variable and one or more explanatory variables. The logistic regression analysis defines the relation between dichotomous outcome variable and the set of independent variables that contains both continuous and discrete variables. There are some special problems when the response variable is dichotomous. In linear regression model, the error terms are assumed to have a normal distribution with a constant variance for all observations. But in logistic regression model, the error terms are not normal nor a constant variance when the response variable is dichotomous. The general method of estimation for logistic regression model is maximum likelihood. The method of maximum likelihood yields values for the unknown parameters which maximize the probability of obtaining the observed set of data. In order to apply this method, it is necessary to construct the likelihood function firstly. In order to determine whether the parameter is significant to the model or not, Deviance of the model containing the independent variable must be compared with Deviance of the model without the independent variable. This change in D is called G statistic. Odds ratio (Ω) is used to construe the coefficients. There are many factors for patients with lung cancer. The logistic regression method is used for reducing the ratio of cancerous patients and selecting the variables in the model. In order to obtain a solution in this study, univariate analysis of each variable is applied to cancer data. The SPSS software package is used and results are evaluated.

References

  • DARBY S., HILL D., AUVINEN A., DIOS J., BAYSSON H. and so on (2004), Radon in Homes and Risk of Lung Cancer: Collaborative Analysis of Individual Data from 13 European Case Control Studies, BMJ.
  • ELHAN A., (1997). Lojistik Regresyon Analizinin İncelenmesi ve Tıpta Bir Uygulaması, Ankara Üniversitesi Sağlık Bilimleri Enstitüsü, Yüksek Lisans Tezi.
  • GROUVEN U. & BENDER R., (1998). Using Binary Logistic Regression Models for Ordinary Data with Non-proportional Odds. J Clin. Epidemiol, 51, 809-816.
  • HARRELL F, (2001), Regression Modeling Strategies. Springer-Verlag New York.
  • HOSMER D. & LEMESHOW S., (1989), Applied Logistic Regression. John Wiley & Sons.
  • KLEINBAUM D., (1994). Logistic Regression A Self-Learning Text. Springer Verlag New York.
  • LEE C., KO Y., GOGGINS W., HUANG J. And so on (2000). Lifetime Environmental Exposure to Tobacco Smoke and Primary Lung Cancer of Non-Smoking Taiwanese Women, International Journal of Epidemiology, 29, 224-231.
  • MENDENHALL W. & SINCIEH, T., (1996). A Second Course in Statistics. (5th ed.). Prentice Hall.
  • NETER J., KUTNER M.H., NACHSHEIM C.J. and WASSERMAN W., (1996), Applied Linear Regression Methods. (4th ed.). The McGraw-Hill Irwin.
  • SCNEIDER J., BERNGES U., PHILIPP M. AND WOITOWITZ H., (2004), GSTM1, GSTT1 and GSTP1 Polymorphism and Lung Cancer Risk in Relation to Tobacco Smoking. Cancer Letters, 208, 65-74.
  • TATLIDİL H., (1996), Uygulamalı Çok Değişkenli İstatistiksel Analiz, Cem Ofset.
  • VINEIS P., AIROLDI L., VEGLIA, F., OLGIATI, L., PASTORELLI, R. and so on (2005). Environmental Tobacco Smoke and Risk of Respiratory Cancer and Chronic Obstructive Pulmonary Disease in Former Smokers and never Smokers in the EPIC Prospective Study. BMJ.

İkili Lojistik Regresyon Analizi ve Bir Uygulama

Year 2004, Volume: 3 Issue: 2, 23 - 38, 15.08.2004

Abstract

Regresyon yanıt değişkeni ile bir ya da birden fazla açıklayıcı değişkenler arasındaki ilişkiyi bulan veri analiz yöntemlerinden biridir. Lojistik Regresyon analizi ikili yanıt değişkeni ile hem sürekli hem de kesikli değişkenlerden oluşan bağımsız değişkenler kümesi arasındaki ilişkiyi tanımlar. Doğrusal regresyonda hata teriminin bütün gözlemler için sabit varyansla normal dağılır. Fakat yanıt değişkeni ikili olduğu zaman kullanılan lojistik regresyonda ise hata teriminin sabit varyansla dağılmadığı bazı özel durumlar ortaya çıkabilir. Bu lojistik regresyon modeli için genel kestirim yöntemi en çok olabilirliktir. En çok olabilirlik yöntemi gözlenen veri kümesini elde etmenin olasılığını maksimum yapan bilinmeyen parametrelerin değerlerini verir. Bu yöntem için ilk önce en çok olabilirlik fonksiyonunun bulunması gerekmektedir. Modeldeki herhangi bir bağımsız değişkenin önemine karar vermek için model denkleminde o bağımsız değişkenin bulunduğu ve bulunmadığı durumlardaki sapma (Deviance) değerleri karşılaştırılır. Sapma içindeki bu değişim G istatistiği olarak adlandırılır. Farklılıkların oranı (Odds Ratio, Ω) katsayılarının yorumlanması için kullanılır. İnsanlarda akciğer kanseri olmayı etkileyen birçok faktör vardır. Lojistik regresyon analizi kanser olmanın oranın azaltmak için modelde yer alan değişkenleri seçmek amacıyla kullanılmıştır. Bu uygulamada bunun sonucunun elde edilmesi için uygulanan lojistik regresyon analizinin adımları SPSS paket programı ile yapılmıştır ve hemen arkasından sonuçlar yorumlanmıştır.

References

  • DARBY S., HILL D., AUVINEN A., DIOS J., BAYSSON H. and so on (2004), Radon in Homes and Risk of Lung Cancer: Collaborative Analysis of Individual Data from 13 European Case Control Studies, BMJ.
  • ELHAN A., (1997). Lojistik Regresyon Analizinin İncelenmesi ve Tıpta Bir Uygulaması, Ankara Üniversitesi Sağlık Bilimleri Enstitüsü, Yüksek Lisans Tezi.
  • GROUVEN U. & BENDER R., (1998). Using Binary Logistic Regression Models for Ordinary Data with Non-proportional Odds. J Clin. Epidemiol, 51, 809-816.
  • HARRELL F, (2001), Regression Modeling Strategies. Springer-Verlag New York.
  • HOSMER D. & LEMESHOW S., (1989), Applied Logistic Regression. John Wiley & Sons.
  • KLEINBAUM D., (1994). Logistic Regression A Self-Learning Text. Springer Verlag New York.
  • LEE C., KO Y., GOGGINS W., HUANG J. And so on (2000). Lifetime Environmental Exposure to Tobacco Smoke and Primary Lung Cancer of Non-Smoking Taiwanese Women, International Journal of Epidemiology, 29, 224-231.
  • MENDENHALL W. & SINCIEH, T., (1996). A Second Course in Statistics. (5th ed.). Prentice Hall.
  • NETER J., KUTNER M.H., NACHSHEIM C.J. and WASSERMAN W., (1996), Applied Linear Regression Methods. (4th ed.). The McGraw-Hill Irwin.
  • SCNEIDER J., BERNGES U., PHILIPP M. AND WOITOWITZ H., (2004), GSTM1, GSTT1 and GSTP1 Polymorphism and Lung Cancer Risk in Relation to Tobacco Smoking. Cancer Letters, 208, 65-74.
  • TATLIDİL H., (1996), Uygulamalı Çok Değişkenli İstatistiksel Analiz, Cem Ofset.
  • VINEIS P., AIROLDI L., VEGLIA, F., OLGIATI, L., PASTORELLI, R. and so on (2005). Environmental Tobacco Smoke and Risk of Respiratory Cancer and Chronic Obstructive Pulmonary Disease in Former Smokers and never Smokers in the EPIC Prospective Study. BMJ.
There are 12 citations in total.

Details

Primary Language Turkish
Subjects Quantitative Decision Methods
Journal Section Research Articles
Authors

Özgül Vupa Çilengiroğlu

Serdar Kurt This is me

Publication Date August 15, 2004
Published in Issue Year 2004 Volume: 3 Issue: 2

Cite

APA Vupa Çilengiroğlu, Ö., & Kurt, S. (2004). İkili Lojistik Regresyon Analizi ve Bir Uygulama. İstatistik Araştırma Dergisi, 3(2), 23-38.