Regresyon analiz nedir? denildiğinde, istatistikçilerin açıklayabileceği onlarca olgunun olduğunu söyleyebiliriz. Regresyon analizi, kuşkusuz istatistiksel analiz alanında çok yaygın olarak kullanılan bir veri analizi yöntemi ve hem tanımlayıcı, hem de öngörücü amaçlara sahip muhteşem bir teknik!
Bu tekniğin detaylarına başlamadan önce tarihsel kökenine göz atalım. Regresyon kelimesinin kökeni Latince’de geriye dönmek anlamındaki “regressus”kelimesine dayanıyor. Anlatılmak istenilen şey, çok sayıdaki yoğun verilerden anlamlı açık bir şekilde tanımlanmış, anlamlı bir modele dönüş.
Regresyon Analizi ve Temel bir Örnek
Regresyon analizi nedir? Ne için kullanılıyor? Bu soruya cevap vermeden önce iki kavramı iyi bilmemiz lazım: Bağımlı ve bağımsız değişken (veya değişkenler). Gece yarısı saat 23:00’dan sonra Netflix‘te bir dizi seyrettiğimizi ve bu sırada atıştırmalık cips yediğimizi düşünelim.
Bu yeme alışkanlığımız bize zamanla kilo aldıracaktır. Kısacası gece yarısı yemek yediğimizde kilo alırız. Bunun tam tersi geçerli olabilir mi? Yani kilo almamız gece yarısı Netflix seyrederken yediğimiz cips miktarını artırabilir mi? Elbette artırmaz.
Bu örnekten hareketle aldığımız kilo sonuç, tükettiğimiz cips de sebeptir. İşte bu sonuç değişkenine bağımlı; sebep değişkenine de bağımsız değişkendiyoruz. Amacımız geceleri tüketilen cips miktarı (bağımsız değişken) değişkeninin alınan kilo miktarı (bağımlı değişken) değişkeni üzerinde nasıl bir etkiye sahip olduğunu gözlemlemek ise, regresyon analizini kullanıyoruz.
Bu tekniği uygulamadan önce bağımlı ve bağımsız değişkenlerimizi önceden belirlememiz gerekiyor. Regresyon analizinin temel çıkış noktası; bağımsız değişkenlerden yola çıkarak bağımlı değişken üzerinde çıkarımlar yapabileceğimiz matematiksel bir model kurmaktır.
Regresyon Analizi Neyi Amaçlar?
Bu sorunun iki cevabı var:
1) Seçilen bağımsız değişkenlerden hareketle bağımlı değişkeni tahmin etmek
2) Bağımsız değişkenlerin bağımlı değişken üzerinde nasıl bir etkiye sahip olduğunu keşfetmek
Bu amaçları doğru bir şekilde kurgulamak oldukça zor. Çok sayıda özel koşul, çok sayıda özel tahmin tekniği var. Bu teknikleri göz ardı ettiğimizde elde ettiğimiz regresyon modeli de yanlış sonuçlara yol açacaktır. Nitekim makalelerde istenmeyen sonuçlar içeren regresyon modelleri ile sıkça karşılaşmaktayız.
Peki bu analizin sonucunda biz ne elde edebiliriz? Matematiksel bir denklem. Bu denklemin yanı sıra regresyon katsayılarına dair anlamlılık değerleri de elde ediyoruz. Tabi bu parametrik regresyon modelleri için geçerli.
Regresyon analizleri sonucunda beta katsayıları hesaplanıyor. Bu beta katsayılarının istatistiksel olarak anlamlı olması, ilgili açıklayıcı değişkenlerin de anlamlı olması anlamına geliyor!
İstatistiksel analizlerde ancak anlamlı olan katsayıları yorumlayabiliyoruz. Ya sonra? Artık yavaş yavaş regresyon analizi nedir sorusunun cevabını almaya başlıyoruz.
İlişkilerin yönünü belirleyebilmemiz içinbeta katsayılarının işaretlerini kontrol ediyoruz. Negatif değere sahip beta katsayıları bağımlı değişken ile ters yönlü; pozitif beta katsayıları da bağımlı değişken ile aynı yönlü ilişkiye işaret ediyor.
Lineer regresyon analizi sonuçlarında beta katsayıları ile korelasyon katsayılarının işaretlerinin de uyumlu olması gerekiyor.
Peki regresyon katsayıları lineer regresyon modellerinde sıfır değerini alabilir mi? Asla alamaz.
Bunun için lasso regresyon analizi gibi özel yaklaşımlar kullanılıyor.
Beta katsayılarını elde ettikten sonra açıklayıcı değişkenlerin değerlerini denklemde yazarak tahmin yapabiliriz.
Örneğin; kan testi yapmaksızın kolestrol değerimizi tahmin etmek istedik. Bunun için bağımlı değişkenimizi (kolestrol) etkileyebilecek olası açıklayıcı değişkenleri (vücut kitle indeksi vb.) gibi değişkenler üzerinden bir regresyon modeli tahmin ediyoruz.
Modelde yer alan açıklayıcı değişkenlerimizin anlamlılıklarını kontrol ediyor; sonrasında hesapladığımız katsayılar üzerinden kolestrol ölçümlerimizi tahmin edebiliyoruz. İstatistiksel olarak anlamsız olan değişkenlerin modelde yer almaması önerilir!
Görüldüğü gibi, regresyon analizi nedir dediğimizde karşımızda dikkat edilmesi gereken çok sayıda farklı nokta yer alıyor.
Regresyon analizinden bahsettiğimizde, ilk olarak SPSS, R ya da Minitab programı ile uygulanan normal dağılıma uygun lineer regresyon modelini anlıyoruz. Halbuki o kadar çok farklı yaklaşım var ki, anlatabilmek için sayfalar yetmez.
Bu yazımızda kısaca regresyon analizi nedir? sorusunu cevaplamaya çalıştık. İlerleyen yazılarımızda regresyon analizinin derinliklerine ineceğiz.
Kaynak wikipedia