25 Ocak 2019 Cuma

Ki kare testi nedir? SPSS ile Ki kare analizi nasıl yapılır?

Ki Kare testi nedir?

Ki kare testinin; ki kare bağımsızlık testi, ki kare homojenlik testi, ki kare uygunluk testi olmak üzere birçok uygulama alanı bulunmaktadır. Bu makalede iki kategorik değişken arasındaki ilişkiyi incelemek için kullanılan ki kare bağımsızlık testi hakkında ayrıntılı bilgi vereceğiz. Örneğin okunan gazete ile eğitim durumu arasında anlamlı bir ilişkinin bulunup bulunmadığını merak eden bir  araştırmacı, ki kare bağımsızlık testi kullanacaktır. Ki kare, X2 sembolü ile gösterilmektedir. Ki kare testinin SPSS de nasıl uygulandığını adım adım anlatmaya çalışacağım. SPSS programının deneme sürümünü  buradan  indirebilirsiniz.

Ki kare testi SPSS Uygulaması

Ki kare testi başka bir ifade ile ki kare analizi sosyal bilimlerde en çok kullanılan analizlerden biridir. Ki kare testinin spss ile uygulamasından önce, testin daha iyi anlaşılması için bir takım ön bilgilerin verilmesini faydalı buluyorum. Ki kare tablosunda oluşan her bir gözenek için beklenen ve gözlenen frekans değerleri hesaplanmaktadır. 

Ki kare tablosu


Beklenen frekans değerinin formülü aşağıda gösterilmiştir. Gözlenen frekans değeri ise elimizdeki verilere göre oluşan değerlerdir. Örneğin yukarıdaki tabloya göre araştırmaya 24 bayan katılmıştır. Bunların 19'u obez, 5'i ise obez değildir. 19 ve 5 gözlenen değerlerdir. Bunların hemen altında aşağıdaki formüle göre hesaplanan beklenen değerleri görebilirsiniz.


Beklenen frekans değeri oluşan her bir gözenek için tek tek hesaplanır. Ayrıca, her bir gözenek için ki kare değeri hesaplanır ve bu değerler toplanır. Elde edilen toplam ki kare değeri, serbestlik derecesi de dikkate alınarak, kritik ki kare değeri ile karşılaştırılır. Ki kare değerinin hesaplanması ile ilgili formül aşağıda gösterilmiştir.




Çok fazla kafanızı karıştırmadan ki kare analizinin spss uygulamasına geçmek istiyorum. Fakat buraya kadar anlattıklarımı özetleyecek olursak;

-ki kare bağımsızlık testinin iki tane kategorik değişken arasındaki ilişkiyi incelemek için kullanıldığını,

-ilişkinin anlamlılık düzeyini belirlemek için gözlenen ve beklenen frekans değerine göre oluşturulan ki kare toplam değerinin dikkate alındığını söyleyebiliriz. 



Örneğimizde iki tane kategorik değişken bulunmaktadır. Bunlar obezite ve cinsiyet değişkenleridir. Obezite ve cinsiyet iki kategoriden oluşmaktadır. Bu değişkenleri çaprazladığımızda, ki kare tablosunda 2x2= 4 adet gözenek oluşacaktır.




Ki kare analizi için Analyze menusünden Descriptive Statistics sekmesine oradan da Crosstab sekmesine tıklamanız gerekmektedir.



Karşımıza yukarıdaki pencere çıkacaktır. Bu pencerede ilgili değişkenleri row (satır) ve colum (sütun) pencelerine sürükleyip bırakıyoruz.




Daha sonra sırası ile önce Cells sekmesine tıklıyoruz. Buradan gözlenen ve beklenen değeri görebilmemiz için observed ve expected seçeneklerini işaretliyoruz. Ayrıca yorumlama kolaylığı sağlamak için percentages seçneğinin altındaki row alt seçeneğini işaretliyoruz. Daha sonra devam butonuna tıklıyoruz.



ki kare testinin seçilmesi

Bir sonraki adımda, ki kare testini yapabilmemiz için Statistics sekmesine tıklıyoruz. Açılan pencereden Chi-square sekmesini işaretliyoruz. Devam butonuna ve ardından OK butonuna basıyoruz.





Ve nihayet karşımıza ki kare analizi ile ilgili tablolar çıkıyor. Birinci tabloda gözeneklere ilişkin beklenen ve gözlenen değerler var. Ayrıca, cinsiyete dayalı olarak yüzde değerleri hesaplanmış. Bayanların %79,2'si obez iken, erkeklerin %29,2'si obez olarak gözüküyor. Tablo ayrıntılı incelendiğinde, kadınlarda obezite oranının daha yüksek olduğunu görüyoruz. Beklenen ve gözlenen değerler arasında da fark var. Örneğin erkeklerde obez olanların sayısı 13 beklenirken 7 çıkmış. Kadınlarda obez olanların sayısı 13 beklenirken 19 çıkmış. Sonuç olarak, erkeklerde beklenen değerin altında, kadınlarda ise beklenen değerin üzerinde gözlemlerin oluştuğunu görmekteyiz.

Bir sonraki tabloda cinsiyet ile obez olma durumu arasındaki ilişkinin anlamlı olup olmadığını görüyoruz. Ki kare değeri 12,084 olarak  ve anlamlılık değeri ise 0,001 olarak hesaplanmış. Anlamlılık değeri 0,05'den küçük olduğu için cinsiyet ile obez olma durumu arasında anlamlı bir ilişkinin olduğunu söyleyebiliriz. Sonuç olarak, ki kare testi sonucunda; cinsiyet ile obez olma durumu arasında anlamlı bir ilişki tespit ettik. Kadınlarda erkeklere göre obezitenin daha yüksek olduğunu gözlemledik.



Korelasyon Nedir? Korelasyon Analizi

Korelasyon nedir?

Korelasyon iki değişken arasındaki doğrusal ilişkinin derecesini ve yönünü açıklayan bir kavramdır. İlişki hesaplamalarında veya ilişki analizlerinde bu kavram sıklıkla kullanılmaktadır. Yapılan analiz ve hesaplamaların nihai amacı ele alınan değişkenler arasındaki ilişkinin gücünü ve yönünü ortaya koymak için standart bir değer elde etmektedir. Bu standart değer korelasyon katsayısı olarak adlandırılmakladır. Korelasyon katsayısı R ile gösterilmektedir.

İlişkinin gücü ve yönü ile ilgili daha fazla bilgi vermekte fayda görüyorum. Korelasyon katsayısı +1 ile -1 arasında değerler alır. ±1 değerine yakın katsayılar güçlü ilişkileri ifade etmektedir. 0 ile ±0,29 arasındaki katsayılar düşük düzey, ±0,30 ile ±0,69 arasındaki katsayılar orta düzey ve ±0,70 ve üzerindeki katsayılar ise yüksek düzey ilişkileri göstermektedir.

Pozitif katsayılar, ele alınan değişkenlerden biri arttıkça diğerinin de arttığını göstermektedir. Negatif katsayılar ise ele alınan değişkenlerden biri arttıkça diğerinin azaldığını göstermektedir. Bir örnek üzerinde bu durumu açıklayalım.



Yukarıdaki grafikte tutum ve başarı puanları arasındaki ilişkiyi görmekteyiz. Kırmızı çizgi doğrusal ilişkinin yönünü ve gücü göstermektedir. İlişkinin gücü arttıkça kırmızı çizginin siyah çizgiye yaklaşması beklenmektedir. Bu iki değişken arasındaki korelasyon katsayısı R=0,44 olarak hesaplanmıştır. Yani tutum ile başarı puanları arasında orta düzeyde pozitif yönlü bir ilişki söz konusudur. Tutum puanları arttıkça başarı puanları da artmaktadır.

Korelasyon Hesaplama, İlişki Hesaplama


Elimizdeki verilerin özelliklerine göre farklı teknikler kullanarak korelasyon diğer adı ile ilişki hesaplayabiliriz. Başlıca korelasyon hesaplama teknikleri şu şekilde sıralanabilir; Pearson korelasyon, Spearman korelasyon ve Kendall’s tau-b korelasyon tekniği. Verilerimiz ölçek tipinde, sürekli ve normal dağılıma sahip ise Spearman korelasyon analiz tekniğini kullanabiliriz. Verilerimiz kategorik ve sıralamalı ise Spearman korelasyon analiz tekniğini seçmeliyiz. Hangi ilişki analizini kullanırsak kullanalım her birinde korelasyon katsayısı elde ederiz ve bunu yorumlamaya çalışırız.  

SPSS ile Korelasyon analizi


Korelasyon analizi birçok program ile gerçekleştirilebilir. Örneğin excel üzerinden başka bir program kullanmadan iki veri seti arasındaki ilişkiyi gösteren bir katsayısı elde edilebiliriz. Bunun için =korelasyon (veri seti 1, veri seti 2) excel formülünü yazmamız yeterli olur. Fakat bu yöntemde sadece korelasyon katsayı hesaplarız. Korelasyon değerinin istatistiksel olarak anlamlı olup olmadığını ise göremeyiz.

SPSS sosyal bilimlerde en çok kullanılan programlardan biridir. Spss ile korelasyon hesaplamanın nasıl yapıldığını adım adım anlatmaya çalışacağım. SPSS programının deneme sürümünü buradan indirebilirsiniz.



Aralarındaki ilişkileri hesaplamak istediğimiz değişkenler tutum ve başarı olarak isimlendirilmiş ve spss programına aktarılmıştır. 



Korelasyon analizi için Analyze meüsünden Correlate sekmesine oradan da Bivariate sekmesine tıklıyoruz.

                                                                                                                                                                 



Bir sonraki adımda karşımıza yeni bir pencere açılıyor. Aralarında ilişki hesaplamak istediğimiz değişkenleri karşı tarafa sürüklüyoruz. Ayrıca, daha önce bahsettiğim gibi verilerimizin özelliklerini dikkate alarak korelasyon analiz tekniğimizi seçiyoruz. Pearson korelasyon analizi otomatik seçili olarak karşımıza çıkıyor. OK düğmesine tıklıyoruz.



Karşımıza korelasyon analizi sonuçlarına ilişkin bir tablo çıkıyor. Tabloda birçok değer var, bunlar kafanızı karıştırmasın. Tabloda başarı değişkeninin kendisi ile olan ilişkisi 1 olarak ifade edilmiştir. Başarının tutum ile olan ilişkisi ise 0,442 olarak ifade edilmiştir. Bu değer orta düzeyde pozitif yönlü bir ilişkinin var olduğunu ifade etmektedir. Bu katsayının yanındaki ** simgesi ise ilişkinin istatistiksel olarak anlamlı olup olmadığı hakkında bilgi vermektedir. Tablonun altındaki açıklamada da belirtildiği gibi hesaplanan korelasyonun 0,01 düzeyinde anlamlı olduğunu söyleyebiliriz. Sonuç olarak, tutum ve başarı arasında orta düzeyde pozitif yönlü ve istatistiksel olarak anlamlı bir ilişkinin bulunduğunu söyleyebiliriz (r=0,442; p<0,01).












24 Ocak 2019 Perşembe

SPSS ile regresyon analizi nasıl yapılır

Regresyon Analizi nedir?

Merhabalar, sosyal bilimler alanında en çok kullanılan çok değişkenli analizlerden biri doğrusal regresyon analizidir. SPSS ile regresyon analizinin nasıl yapıldığını bir örnek üzerinde adım adım anlatmaya çalışacağım. SPSS programınız yok ise buradan deneme sürümünü indirebilirsiniz.

Regresyon analizinde bağımlı (etkilenen, yordanan, sonuç değişkeni) ve bağımsız (etkileyen, yordayan, neden olan) değişkenler söz konusudur. Değişkenleri örnek üzerinde anlatarak konuyu biraz daha genişletelim. Bir araştırmacı öğrencilerin ders çalışma süresinin akademik başarıları üzerindeki etkisini araştırmak istesin. Bu araştırma konusunda bağımlı değişken akademik başarı, bağımsız değişken ise ders çalışma süresi olmaktadır. Bir örnek daha verelim. Sigara içme alışkanlığının kanser olma durumu üzerindeki etkisinin belirlenmesi, şeklinde bir araştırmada ise bağımlı değişken kanser olma durumu, bağımsız değişken ise sigara içme alışkanlığı olmaktadır. Regresyon aanalizi için, regresyon modeli oluştururken bağımlı değişkeni etkileyebilecek tüm değişkenlerin dikkate alınması gerekmektedir. Bu şekilde bağımlı değişkeni açıklayan güçlü bir regresyon modeli ortaya konabilir. İlk verdiğimiz örnek üzerinde konuyu biraz daha açıklayacak olursak, öğrencilerin akademik başarısı üzerinde etkili olabilecek birçok değişken bulunmaktadır. Yani ders çalışma süresi ile birlikte, motivasyon, kaygı, öz-yeterlik, okula karşı tutum, öğretmene karşı tutum gibi birçok değişken regresyon modeline dahil edilebilir. Tabi bu değişkenlerin neden seçildiğinin literatürdeki çalışmalar referans gösterilerek açıklanması faydalı olacaktır. 

Regresyon Analizi için Gerekli Varsayımların Kontrol Edilmesi


Bilindiği gibi çok değişkenli analizler bazı varsayımlara dayanmaktadır. Regresyon analizi yapılmadan önce bu varsayımların test edilmesi gerekmektedir. Makale çalışmalarında hakemler, tez çalışmalarında ise juri üyeleri yapılan analizlerin gerektirdiği varsayımların karşılanıp karşılanmadığını kontrol etmektedir. Bu bakımdan spss ile regresyon analizi gerçekleştirilmeden önce gerekli varsayımların kontrol edilmesini kesinlikle tavsiye ediyorum.

Çok değişkenli analizler için gerekli varsayımlar şu şekilde sıralanabilir;

  • Çok değişkenli normal dağılım
  • Çoklu bağlantı probleminin bulunmaması
  • Çok değişkenli normallik

Regresyon analizi SPSS de nasıl yapılır?


Bu varsayımları spss ile nasıl test edildiğini başka bir derste açıklamaya çalışacağım. Bu makaledeki örneğimizde gerekli varsayımların karşılandığı kabul edilerek regresyon analizi gerçekleştirilmiştir.


Araştırma sorumuz şu şekildedir; Öğrencilerin derse karşı tutumları ders başarılarını nasıl etkilemektedir? Örnekteki değişkenler incelendiğinde, tutumun bağımsız değişken, ders başarısının ise bağımlı değişken olduğu anlaşılmaktadır.


Spss veri dosyasında araştırma sorumuzda yer alan değişkenleri görüyoruz. Bunlar tutum ve başarı değişkenleridir. 



















Analize menüsünden, regressyon sekmesine oradan da linear sekmesine tıklıyoruz.





















Bir sonraki adımda karşımıza yeni bir pencere açılıyor. Bağımlı değişkenimiz olan başarı değişkenini dependent yazan bölüme, bağımsız değişkenimiz olan tutum değişkenini ise independent yazan bölüme sürükleyerek bırakıyoruz ve daha sonra OK düğmesine tıklıyoruz.













Ve karşımıza analiz sonuçları çıkıyor. Burada dört tablo görmektesiniz. Bunların her birini açıklamaya çalışacağım. Öncelikle ANOVA başlıklı tabloya odaklanıyoruz. Bu tablodaki F değerini ve anlamlılık (Sig.) değerini inceliyoruz. Anlamlılık değerimiz 0,05 den küçük ise kurmuş olduğumuz regresyon denkleminin istatistiksel olarak anlamlı olduğu yorumunu yapıyoruz. Yani tutumun başarı üzerindeki etkisini araştırmak için oluşturmuş olduğumuz regresyon denklemi istatistiksel olarak anlamlı bulunmuştur diyebiliriz. 


Coefficients tablosunda ise bağımsız değişkenimizin yani tutumun bağımlı değişken üzerinde anlamlı bir etkiye sahip olup olmadığını görebiliyoruz. Buradaki anlamlılık (Sig.) değerinin de 0,05 den küçük olduğunu görmekteyiz. Dolayısı ile tutumun başarı üzerinde anlamlı bir etkisi vardır diyebiliriz. Ayrıca, Standardized Coefficients Beta (standardize B katsayısı) katsayısına bakarak tutumun başarı üzerinde hangi yönde etkili olduğunu da söyleyebiliriz. Bu örnekte B değeri 0,442 olarak hesaplanmıştır. Bu değere bakarak tutumun başarı üzerinde pozitif yönlü bir etkiye sahip olduğunu söyleyebiliriz. Tutum puanları arttıkça ders başarısı da artış göstermektedir.


Model summary tablosunda R kare (R square) değerini görmekteyiz, bu değer korelasyon değerinin (R) karesidir. Bu değer bağımsız değişkenin bağımlı değişken üzerinde ne kadar etkili olduğu hakkında bilgi vermektedir. R kare değeri ne kadar büyük ise tutumun başarı üzerinde o kadar çok etkili olduğu yorumunu yapabiliriz.

Doğrusal regresyon analizinin spss ile gerçekleştirilme sürecini giriş düzeyinde ve basit bir örnek ile açıklamaya çalıştım. Umarım faydalı olmuştur. Soru ve önerilerinizi benimle paylaşabilirsiniz.