Sözdebilimin aksine psikoloji insanların iç dünyaları ve davranışlarına dair iddiaları bilimsel testlere tabi tutar. Astrolojiyi incelerken bu gibi testler sayesinde astrolojinin bilimsel bir değer taşıyıp taşımadığını gösterebileceğimizi gördük. Şimdi biraz daha ayrıntılı biçimde bilimsel testleri nasıl tasarlayabiliriz gözden geçireceğiz.
Gündelik deneyimlerimizin parçası olan pek çok olgu psikolojinin ilgi alanına girer. Hafıza, yaratıcılık, kişilik, önyargı, zekâ, liderlik, empati, maddiyat- çılık, mutluluk, kadercilik, nezaket, özgüven, dikkat, korku, ahlâk, ve sevgi psikolojinin incelediği kavramlardan yalnızca birkaçıdır. Dikkat ederseniz bu kavramların ortak özelliği mutlak bir fiziksel tanımları olmayan soyut kavramlar olmalarıdır. Örneğin zekâyı cetvelle ölçemeyiz, mutluluğu terazide tartama- yız. Zekâ, mutluluk, nezaket karşımıza pek çok farklı surette çıkar, tek bir mutlak tanımları yoktur. Peki o zaman nasıl ölçeceğiz bu soyut kavramları? Bu soyut kavramları ölçmek istiyorsak yaratıcı yöntemler geliştirmemiz gerekir. İşte bu bir psikoloji araştırmasında aşılması gereken ilk engeldir. Ama soyut kavramları nasıl ölçeriz sorusunu cevaplamadan durup şöyle bir soru sorabiliriz. Madem bu kavramları hacim ölçer gibi rahatlıkla ölçemiyoruz, ölçmesek olmaz mı? Soyut kavramları ölçmek için çabalamamıza gerek var mı?
Kavramları Ölçmenin Faydası Nedir?
Eğer kavramları sayılara dönüştürebilirsek onları daha yüksek bir hassasiyetle tasvir edebiliriz. Şöyle bir örnek düşünelim: Bir insanı genç, orta yaşlı, yaşlı gibi sıfatlarla tanımlayabiliriz. Bu sıfatlar bize bahsedilen insan hakkında genel bir fikir verir. Ama o insanın yaşını sayısal olarak bilirsek elimizdeki bilgi çok daha netleşir. Üstelik bu sayıyı başka bilgilerle ilişkilendirerek yeni bilgilere varma imkânımız olur. Örneğin bir çocuğun yaşını biliyorsak okulda kaçıncı sınıfa gittiğini, bir büyüğümüzün yaşını biliyorsak 2. Dünya Savaşı sırasında hayatta olup olmadığını kestirebiliriz. Sayılar hem bize daha kesin bilgiler verir hem de başka kavramlarla ilişki kurmamızı kolaylaştırır.
Sayısallaştırma aynı zamanda bize elimizdeki bilgileri kıyaslama imkânı verir. Yukarıdaki örnekten devam edersek “orta yaşlı” olarak tanımladığımız iki farklı kişiden hangisinin daha genç olduğunu bilemeyiz ama eğer yaşlarını öğrenirsek bu karşılaştırmayı yapabiliriz. Bu sayede sadece tek tek bireyleri değil grupları da kıyaslayabiliriz. Çünkü sayısallaştırma bireyler hakkındaki bilgileri birleştirip daha genel bilgilere varmamıza imkan tanır. Örneğin bir tiyatro oyununa gittiğimizi varsayalım. Etrafımıza bakındığımızda seyircilerin çoğunlukla gençlerden oluştuğunu gözlemleyebiliriz. Ama eğer bütün seyircilerin yaşlarını bilseydik seyircilerin ortalama yaşının 25.4 olduğunu bulabilirdik. Bu da bize tiyatro oyununun o seanstaki izleyici kitlesini bir başka seanstaki izleyici kitlesiyle ya da bir başka oyunun izleyicileriyle karşılaştırma imkânı sağlar. Demek ki ilgilendiğimiz kavramları sayılara dökmek bize pek çok yeni bilgiye ulaşma şansı tanıyacaktır.
İşlemsel Tanım
İlgilendiğimiz kavramları sayılara dönüştürmek neden araştırmanın ilk ve hayati bir aşamasıdır gördük. Kavramları sayılara dökerek hem daha net bir bilgiye sahip erişiriz hem de bu bilgiyi başka bilgilerle ilişkilendirme gücü kazanırız. Ölçümlediği- miz değerler üzerinden ortalama almak gibi işlemler yaparak grupları kıyaslayabiliriz. Bu psikoloji bilimi açısından çok önemlidir çünkü bu işlemler olmadan merak ettiğimiz pek çok soruyu cevaplayamazdık. Diyelim ki kadınlarla erkekler arasında yaratıcılık yönünden bir fark var mı bilmek istiyoruz. O zaman kadınların ve erkeklerin yaratıcılıklarını sayılara dönüştürür, iki grubun da ortalamasını alır ve istatistiksel yöntemlerin yardımıyla bu ortalamaları kıyaslayarak bir sonuca ulaşabiliriz,
Bir kavramın alabileceği değerleri sayılara dönüştürmeye yarayan tanıma işlemsel tanım denir. İşlemsel tanım sayesinde bir kavramı bir rakama çevirebiliriz. Tablo 1’de psikolojinin ilgilendiği bazı kavramlar için örnek işlemsel tanımlar sıralanmıştır.
Diyelim ki bir araştırmacı uykusuzlukla hafıza performansı arasındaki ilişkiyi inceliyor. Bu araştırmacı her şeyden önce uykusuzluğu ve hafıza performansını işlemsel olarak tanımlamak zorundadır. Bir başka deyişle araştırmacı bu kavramları ne şekilde ölçeceğine karar vermelidir. Bir kavram pek çok farklı şekilde ölçülebilir. Örneğin uykusuzluğu ölçmek için kişilere 1’den 9’a uzanan bir skalada kendilerini ne kadar uykulu hissettikleri sorulabilir. Bir diğer yöntem kişilere son 48 saat içinde toplam kaç saat uyumuş oldukları sormaktır. En son uykudan uyanıldı- ğından beri geçen süre de bir başka işlemsel tanım seçeneğidir. Demek ki bir kavram bir değil birden fazla şekillerde işlemsel tanıma dönüştürülebilir. Eğer bir kavram birden çok şekilde ölçülebiliyorsa hangi ölçümü seçmek daha doğrudur? Hangi işlemsel tanımı kullanacağımıza nasıl karar veririz?
KAVRAM
|
İŞLEMSEL TANIM ÖRNEĞİ
|
Nezaket
|
Gün içinde “lütfen” ve “teşekkür ederim” deme sayısı
|
Hafıza
|
Kelimelerden oluşan okunduğunda akılda kalan kelime sayısı
|
Mutluluk
|
“Hayatımdan memnunum”, “Hayatımda değiştirmek istediğim bir şey yok” gibi sorulardan oluşan bir ölçekten alınan puan
|
Uykusuzluk
|
En son uykudan uyanıldığından beri geçen zaman
|
Yaratıcılık
|
“Bir tuğla hangi farklı amaçlar için kullanılabilir” sorusuna belli bir süre içinde verilen cevapların sayısı ve kalitesi
|
Maddiyatçılık
|
“Pahalı bir ev ve arabaya sahip olan insanlara imreniyorum” gibi sorulardan oluşan bir ölçekten alınan puan
|
Kavramsal Geçerlilik
Bir araştırmacı olarak hedefimiz elbette ölçmek istediğimiz kavramı yüksek bir hassasiyet ve doğrulukla ölçen bir işlemsel tanım seçmektir. İşlemsel tanımımızın ölçmek istediğimiz kavramı doğru ölçebilme
derecesine kavramsal geçerlilik (conceptual validity) denir. Yüksek kavramsal geçerliliği olan bir işlemsel tanım ilgilenilen kavramın farklı değerlerini hassasiyet ve kesinlikle ölçer.
Bir işlemsel tanımın yüksek kavramsal geçerlilik taşıması için ne gibi özelliklere sahip olması gerekir ve kavramsal geçerliliğe gölge düşüren problemler nelerdir şimdi görelim.
Ölçümsel Güvenilirlik
Bir ölçeğin yüksek kavramsal geçerlilik (reliability) taşıması için öncelikle güvenilir olması gerekir. Güvenilir bir ölçek aynı koşullar altındaki her ölçümde aynı sonucu verir. Bunun için ölçek rastlantıya bağlı ölçüm hatalarından arınmış olmalıdır. Örneğin bir tartı bir kütleyi her ölçtüğünde aynı sayısal değeri veriyorsa o tartıya güvenebiliriz. Ama her ölçümde farklı sonuç alıyorsak o tartıya güvenemeye- ceğimiz açıktır. Psikolojide de güvenilir bir ölçek benzer koşullarda benzer değerleri veren bir ölçektir. Şimdi ölçümsel güvenilirliğin farklı türlerini görelim:
- Test-yeniden test güvenilirliği. Bir testi belli aralıklarla bir kişiye yeniden
uyguladığımızda ne kadar benzer sonuçlar alıyorsak testin test-yeniden test güvenilirliği o kadar yüksektir. Mesela bir zekâ testi bir öğrenciye bir ay arayla iki kere uygulandığında alınan sonuçların birbirine çok yakın olması beklenir. İki farklı ölçümde bambaşka değerler alıyorsak sonuçların doğruluğuna güvenemeyiz. Tabii psikolojik kavramların değeri zaman içinde değişebilir. Örneğin tutum ya da bilgilerimiz hayatımız boyunca aynı kalmaz. Hatta zekâ gibi daha sabit olduğu varsayılan bir özelliğin bile zaman içinde değişebileceği gösterilmiştir. O zaman test-yeniden test güvenilirliği ölçülen kavramın sabit kaldığını varsaydığımız süreler içinde yakın ölçümler alınmasını öngörür.
- Gözlemciler arası güvenilirlik.Uzunluk ölçmek için cetvel son derece güvenilir bir ölçektir çünkü ölçümler kişiden kişiye değişmez. Buna karşılık karış iyi bir ölçek değildir çünkü karış uzunluğu kişiden kişiye değişir. Eğer ölçümler kişiden kişiye farklılık göstermiyorsa ölçeğin yüksek bir gözlemciler arası güvenilirliğe sahip olduğunu söyleyebiliriz. Kişilerin tanımadıkları biriyle konuşurken ne kadar heyecanlı olduğunu ölçmek istiyor olalım. Bunun için deneklerimizden tanımadıkları biriyle on dakika sohbet etmelerini isteyip bu sohbeti videoya kaydedelim. İki gözlemciden bu videoları izleyip kişilerin ne kadar heyecanlı olduğunu puanlamalarını isteyebiliriz. Eğer bu iki gözlemcinin puanları birbirine yakınsa ölçümler yüksek bir gözlemciler arası güvenilirliğe sahiptir. Gözlemcilerin puanlamaları arasında bir paralellik yoksa gözlemciler arası güvenilirlik düşüktür ve bu ölçümlere güvenemeyiz.
- İçsel güvenilirlik.Psikologlar ilgilendikleri kimi kavramları ölçmek için ölçekler hazırlarlar. Bu ölçeklerin güvenilir ölçümler vermesi için ölçeği oluşturan farklı sorular arasında paralellik olması gerekir. Öbür türlü her bir soru farklı bir telden çalacağı için ölçeğin bütünü belli bir kavramı tutarlı olarak ölçemez. Örneğin “yemek yemeyi ne kadar seviyorsunuz”, “turuncu rengini ne kadar seviyorsunuz”, ve “kelebekleri ne kadar seviyorsunuz” sorularından oluşan uydurma bir ölçek düşünelim. Bu sorular arasında bir tutarlılık olmadığı için kişilerin bu sorulara verdikleri cevaplar da birbirinden bağımsız olacaktır. Dolayısıyla böyle bir ölçeğin hangi kavramı ölçtüğü belirsizdir. Bir kavramı sayısallaştırmak istiyorsak ölçeğimizdeki sorunların her biri bu kavramı ölçmelidir, o zaman sorulara verilen cevaplar arasında tutarlılık olur. Eğer bir ölçeğin farklı sorularına verilen cevaplar birbirine paralelse o ölçeğin yüksek içsel güvenilirliğe sahip olduğu söylenir.
Şimdi ölçümsel güvenilirlik ile kavramsal geçerlilik arasındaki ilişkiyi düşünelim. Kavramsal geçerlilik ölçmek istediğimiz kavramı ne doğrulukla ölçebildiğimiz- le ilgilidir. Güvenilir olmayan bir ölçeğin kavramsal bir geçerliliği olabilir mi? Eğer ölçümümüz güvenilir değilse neyi ölçtüğümüz tam olarak belli değildir. Mesela bir termometre bozulduysa ve rastgele ölçümler veriyorsa bu ölçümlerin karşılık düştüğü bir kavram yoktur. Aynı şekilde yukarda örneğini verdiğimiz içsel güvenilirliği olmayan üç sorulu ölçek de belirli bir kavramı ölçmez. Eğer ortada net olarak ölçülmüş bir kavram yoksa bu kavramın doğru ölçülüp ölçülmediğinden söz etmenin anlamı olmaz. Demek ki kavramsal geçerliliğe ulaşmamız için öncelikle güvenilir bir ölçeğimiz olması gereklidir,
Peki elimizde güvenilir bir ölçek olduğunu varsayalım. Örneğin saati on dakika ileri gösteren bir duvar saatimiz olsun. Bu güvenilir bir ölçüm aletidir, hatalı bile olsa günün aynı saatinde aynı ölçümü verecektir. Aynı şekilde iki kilo düşük gösteren bir tartı da güvenilir bir ölçektir çünkü aynı kütlede bir cismi her zaman aynı kiloda gösterecektir. Peki bu bozuk saat ve bozuk tartının bize verdiği ölçümlerin kavramsal geçerliliği var mıdır? Cevap hayırdır çünkü bu saat ve tartı ölçmek istenen kavramları doğru olarak ölçmez, yani ölçümleri güvenilir olsa bile geçerli değildir. Demek ki bir ölçeğin güvenilir olması ölçülmesi istenen kavramı geçerli biçimde ölçtüğü anlamına gelmez. Güvenilir ölçümler kavramsal geçerliliğe ulaşmamız için gereklidir ama yeterli değildir.
Duyarsız işlemsel Tanımlar
Yüksek kavramsal geçerliliğe ulaşmamız için elimizdeki işlemsel tanımın güvenilir olmasının yanı sıra bize hassas ölçümler vermesi gerekir. Duyarsız bir ölçek ölçülen kavramın farklı düzeylerini birbirinden ayıramayan bir ölçektir, örneğin bir araştırmacı kişilerin kendilerini ne kadar yalnız hissettiklerini ölçmek istesin. Araştırmacı bu kavramı “hayatta sizden daha yalnız hiç kimse olmadığını düşünüyor musunuz?” sorusuyla ölçmeye çalışırsa alacağı yanıtlar fazla bilgilendirici olmaya- çaktır. Çünkü herkes kendini zaman zaman yalnız hissedebilse de pek az kişi dünyada kendisinden yalnız hiç kimse olmadığını düşünür. Dolayısıyla bu soruya hemen hemen herkes “hayır” yanıtını verecek ve araştırmacı yalnızlık hissinin farklı düzeylerini birbirinden yarayacaktır. Araştırmacı duyarsız bir ölçek kullanmıştır. Ölçeklerde duyarlılık meselesini eğitim kurumlarında verilen sınavlar örneğinde de düşünebiliriz. Bir sınav farklı düzeyde bilgiye sahip öğrencileri birbirinden ayırabilmek için yüksek duyarlılıkta olmalıdır. Bir matematik testi çok basit olursa bütün öğrenciler ^ksek notlar alır, konuya iyi bilen ile kötü bilen öğrenciler birbirinden ayırt edilemez. Aynı şekilde test çok zor olursa hiçbir öğrenci iyi not alamaz ve yine konuya kimin öğrenip kimin öğrenmediği tam anlaşılmaz. O zaman ideal bir ölçek ölçtüğümüz kavramın farklı düzeyleri arasındaki farklılıkları ayrım- layabilen bir ölçektir. Duyarlı bir testte öğrencilerin notları geniş bir dağılım gösterir. Duyarsız bir testte ise skorlar dar bir alana kümelenmiş olur ve ölçülen kavra- ,mın farklı değerleri birbirine çok yakın sayısal değerlere dönüştürülür
Kirlenmiş işlemsel Tanımlar
Bir işlemsel tanımın geçerliliğine gölge düşürecek bir başka unsur da ölçülen dışında başka kavramları ölçmesidir. Aynı anda ilgilenilen kavramın dışında kavramları da ölçen bir işlemsel tanıma kirlenmiş işlemsel tanım denir. Böyle bir tanım kullanıyorsak bir kavramı ölçtüğümüzü sanırken başka bir kavramı ölçüyor olabiliriz.
Diyelim ki ilgilendiğimiz kavram arkadaş sayısı olsun ve bu kavramı kişilerin Facebook’taki arkadaş sayılarına bakarak ölçmeye karar verelim. Bu işlemsel tanım kişilerin arkadaş sayısı hakkında bize bir fikir verse bile aynı zamanda ilgilenmediğimiz başka kavramları da ölçtüğü açıktır. Facebook’taki arkadaş sayısı bir insanın hayatta sahip olduğu arkadaş sayısının yanı sıra o kimsenin yaşı, bilgisayar kullanma yetisi, sosyal medyadaki etkinliği, ve arkadaşlarının Facebook’ta bulunma ihtimali gibi pek çok başka değişkene de bağlıdır. Demek ki Facebook’taki arkadaş sayısı bir insanın hayatındaki arkadaşlarını tespit etmek için ideal bir işlemsel tanım değildir. Alternatif bir işlemsel tanım kişilerin son bir ay içinde sosyal amaçta yüz yüze görüşmüş olduğu insanların sayısıdır. Ama bu tanım da arkadaş sayısı dışında pek çok etkene bağlıdır. Örneğin kişinin bulunduğu yerde ne zamandan beri ikâmet ettiği, arkadaşlarının coğrafi dağılımı ve çalışma tempoları gibi etkenler kişinin son bir ayda görüştüğü arkadaş sayısını etkiler. Dolayısıyla arkadaş sayısını ölçmek isterken saydığımız bu gibi diğer değişkenleri de ölçeriz. Öl-
çümümüz başka değişkenlerle kirlenmiştir.
DİKKAT
Bir kavram pek çok farklı şekillerde işlemsel tanıma dönüştürülebileceği gibi, bir işlemsel tanım birden fazla kavramı ölçebilir.
Psikolojinin ilgilendiği kavramlar karmaşık ve çok yönlü olduğundan işlemsel tanımlar az ya da çok başka kavramlarla kirlenmiştir. Biz ne kadar en az kirlenmiş bir işlemsel tanım seçmeye çalışsak da seçtiğimiz tanımın aynı anda başka kavramları da ölçmesi çok muhtemeldir. Peki o zaman yapmamız gereken nedir? Bir çözüm araştırmalarımızda aynı kavramın bir değil birkaç farklı işlemsel tanımını kullanmaktır. Örneğin arkadaş sayısını ölçmek için Facebook’taki arkadaş sayısı, telefonda kayıtlı insan sayısı, kişinin son bir ayda sosyal amaçla görüştüğü insan sayısı, kişinin doğum gününü kutlayan insan sayısı gibi pek çok farklı ölçümler alabiliriz. Eğer bu ölçümler birbirine paralel rakamlar veriyorsa ve başka değişkenlerle (örneğin yalnızlık hissi) benzer ilişkiler gösteriyorsa bulgularımıza güvenimiz artar. Bu sebepten dolayı psikoloji makalelerinde bir kavramın birden fazla işlemsel tanımla ölçülmesine dikkat edilir. Bu şekilde tek bir işlemsel tanımın içerdiği problemlerin sonuçlara gölge düşürmesi ihtimali azaltılır,