Açık Bilim.Türkiye

Many Labs 1

Yazar: Defne Alkan ve Hazal Arpacı

Tekrar çalışmaları, bilimin doğru şekilde ilerlemesi için büyük bir öneme sahiptir, fakat literatürde pek fazla yer almazlar. Yeni çalışmalar yapmak her zaman için ilgi çekici ve hatta gereklidir. Ancak, yapılmış çalışmaların tekrar edilebilirliğine gereken önemi vermek, literatürde yanlış çalışmaların uzun bir süre hayatta kalmasını ve üzerlerine yeni çalışmalar inşa edilmesini önlemede yardımcı olacaktır. Many Labs serisinin amacı da bilinen çalışmalara geniş örneklemlerle, farklı ülkelerde ve farklı laboratuvarlarda tekrar çalışmaları yaparak bu çalışmaların tekrarlanabilirliğini test etmektir. Biz de şu an ilk yazısını okuduğunuz bu yazı serisinde sizlerle Many Labs deneylerinin bulgularını kısaca paylaşacağız. Bu yazı serisinde göreceğiniz tekrarlanabilmiş herhangi bir çalışma, bahsedilen etkinin “kanıtlandığını” bize hiçbir zaman gösteremez. Sadece farklı laboratuvarlarda, farklı araştırmacıların, geniş bir örneklemle bu sonuçları tekrarlayabildiğini ve öne sürülen hipotezin biraz daha güçlendiğini gösterir.

Many Labs 1 çalışmasına birbirinden bağımsız 36 farklı örneklem ve toplamda 6344 katılımcı katılmıştır (Klein, ve. ark., 2014). Her katılımcı bu çalışma için seçilen ve aşağıda daha detaylı bilgi alabileceğiniz toplam 13 psikoloji deneyine katılmıştır. Bu deneylerden 10 tanesi tekrarlanabilmiş, 2 tanesi tekrarlanamamış ve 1 tanesi de orijinal çalışmada gözlemlenene kıyasla çok daha küçük bir etki büyüklüğüyle gözlemlenmiştir. Çalışmalar hakkında kısa bilgileri aşağıda bulabilirsiniz, keyifli okumalar dileriz.

1- Batık Maliyetler (Sunk Costs): Batık maliyet, yapılan yatırımın geri dönüşü olmadığında kullanılan bir terimdir. Bu tekrar çalışmasının esas aldığı çalışmada (Oppenheimer, Meyvis, & Davidenko, 2009), katılımcıların ellerinde sevdikleri bir futbol takımının maçına biletleri olduğu bir durumu düşünmeleri istenmiştir. Maçın olduğu gün, hava koşullarının oldukça zorlayıcı olması durumunda, katılımcıların maça katılıp katılmama ihtimalleri ölçülmüştür. Sonuçlar, katılımcıların biletlere para ödemiş olduğu durumda maça gitme olasılığının, biletlerin bedava olması durumuna göre daha yüksek olduğunu göstermiştir. Bu deney, Many Labs projesi kapsamında başarıyla tekrarlanmıştır. Orijinal çalışmada etki büyüklüğü 0.23 iken, tekrar çalışmalarında 0.32[^1] bulunmuştur.

2- Kayıp ve Kazanç Çerçevelenmesi (Gain versus Loss Framing): Yapılan esas çalışmada (Tversky & Kahneman, 1981), kişinin dikkatini kayıp yerine kazanca çekmenin risk alma olasılığını artırdığına dair bulgular vardır. Bu araştırmada katılımcılardan, yabancı bir ülkeden gelen bir hastalığa karşı hareket planları arasından seçim yapılması istenmiştir. İlk başta hastalığın 600 kişinin ölümüyle sonuçlanmasının beklendiği bildirilmiştir. Katılımcılara, 200 kişinin kesin kurtulduğu ama 400 kişinin kesinlikle kaybedildiği A planı ve 3’te 1 ihtimalle herkesin kurtarılacağı, fakat 3’te 2 ihtimalle kimsenin kurtarılamadığı B planı arasından bir seçim yapmaları istenmiştir. Sonuçlara bakıldığında, kazanca odaklanılması durumunda A planı daha çok seçilmişken, kayba odaklanıldığında B planı daha çok seçilmiştir. Bu deney de Many Labs Projesi kapsamında başarıyla tekrarlanmıştır. Orijinal çalışmada etki büyüklüğü 1.13 iken, tekrar çalışmalarında 0.62[^1] bulunmuştur.

3- Demir Atmak (Anchoring): Bu çalışmada, belli bir büyüklük ya da uzaklık değeri tahmin etmeleri öncesinde katılımcılara verilen sayı değerlerinin, katılımcıların sonrasında yaptıkları tahminleri üzerindeki etkisi araştırılmıştır (Jacowitz & Kahneman, 1995). Orijinal çalışmada, önce katılımcılara bariz bir şekilde çok büyük ya da çok küçük bir sayı verilmiş, daha sonra katılımcılar kendilerine verilen sayı ile ilgili her 15 farklı konu başlığı için üçer soru cevaplamışlardır. Soruları cevaplarken öncelikle kendilerine verilen sayının esas sayıya kıyasla daha büyük ya da küçük olduğunu, sonra da esas sayının ne olduğunu tahmin etmeye çalışmışlardır. Son olarak, kendi tahminlerinin doğruluğuna olan güvenlerini belirtmişlerdir. Verilen ilk değerin referans olarak alınması sonucu, tahmin edilen sayılar, ilk sayılara doğru meyil etmiştir. Kısaca ilk verilen sayı, sonra tahmin edilen sayıların ilk verilen sayıya daha yakın olmasına sebep olmuştur. Bu deney de Many Labs Projesi kapsamında başarıyla tekrarlanmıştır. Orijinal çalışmada etki büyüklüğü 0.93 iken, tekrar çalışmalarında 2.43[^1] ile 1.18[^1] arasında bulunmuştur.

4- Kumarbazın Geçmişe Yönelik Yanılgısı (Retrospective Gambler’s Fallacy): Bu çalışmada, şansa dair yapılan bir gözlemin, bağımsız dahi olsa kendisinden önceki olaylara dair düşünceleri etkilediği gösterilmiştir (Oppenheimer & Monin, 2009). Çalışmada katılımcılardan bir zarın atılmasıyla ilgili üç farklı durum düşünmeleri istenmiştir; üç zarın atılması ve hepsinin “6” gelmesi, üç zardan ikisinin “6”, diğerinin “3” gelmesi ve son olarak iki zar atılması ve ikisinin de “6” gelmesi. Bu durumların hayal edilmesinden sonra katılımcılardan, kendileri odaya girmeden önce, hayal ettikleri kişinin kaç kez zar atmış olabileceğini tahmin etmeleri istenmiştir. Üç zarın da “6”lı geldiğini düşünmeleri istenen katılımcılar, diğer durumlardaki katılımcılara göre daha büyük bir tahminde bulunmuştur. Yani zarı atan kişinin, kendileri odaya girmeden önce daha çok zar attığını tahmin etmişlerdir. Tekrarlama çalışmasında, sadece iki zarın atıldığı durum deneyden çıkarılarak geriye iki durum bırakılmıştır. Bu deney de Many Labs Projesi kapsamında başarıyla tekrarlanmıştır. Orijinal çalışmada etki büyüklüğü 0.69 iken, tekrar çalışmalarında 0.59[^1] bulunmuştur.

5- Düşük ve Yüksek Kategori Ölçekleri (Low-versus-High Category Scales): Bu çalışma, bir davranışın düşük ya da yüksek frekansları olan seçeneklerinden kişilerin çıkarım yaptığını ve bu seçeneklere göre kendi kendilerini de değerlendirdiklerini göstermiştir (Schwarz, et al., 1985). Esas çalışmada katılımcılar günde ortalama ne kadar televizyon izledikleri sorusunu cevaplamışlardır. Cevaplamaları için iki seçenek vardır; düşük (“yarım saat kadar” ile, “2.5 saatten fazla” arası), ya da yüksek (“2.5 saat kadar” ile, “4.5 saatten fazla” arası) frekanslı ölçek. Cevaplara bakıldığında, 2.5 saatten fazla televizyon izlediğini belirten katılımcı sayısı, yüksek frekanslı ölçekle soruyu cevaplayan katılımcılar arasında daha fazladır. Bu deney de Many Labs projesi kapsamında başarıyla tekrarlanmıştır. Orijinal çalışmada etki büyüklüğü 0.5 iken, tekrar çalışmalarında 0.51[^1] bulunmuştur.

6- Karşılıklılık İlkesi (Norm of Reciprocity): Bu çalışmada, kişinin içinde bulunduğu gruba ya da bir dış gruba karşı tutumunun karşılık verme ya da tutarlılık ilkelerine bağlı olabileceği gösterilmiştir (Hyman & Sheatsley, 1950). Orijinal çalışmada, Amerikalı katılımcılar iki soruya cevap vermiştir: “1.Komünist ülkeler, Amerikalı muhabirlerin gelmesine ve haberleri Amerikan gazetelerine bildirmesine izin vermeli mi? 2. Amerika, komünist muhabirlerin ülkeye girmesine ve kendi gazetelerine haberleri bildirmesine izin vermeli mi?”. Katılımcılar, Amerikalı muhabirlerin komünist ülkelere girmesine ilişkin sorudan sonra bu soru sorulduğunda, soru sorulmayan koşula kıyasla, komünist muhabirlerin Amerika’ya girmesine daha olumlu cevap vermişlerdir. Bu deney de Many Labs Projesi kapsamında başarıyla tekrarlanmıştır. Orijinal çalışmada etki büyüklüğü 0.16 iken, tekrar çalışmalarında 0.27[^1] bulunmuştur.

7- İzin verildi/Yasaklandı (Allowed/Forbidden): Orijinal çalışmada (Rugg, 1941) Amerikalı katılımcılara, “Amerika’da demokrasi karşıtı söylemler yasaklanmalı mı?” diye sorulduğunda katılımcıların %46’sı evet cevabını verirken, “Amerika’da demokrasi karşıtı söylemlere izin verilmeli mi?” diye sorulduğunda katılımcıların %62’si hayır cevabını vermiştir. Soruyu hangi kelimelerle sorduğumuzun aldığımız cevabı etkiliyor olabileceğini öne süren bu çalışma, Many Labs Projesi kapsamında başarıyla tekrarlanmıştır. Etki büyüklüğü orijinal çalışmada 0.65 iken tekrar çalışmalarında 1.87[^1] çıkmıştır.

8- Alıntıya Atıf (Quote Attribution): Okuduğumuz bir sözü nasıl algıladığımız ya da söylenen şeyi doğru veya yanlış bulmamız, o sözü kimin söylediği tarafından etkilenir mi? 1936 yılında yapılan çalışma aynı sözü, bir gruba toplum tarafından sevilen biri söylemiş gibi gösterirken diğer gruba toplum tarafından sevilmeyen biri söylemiş gibi göstermiştir (Lorge & Curtiss, 1936). İnsanlar, sözü toplum tarafından sevilen birinin (mesela Amerika için bu kişi Washington olabilir) söylediğini düşündüklerinde o söze daha çok katıldıklarını belirtmişler; öte yandan o sözün, toplum tarafından sevilmeyen birinin sözü olduğunu düşündükleri durumda (yine Amerika çalışmasından bir örnek olarak Osama Bin Laden verilebilir) bu söyleneni doğru bulmadıklarını söylemişlerdir. Many Labs Projesi bu çalışmayı da başarılı bir şekilde tekrarlayarak alıntının kimden yapıldığının algıyı değiştirdiği fikrini desteklemiştir. Orijinal çalışmada etki büyüklüğü verilmemiş, tekrar çalışmalarında ise 0.31[^1] olarak bulunmuştur.

9-Bayrak Hazırlaması (Flag Priming): Yine Amerika’da yapılan bir çalışmada, insanlara Amerikan bayrağı göstermenin onları daha tutucu yapacağı öne sürülmüştür (Carter, Ferguson, & Hassin, 2011). Katılımcılara çeşitli fotoğraflar gösterilmiş ve katılımcılardan bu fotoğrafların günün hangi saatinde çekildiğini tahmin etmeleri istenmiştir. Deney grubundaki katılımcılara bu fotoğrafların bazılarında Amerikan bayrağı gösterilirken kontrol grubundaki katılımcılara gösterilmemiştir. Fotoğrafların ardından, katılımcıların çeşitli sosyal konulardaki (kürtaj vs.) görüşlerini sorarak ne kadar tutucu olduklarını ölçen bir anket verilmiş ve deney grubunun daha tutucu olduğu sonucuna ulaşılmıştır. Many Labs Projesi, bu deneyi tekrarlayamamıştır. Orijinal çalışmada etki büyüklüğü 0.5 iken, tekrar çalışmalarında 0.01[^1] bulunmuştur.

10- Para Hazırlaması (Currency Priming): 2013 yılında yapılan çalışma, para görmenin, insanları içinde bulundukları sistemi daha çok desteklemeye iteceğini öne sürmüştür (Caruso, Vohs, Baxter, & Waytz, 2013). Bir grup katılımcıya, bazı sorular cevaplarken arkada para fotoğrafı gösterilmiş, bir grup katılımcıyaysa aynı fotoğrafın tanınması güç, bulanık bir hali gösterilmiştir. Bunun ardından iki gruba da “Sistemi meşrulaştırma ölçeği” verilmiş ve para fotoğraflarını net gören grubun içinde bulundukları sistemi daha çok meşrulaştırdığı görülmüştür. Many Labs Projesi, bu deneyi de tekrarlayamamıştır. Orijinal çalışmada etki büyüklüğü 0.8 iken, tekrar çalışmasında -0.01[^1] bulunmuştur.

11- Hayali İletişim (Imagined Contact): Bu çalışmada ise, farklı bir etnik gruptan insanlarla iletişim kurulduğunun hayal edilmesinin bile o insanlara karşı önyargıyı azaltacağı varsayımı desteklenmiştir. Çalışmada katılımcılar, farklı etnik gruptan bir insanla iletişim kurduğunu bir süre hayal etmiş, ardından o gruba karşı önyargılarını ölçecek bir ölçek doldurmuştur. Sonuçlara bakıldığında, hayal kuran katılımcıların o gruba karşı önyargılarının azaldığı gözlenmiştir (Husnu & Crisp, 2010). Etki büyüklüğü, orijinal çalışmada 0.86, tekrar çalışmasında 0.1[^1] bulunmuştur. Arada çok yüksek bir fark olduğu için etkinin orijinal çalışmada iddia edildiği kadar büyük bir etki olmadığı sonucuna varılmıştır.

12- Örtük Matematik Tutumlarında Cinsiyet Farklılıkları (Sex Differences in Implicit Math Attitudes): Yapılan çalışmaya göre, kadınlar erkeklerle kıyaslandığında matematik ve bilim konularına örtük olarak daha olumsuz bir bakışa sahip bulunmuştur (Nosek, Banaji, & Greenwald, 2002). Orijinal çalışmada etki büyüklüğü 1.01 iken, tekrar çalışmalarında 0.56[^1] bulunmuştur. Yine orijinal çalışmaya göre düşük bir etki büyüklüğü ile olsa da etki tekrar edilebilmiştir.

13- Öz Bildirim Tutumlarla Örtük Matematik Tutumlarının İlişkisi (Implicit Math Attitudes Relations with Self-Reported Attitudes): Bir önceki maddede anlatılan çalışmanın ikinci deneyi olan bu çalışma ise örtük matematik tutumlarının öz bildirim tutumlarıyla aynı olduğunu ortaya koymuştur. Deney başarıyla tekrar edilmiştir. Orijinal çalışmada etki büyüklüğü 0.93 iken, tekrar çalışmalarında 0.79[^1] bulunmuştur.

[^1] Verilen etki büyüklükleri, ağırlıklandırılmamış (unweighted) etki büyüklükleridir.

Kaynakça

Carter, T. J., Ferguson, M. J., & Hassin, R. R. (2011). A single exposure to the American flag shifts support toward Republicanism up to 8 months later. Psychological Science, 22, 1011–1018.

Caruso, E. M., Vohs, K. D., Baxter, B., & Waytz, A. (2013). Mere exposure to money increases endorsement of free-market systems and social inequality. Journal of Experimental Psychology: General, 142(2), 301.

Husnu, S., & Crisp, R. J. (2010). Elaboration enhances the imagined contact effect. Journal of Experimental Social Psychology, 46(6), 943-950.

Hyman, H. H., & Sheatsley, P. B. (1950). The current status of American public opinion. In J. C. Payne (Ed.), The teaching of contemporary affairs: 21st yearbook of the National Council of Social Studies (pp. 11–34). New York, NY: National Council of Social Studies.

Jacowitz, K. E., & Kahneman, D. (1995). Measures of anchoring in estimation tasks. Personality and Social Psychology Bulletin, 21, 1161–1166.

Klein Richard, A., Ratliff, K. A., Vianello, M., Adams Jr, R. B., Bahník, Š., Bernstein, M. J., ... & Cemalcilar, Z. (2014). Investigating Variation in Replicability: A ‘‘Many Labs’‘Replication Project. Social Psychology, 45(3), 142-152.Lorge, I., & Curtiss, C. C. (1936). Prestige, suggestion, and attitudes. The Journal of Social Psychology, 7(4), 386-402.

Nosek, B. A., Banaji, M. R., & Greenwald, A. G. (2002). Math= male, me= female, therefore math≠ me. Journal of personality and social psychology, 83(1), 44.

Oppenheimer, D. M., & Monin, B. (2009). The retrospective gambler’s fallacy: Unlikely events, constructing the past, and multiple universes. Judgment and Decision Making, 4, 326–334.

Oppenheimer, D. M., Meyvis, T., & Davidenko, N. (2009). Instructional manipulation checks: Detecting satisficing to increase statistical power. Journal of Experimental Social Psychology, 45, 867–872.

Rugg, D. (1941). Experiments in wording questions: II. Public opinion quarterly.

Schwarz, N., Hippler, H. J., Deutsch, B., & Strack, F. (1985). Response scales: Effects of category range on reported behavior and comparative judgments. Public Opinion Quarterly, 49, 388–395.

Tversky, A., & Kahneman, D. (1981). The framing of decisions and the psychology of choice. Science, 211, 453–458.