Açık Bilim.Türkiye

Bir Fikir Yazısı: Tekrarlama Krizi, Sakıncalı Pratikler ve Akademik Sahtekârlık: Sanık Koltuğunda Kimler Var

Yazar: Göksu Akşam

Birçok psikolojiye giriş kitabında modern psikolojinin 1879 yılında Alman bilim insanı Wilhelm Wundt’un bir psikoloji laboratuvarı kurmasıyla başladığı bilgisi bulunmaktadır. Bugün insan davranışlarını ve zihinsel süreçlerini anlama konusunda geldiğimiz nokta düşünüldüğünde, 142 yıl öncesine göre hem insana hem de diğer hayvanlara ilişkin pek çok şey keşfedilmiştir. Ancak son yıllarda ortaya çıkan tekrarlama krizi alanın kapalı kapılar arkasında kalan ve görmezden gelinen büyük sorunlarının olduğunu ve belki de bilimsel anlamda kaydettiğimizi düşündüğümüz ilerlemeyi sorgulamamız gerektiğini göstermiştir. Psikoloji bilimindeki yaygın araştırma “kültürü,” başarısızlıkla sonuçlanan geniş ölçekli tekrarlama çalışmaları sayesinde bugün sıklıkla “sakıncalı araştırma pratikleri (questionable research practices)” olarak nitelendirilse de hala “normal” olarak kabul edilebilen ve aslında “geleneksel anlamda bilim” yapmakla bağdaşmayan uygulamalar içermektedir. Daha da önemlisi, çeşitli diğer disiplinlerde (bkz. The Office of Research Integrity, t. y.-a; Retraction Watch, t.y.) olduğu gibi psikoloji literatüründe de bu araştırma yapma kültürünün en uç noktadaki sonuçlarından birisi olarak sahte/uydurulmuş verilerle yayımlanan çalışmalar tespit edilebilmektedir.

“Düzensiz ortamlar insanların ırkçı eğilimlerini artırıyor!” (Stapel ve Lindenberg, 2011). Tam da popüler internet sitelerinin başköşede paylaşacağı kadar parlak ve dikkat çekici bir başlık. Üstelik bunu söyleyen bir “sosyal psikolog”, namıdiğer Diederik Stapel. Kendisi aslında neden her araştırma sonucuna ve araştırmacıya gözü kapalı güvenmememiz gerektiğinin son yıllardaki (belki de) en büyük örneği. Stapel, 2011 yılına kadar birçok üst düzey akademik dergide göz alıcı araştırma sonuçları yayımlanmış olan ve aynı zamanda ülkesindeki medya tarafından oldukça sevilen eski bir profesör-dü (Mare, 2018). Kendisi bugün ise elliden fazla makalesinde veri uydurduğu (data fabrication) için akademiden uzaklaştırılan ve bu sebeple makaleleri literatürden kaldırılan, adını Amerikan Psikologlar Derneği’nin (American Psychological Association) sitesine “Diederik Stapel Vakası (The case of Diederik Stapel; American Psychological Association, 2011)” olarak yazdırmayı başarmış bir isim. Akademik sahtekârlığın (veya akademik suistimal [academic misconduct]) en olağan dışı örneklerinden olan “Stapel Vakası”nın çok daha sarsıcı olan yönü ise bu vakanın aslında psikoloji bilimindeki yaygın araştırma kültürü ve akademik sahtekârlık kavramının alanda nasıl ele alındığı veya alınamadığı ile ilgili çok fazla şey söylüyor olması. Diederik Stapel veya başka herhangi bir araştırmacı nasıl/neden sahtekârlık yapmış/yapıyor olabilir? Bunun sebebi, bu araştırmacının hayatı boyunca takdir edilmek ve başarılı olmak istemiş olması, dolayısıyla bilinçli bir şekilde akademik sahtekârlığı seçmiş olması olabilir mi? Ya da bir araştırmacı “farkında olmadan” sahtekârlık yapmış olabilir mi? Bu sorular akademik sahtekârlık örneklerine rastlanan ve hala son yıllarda içine girdiği tekrarlama krizinde (anlamı için bkz. Fidler ve Wilcox, 2018) savrulup duran psikoloji bilimi ve farklı pek çok alanın bu krizden çıkabilmesi için cevap vermesi gereken, bizleri aslında çok daha derinlere, bu disiplinlerin “_bilim yapma kültürünü”_ sorgulamaya iten sorular.

Kısaca açıklayacak olursak, akademideki “yayımla ya da yok ol (publish or perish)” olarak adlandırılan araştırma kültüründen (bkz. Rawat ve Meena, 2014) ciddi bir biçimde etkilenen psikoloji biliminde, bir araştırmacının akademik yeterliliği ve başarısı sıklıkla, örneğin, o araştırmacının çeşitli akademik dergilerde yayımlanmış araştırma sayısı ile ölçülüyor. Bu nedenle, araştırmacılar yayın şansı bulma yarışına dahil olmak veya örneğin, akademide kalma/yükselme isteği gibi kaygılarla araştırma sonuçlarının güvenirliğini zedeleyen çeşitli sakıncalı pratiklerde bulunmaya yönelebiliyor. Kısaca tanımlamak gerekirse, sakıncalı araştırma uygulamaları araştırma yapma sürecinde sonuçlara etki edecek, dolayısıyla verilerin ve araştırma sonuçlarının geçerliliğini bozacak uygulamalar olarak karşımıza çıkıyor. Psikoloji biliminde sıklıkla normal ve yaygın kabul edilen bu tür uygulamalar ile ilgili olarak, Princeton Üniversitesi’nden Chris Chambers 2017 yılında yayımlanan kitabında psikolojinin yedi ölümcül günahı (the seven deadly sins of psychology) metaforunu kullanarak çarpıcı bir biçimde alanın bilim yapma “kültürüne” dikkat çekiyor. Chambers’a göre alandaki en prestijli dergilerde yayın yapma yarışı/ baskısı ve dergilerin yeni, ilginç ve anlamlı sonuçları yayın yapma yanlılığı (publication bias) gibi sebeplerle zaman içinde araştırmacılar biri diğerini tetikleyen ve nihayetinde iç içe geçmiş birtakım “sakıncalı” araştırma yapma pratiklerini benimsiyor. Yayın yarışı, örneğin, istatistiksel olarak “yeterince yeni ve anlamlı” sonuçlar bulmak isteyen araştırmacıların, hipotezlerini desteklemek için veriler ile oynayıp istedikleri sonucu bulana dek farklı yöntemler denemelerine veya tıpkı Stapel gibi, veri dahi toplamadan birtakım sahte araştırma sonuçları ortaya atmalarına sebep olabiliyor. Dahası, bu yarış, üst düzey araştırma dergilerinin yayın yanlılığı ile birleştiğinde bilimin en temel özelliklerinden birisi olan araştırmaların tekrarlanabilirliği ilkesi göz ardı edilebiliyor: Tekrarlama çalışmaları “alana yeni herhangi bir şey katmaması” gibi düşüncelerle değersiz ve gereksiz görülebiliyor veya öyle görülmese dahi yayın şansı bulamayabiliyor. Bu nedenle de araştırmacılar tekrarlama çalışmaları yapmaktan uzaklaşabiliyor (Schmidt, 2009) ve herhangi bir çalışmanın sonucuna ilişkin muhtemel yanlışların düzeltilmesi mümkün olmayabiliyor. Tüm bunlar bir arada değerlendirildiğinde, yapılan çalışmaların sonuçları var olabilecek bir “gerçeği” göstermekten ziyade bazı araştırmacıların “hikayelerini” anlatır hale geliyor. Sonuçta araştırmacılar hem kendilerini hem de, örneğin, bünyesinde araştırma yaptıkları kurumları “bilimsel gerçeği arama ve bulma” kisvesi altında anlattıkları “hikayelerle” kandırabiliyor. Bu durum açıkça bilimsel araştırmalara duyulan güvenin ve araştırma sonuçlarının geçerliliğinin sağlanabilmesi ve sakıncalı pratiklerin önüne geçilebilmesi için psikolojideki araştırma kültüründe, çok daha genel anlamda, akademinin farklı alanlarına yayılmış olan “yayımla ya da yok ol” araştırma kültüründe değişimin gerektiği işaret ediyor.

Tüm bu bilgiler, tabii ki, psikoloji literatüründeki tüm araştırmaların geçersiz, hatalarla dolu veya sahte olduğu anlamına gelmiyor. Tam da bu nokta herhangi bir çalışmanın bilimsel ve akademik dürüstlük ilkelerine bağlı bir şekilde gerçekleştirilmesini sağlayan şeyin ne olabileceği sorusunu akıllara getiriyor. Örneğin, araştırma yapma sürecinde sakıncalı pratiklerin kontrol edilmesini ve engellenmesini sağlayan bir mekanizma mı bulunuyor? Ne yazık ki, araştırma sürecindeki denetleme işi ve geleneksel yöntemde bilimsel ve akademik dürüstlük ilkelerine bağlılık “araştırmacıların vicdanına” bırakılarak bireysel bir sorumluluk haline getiriliyor. Sonuçta bu durum, Diederik Stapel gibi vakalarla karşılaşmamızda ve psikoloji biliminin, nihayetinde derin bir tekrarlama krizinin içine sürüklenmesinde rol oynayan bir faktör olarak karşımıza çıkabiliyor. Peki ama tüm bu sürecin araştırmacıya gözü kapalı güvenmekten geçmesi, akademik sahtekârlığın çözümünün “yanlış yola sapan bireyleri bulup eleyerek” elde edilebileceği anlamına mı geliyor? Bu soruya cevap vermeye çalışmadan önce akademik sahtekârlığın “ne olduğunu veya olmadığını anlamak/netleştirmek” gerekiyor. Fakat tam da bu noktada kavramsal düzeyde yapılan tanımlar ve bunların pratik anlamda neye karşılık geldiği konusundaki belirsizlikler devreye giriyor. Örneğin, bugün sakıncalı araştırma uygulamalarının “tam olarak” neleri içerdiği ve bu uygulamaların akademik sahtekârlık olarak kabul edilip edilemeyeceği hakkında psikoloji alanında bir görüş birliği bulunmuyor. Bu nedenle, psikoloji araştırma sonuçlarına duyulan güvenin tekrardan kazanılması için bugün üzerinde daha fazla durması gereken büyük sorulardan birisinin de “araştırmaların yürütülmesi sırasında sergilenen hangi davranışların akademik sahtekârlık olarak değerlendirilebileceği” olduğu görülüyor.

Alandaki sınırları netleştirilememiş olan araştırma yapma pratikleri düşünüldüğünde, daha önce örnekleri verilen yaygın sakıncalı araştırma uygulamalarının da akademik sahtekârlığın arasına dahil edilip edilemeyeceği sorusunun net bir cevabı bulunmuyor. Örneğin, bir kaynakta akademik sahtekârlığın tanımına araştırma sürecinde ve sonuçların raporlanması sırasında yapılan veri uydurma, çarpıtma (data falsification) ve intihal (plagiarism) durumları dahil edilirken, buradaki kriterin davranışın kasıtlı olarak yapılması ve “ilgili araştırma topluluğunun kabul edilmiş uygulamalarından” önemli derecede sapması olduğu belirtiliyor (The Office of Research Integrity, t. y.-b). Bu noktada “alanda kabul edilmiş uygulamaların” psikoloji bağlamında nasıl değerlendirilebileceği ve sakıncalı araştırma uygulamalarının bu kapsama dahil edilip edilmeyeceği gibi sorulara ise net cevaplar verilemiyor. Bir önceki tanımla paralel bir biçimde, bazı farklı kaynaklarda da akademik sahtekârlık sadece verilerin uydurulması, çarpıtılması ve intihali içeren bir durum olarak tanımlanırken (bkz. American Psychological Association, 2008; Gross, 2016), Resnik ve arkadaşlarının yaptıkları bir çalışmada (2015) “farklı kurumların” veriler üzerinde manipülasyon uygulanması veya araştırmalara sağlanan fonların kötüye kullanılması gibi durumları da akademik sahtekârlık kapsamında değerlendirebildiği görülüyor. Bu sonuç, aslında alandaki sakıncalı araştırma uygulamalarının da akademik sahtekârlık olarak değerlendirilebileceğini ve bu uygulamaların ortaya çıkmasındaki sorumluluğun “sadece” bireylerde olmadığını destekliyor. Öyle ki, bu sonuç, araştırma fonlarının sağlanması konusunda rekabet ortamına sebep olan ve sadece yeni fikirlerle anlamlı sonuçları destekleyen kurumsal süreçlerin de bu durumun ortaya çıkmasında sorumluluğu olduğu görüşünü destekliyor.

Bir başka çalışmada Leslie John ve arkadaşları (2012), akademik sahtekârlık ve sakıncalı araştırma uygulamaları arasında bir ayrım yapıyor ve konuyu farklı bir açıdan ele alıyor. John ve arkadaşları (2012), akademik sahtekârlığın medya tarafından daha fazla ilgi çektiğini fakat sakıncalı araştırma uygulamalarının çok daha yaygın olduğunu ve alan üzerindeki etkisinin çok daha zararlı olabileceğini öne sürüyor. Bu nokta, sakıncalı araştırma uygulamaları akademik sahtekârlık olarak kabul edilmediğinde, akademik sahtekârlık olarak değerlendirilen durumların kendi başına daha mı az olduğu yoksa daha başarılı bir şekilde mi “örtbas” edildiği sorusunu akıllara getiriyor. Öte yandan, tüm sakıncalı araştırma uygulamaları akademik sahtekârlığın kapsamına dahil edildiğinde ise bu, bize suçu herhangi bir araştırmacının kimliğine yıkmak yerine, o araştırmacıyı bu tarz eylemlerde bulunmaya yönlendiren “sistemi” değerlendirmenin ve bu sistemde değişiklikler yapmanın da gerekliliğini hatırlatıyor. Örneğin, Chambers (2017), sakıncalı pratiklerinin akademik sahtekârlığın daha “hafif” versiyonları olarak değerlendirilmesi durumunu tartışarak, veri uydurma veya çarpıtma gibi durumların çözümünün çok daha zor olabileceğini söylüyor. Chambers bunun nedeni olarak, veri uydurma durumunda sadece bazı pratikleri grup olarak “olağan” kabul eden araştırmacıların ve onların çalıştığı kurumların değil, daha üst düzeydeki kurumların ve kanun yapıcı birimlerin de sürece dahlinin gerekliliğini öne sürüyor. Chambers’ın bu görüşü, alanda bu denli yaygın olan uygulamaları akademik sahtekârlık olarak değerlendirmeme eğiliminin, belki de, akademik sahtekârlığın ceza almayı da beraberinde getirebilmesi düşüncesinden kaynaklanabileceği fikrini de akıllara getiriyor.

Tüm bu araştırma sonuçlarının pratik anlamdaki karşılığını değerlendirecek olursak; akademik sahtekârlığın bu tür eylemlerde bulunan kişilerin kariyerlerinin yanı sıra, üyesi oldukları bilimsel alanın, bu alana mensup araştırmacıların ve araştırma sonuçlarına güvenilerek oluşturulan politikalardan etkilenen toplumun öteki bileşenlerinin üzerinde de ciddi etkilerinin olduğunu kabul etmemiz gerekiyor. O halde, bu problemi çözmek için sorumluluk kimlerin üzerine düşüyor? Diğer bir ifadeyle, sanık koltuğuna “sadece” yeterince dürüst ve ahlâklı olmamakla suçlayacağımız araştırmacıları mı yoksa “bununla birlikte” bir sistemi oturtmak ve çözüm yollarını kolektif bir çabayla aramak mı gerekiyor? Bu sorulara verilecek cevaplar ve ortaya konulacak çözümler diğer pek çok alan gibi psikoloji bilimine duyulan güvenin de tekrar kazanılmasında önemli bir yere sahip olacak gibi görünüyor. Son yıllarda gittikçe yaygınlaşan Açık Bilim (Open Science) Hareketi aslında tüm bu problemlerin, özellikle sakıncalı araştırma uygulamalarının, nasıl engellenebileceği konusunda çözümün açıklık ve şeffaflık ile yürütülecek bilimsel pratiklerden geçtiği, dolayısıyla bu konudaki ilerlemenin “bilim yapma kültürü/pratiklerindeki kolektif ve kademeli değişimlerle” birlikte sağlanabileceği fikrini bizlere sunuyor. Örneğin, alanda akademik sahtekârlığın nasıl tespit edilebileceğine özel farklı çözüm yolları önerilse de (örneğin, “sahtekârlık yapanları” ifşa eden kişilerin haklarının güvence altına alınması ve böylece bu tarz durumların raporlanmasının teşvik edilmesi gibi) bunların arasından da en çok “tekrarlama çalışmalarının gerekliliği” öne çıkıyor gibi görünüyor. Buna göre, “daha ciddi seviyedeki” akademik sahtekârlıkların tespit edilmesinin yanı sıra, araştırmacıların raporladıkları “herhangi” bir detayın ne kadar doğru veya tam olduğunu (araştırmanın geçerliliğini) anlamanın da en etkili yollarından birisinin, farklı araştırma gruplarının orijinal çalışmaları tekrarlamaları olabileceği tartışılıyor (Chambers, 2017).

Özetle, psikoloji araştırmaları kültüründe gerekli değişimlerin/dönüşümlerin gerçekleşmesi ve tekrarlama çalışmalarının zamanla “daha yaygın ve desteklenen” bir uygulama haline gelmesiyle, uzun vadede hem “daha hafif” sahtekârlıklar olarak değerlendirilebilecek sakıncalı araştırma uygulamalarının hem de “çok daha ciddi” akademik sahtekârlıkların önüne geçilebilir. Sonuçta, içinde bulunduğu tekrarlama krizini gelişim ve iyi yönde değişim fırsatına çevirebilmek yeni tekrarlama krizlerinin önüne geçilmesini ve psikoloji bilimine duyulan güvenin tekrar kazanılmasını sağlayabilir. Böylece, hafif veya ciddi, az veya çok hatanın yapıldığı durumlarda sorumluları ararken kendilerini sanık koltuğunda bulan kişi, kurum ve bilimsel grupların sayısının azalması sağlanabilir.

Kaynakça

American Psychological Association. (2008). Research misconduct.

https://www.apa.org/research/responsible/misconduct/#:~:text=Research%20miscon%20uct%20occurs%20when%20a,ideas%20within%20a%20research%20report.&text=%20histleblowers%2C%20or%20those%20reporting%20the,%2C%20ostracism%2C%20%20awsuits%20or%20termination.

American Psychological Association. (2011, Aralık). The case of Diederik Stapel. https://www.apa.org/science/about/psa/2011/12/diederik-stapel

Chambers, C. (2017). The 7 deadly sins of psychology: A manifesto for reforming the culture of scientific practice. Princeton, NJ: Princeton University Press.

Fidler, F., & Wilcox J. (2018). Reproducibility of scientific results. In E. N. Zalta (Ed.), The Stanford encyclopedia of philosophy (Winter ed.).

https://plato.stanford.edu/entries/scientific-reproducibility/#ReplDistFeatScie

Gross, C. (2016). Scientific misconduct. Annual Review of Psychology, 63, 693–711. https://dx.doi.org/10.1146/annurev-psych-122414-033437
John, L. K., Loewenstein, G., & Prelec, D. (2012). Measuring the prevalence of Questionable Research Practices with incentives for truth telling. Psychological Science, 23(5), 524–532. https://doi.org/10.1177/0956797611430953

Mare. (2018, 26 Nisan). Everyone is scared of me.

http://archief.mareonline.nl/archive/2018/04/25/everyones-scared-of-me

Rawat, S., & Meena, S. (2014). Publish or perish: Where are we heading?. Journal of Research in Medical Sciences: The Official Journal of Isfahan University of Medical Sciences, 19(2), 87–89.

Resnik, D. B., Neal, T., Raymond, A., & Kissling, G. (2015). Research misconduct definitions adopted by U.S. research institutions. Accountability Research, 22(1), 14–21. https://doi.org/10.1080/08989621.2014.891943

Retraction Watch (t. y.) Top 10 most highly cited retracted papers. Retrieved https://retractionwatch.com/the-retraction-watch-leaderboard/top-10-most-highly -cited-retracted-papers/

Schmidt, S. (2009). Shall we really do it again? The powerful concept of replication is neglected in the social sciences. Review of General Psychology, 13(2): 90–100. doi:10.1037/a0015108

Stapel, D.A., & Lindenberg S. (2011). Coping with chaos: How disordered contexts promote stereotyping and discrimination. Science, 332(6026), 251–253. (Retraction published December 2011, Science, 334, p. 1202).

The Office of Research Integrity. (t. y.-a). Case summaries. Retrieved https://ori.hhs.gov/content/case_summary

The Office of Research Integrity. (t. y.-b). Federal policies: Research misconduct. Retrieved https://ori.hhs.gov/content/chapter-2-research-misconduct-federal-policies