Kako čitati i kritički promišljati znanstvene radove u psihologiji?

STRUKTURA ZNANSTVENOG RADA

Kako čitati i kritički promišljati znanstvene radove u psihologiji?

za zpd pisali blaž rebernjak, nika sušac i andrea vranić

Sažetak

Sažetak sadrži kratki opis svih elemenata rada – od teorijskih okvira na kojima se istraživanje temelji, preko kratkog opisa metode do najvažnijih rezultata i povezivanja tih rezultata s ranijim istraživanjima ili teorijskim perspektivama. Kako je sažetak kratak, te kao takav pruža najsažetije informacije o nekom istraživanju, treba biti oprezan pri donošenju sudova o kvaliteti istraživanja samo na temelju sažetka. Baš zbog njegove forme, znanstvenici često u sažetku propuste napisati sve relevantne karakteristike provedenog istraživanja i neke od rezultata koji možda nisu u skladu s njihovim inicijalnim očekivanjima. Neka sažetak bude samo početna točka za uspostavljanje konteksta i donošenje odluke o tome hoćete li se čitati sam rad ili ne.

Uvod

Uvod predstavlja dio znanstvenog rada koji bi čitatelju trebao pružiti objašnjenje razloga zašto je to konkretno istraživanje provedeno, odnosno koja je njegova racionala. U uvodu bi trebali bili izloženi rezultati ranijih empirijskih istraživanja koja su se bavila proučavanjem istog fenomena, kao i ukratko opisane teorijske postavke ili konkretni modeli, koji služe kao okosnica ovog istraživanja. Ovaj dio teksta može biti zanimljiv za čitanje nekome tko je jako zaiteresiran za šire područje rada, ali ne nosi puno informacija u smislu vrednovanja samog istraživanja.

Metoda

Dobro napisano znanstveno istraživanje treba u opisu metode i rezultata istraživanja sadržavati sve informacije potrebne nezavisnim istraživačima da pokušaju ponoviti ili „replicirati“ to istraživanje. Nažalost, replikacije se vrlo rijetko provode, uglavnom zbog ekonomskih i političkih razloga. Primjerice, da biste zadržali posao kao znanstvenik pri nekoj istraživačkoj ustanovi od vas se traži da objavljujete nove i originalne rezultate, a ne da provjeravate radove drugih kolega po struci. Znanstvene karijere često ovise o rezultatima manjeg broja eksperimenata, a kako „prilika čini lopova“ – nedavno je psihologiju zadesio slučaj poznatog znanstvenika Diederika Stapela koji je, u pokušaju održavanja karijere, lažirao nizove rezultata svojih istraživanja.

Eksperimenti i korelacijska istraživanja

Psihologijska istraživanja mogu biti osmišljena na različite načine. U korelacijskim istraživanjima cilj je utvrditi povezanost između dvije varijable (npr. osobine) koje već postoje, dok u eksperimentu istraživač uvodi neku promjenu u situaciju i onda bilježi učinak te promjene. Izuzetno je važno dobro razlikovati ova istraživanja jer samo dobro provedeni i kontrolirani eksperimenti omogućuju utvrđivanje uzročno-posljedičnih veza, tj.  izvođenje zaključka da je neki fenomen izravna posljedica jasno određenog uzroka.

„Pušači manje zarađuju“ – što o korištenoj metodi ovog istraživanja možemo zaključiti iz naslova?

Vjerojatno korelacijsko istraživanje (eksperiment bi neetično zahtijevao da se pušenje kontrolira te tražio da sudionici puše određene količine cigareta da bi se kasnije promatrali učinci pušenja na plaće). Ovdje samo možemo zaključiti da su pušenje i niži prihodi povezani (jer naslov dozvoljava različita tumačenja – npr., možda ljudi puše jer imaju niže plaće, a možda su pušenje i niži prihodi povezani jer su oboje povezani s nečim trećim, primjerice predanosti poslu, pa su pušači možda manje predani poslu i osobe manje predane poslu možda imaju nižu plaću i zato su pušenje i niži prihodi povezani).

Uzorak

Koga uzorak predstavlja?

Pronalaženje sudionika može biti vrlo zahtjevno. Prečica za rješavanje ovog problema je često uključivanje studenata (psihologije) u uzorak sudionika. Iako ta praksa istraživačima značajno olakšava izvedbu istraživanja, s pravom se postavlja pitanje na koga i u kojoj mjeri se odnose rezultati istraživanja provedenog s mladim, talentiranim i obrazovanim ljudima.

Jedan od glavnih razloga zbog kojih se istraživanja provode i objavljuju jest kako bi se donio zaključak o nekim obilježjima kod svih ili većine ljudi, to jest kako bi se dobili zaključci koji se odnose na određenu populaciju. No, mogućnost „preslikavanja“ određenog rezultata i na druge ljude koji nisu sudjelovali u istraživanju uvelike ovisi i o nekim obilježjima sudionika istraživanja i načina njihovog prikupljanja. Populacija o kojoj se zaključuje na temelju rezultata često je u istraživanjima vrlo općenito definirana pa se tako, na primjer, navodi da se radi o punoljetnim osobama koje žive u Republici Hrvatskoj, no uzorkovanje se provodilo tako da nisu uključene osobe koje žive u različitim ustanovama (poput domova za starije i nemoćne osobe), beskućnici i osobe koje nemaju prijavljeno boravište, niti prebivalište itd. Zbog toga se dobiveni rezultati ne mogu na njih poopćiti. Definicija populacije treba biti što preciznija kako bi se izbjeglo izvođenje pogrešnih zaključaka.

Koliko velik treba uzorak biti?

Često je vrlo teško temeljem jednog popisa (npr. popisa stanovništva) dobiti stvaran podatak o broju ljudi u nekoj populaciji. Na primjer, ako nas zanimaju stavovi mladih između 14 i 18 godina, nije dovoljno koristiti samo popise učenika u srednjim školama, već treba uključiti i mlade koji su se ispisali iz srednje škole ili ju nikada nisu ni upisali, mlade koji su završili srednju školu i zaposlili se ili su nezaposleni itd. U protivnom se za dobivene rezultate ne može smatrati da odražavaju stvaran stav mladih te dobne skupine, već samo jednog njenog dijela.

Istraživanja s malim brojem sudionika (na primjer 20-30) uglavnom su eksperimentalne prirode jer je eksperiment u strogo kontroliranim uvjetima logistički i financijski zahtjevan za provedbu. Kako se u eksperimentima tipično kontrolira veliki broj faktora koji bi mogli utjecati na rezultate, dovoljan je manji uzorak da se dođe do kvalitetnih zaključaka. Veličina uzorka predstavlja znatno veći problem u korelacijskim istraživanjima, ako se na primjer zaključci o raširenosti neke osobine ili o međusobnoj povezanosti dviju osobina donose na temelju podataka prikupljenih od relativno malog broja ljudi.

Naime, što je uzorak manji, to je manja i njegova stabilnost, odnosno dobiveni rezultati su u većoj mjeri opterećeni pogreškom. Zbog toga se zaključci o nekoj populaciji ne mogu donijeti na temelju odgovora tek nekoliko njezinih članova. S druge strane, nije potrebno ni da se radi o desecima ili stotinama tisuća sudionika, već u anketnim istraživanjima brojka od 1000 do 1500 sudionika daje vjerodostojne rezultate (Milas, 2009.). Treba uzeti u obzir i na koje pitanje istraživanjem želimo dobiti odgovor. Ako se radi o epidemiološkom istraživanju, gdje nas na primjer zanima koliki postotak djece doživljava nasilje u obitelji, odnosno ako zaključujemo o raširenosti neke osobine ili ponašanja u populaciji, tada uzorci trebaju biti veći i treba obratiti pozornost na to koliki je postotak populacije bio uključen u istraživanje. Ako se pak istražuje povezanost pojedinih osobina koje se smatraju relativno univerzalnima kod većine ljudi, kao što su osobine ličnosti, i manji uzorak može biti dovoljan za donošenje vjerodostojnih zaključaka.

Mjerni instrumenti

U istraživanjima u psihologiji koriste se različiti mjerni instrumenti, a kvaliteta dobivenih rezultata uvelike ovisi o tome koliko je kvalitetan korišteni instrument. Jedna od glavnih karakteristika instrumenata jest njihova valjanost. Valjanost može značiti više stvari, ali se u suštini odnosi na pitanje „Mjeri li pojedini instrument zaista ono što smo mi zamislili da on mjeri?“. U prirodnim znanostima pitanje valjanosti je značajno manji problem, jer su mjerenja direktnija i manje kontroverzna. U psihologiji i ostalim društvenim znanostima, s druge strane, pitanje valjanosti instrumenata je centralno pitanje.

Druga važna karakteristika je pouzdanost instrumenata, koja se odnosi na dosljednost odgovaranja u različitim situacijama, to jest hoće li ista osoba dati isti odgovor u malo drugačijoj, ali usporedivoj situaciji (Milas, 2009.). Ako pitanja nisu jasno postavljena, zahvaćaju samo dio fenomena koji nas zanima, nisu ponuđeni odgovori koji dobro odražavaju mišljenje ili stav sudionika i slično, ne može se ni očekivati da će dobiveni rezultati predstavljati dobru sliku situacije. Ovdje važnu ulogu igra i osjetljivost teme koja se istražuje, zbog čega u nekim situacijama ljudi mogu biti skloni davati socijalno poželjne odgovore, posebno ako se radi o nekoj izrazito kontroverznoj tematici. Zbog toga prilikom donošenja zaključka o relevantnosti nekog rezultata treba razmotriti i sadržaj pojedinih mjernih instrumenata, način na koji su postavljena pitanja te koji su odgovori ponuđeni.

Longitudinalna i transverzalna istraživanja

Longitudinalna istraživanja uglavnom podrazumijevaju više mjerenja/testiranja s istim osobama. Njima želimo zabilježiti i opisati neku promjenu koja se dogodi tijekom vremena, te utvrditi smjer i snagu međuodnosa između varijabli koje se ispituju. Na primjer, ovo se istraživanje koristi kada želimo ispitati promjene, primjerice u društvenim trendovima, koje se zbivaju s vremenom (npr. kompjuterska pismenost), ili pak one koje su rezultat sazrijevanja ili starenja (npr. pamćenje).

Transverzalna istraživanja, s druge strane, ne podrazumijevaju praćenje istih ljudi kroz vrijeme, već odabir različitih dobnih skupina u uzorak, kako bi se zaključivalo o dobnim razlikama u proučavanom fenomenu. Važno je naglasiti kako su iz perspektive vjerodostojnosti rezultata longitudinalna istraživanja mnogo vrjednija od transverzalnih, ali se iz ekonomskih i vremenskih razloga (spora su i skupa), rjeđe provode.

Meta-analize

Naziv za mnoštvo kvantitativnih i kvalitativnih tehnika kojima se sažimaju rezultati velikog broja pojedinačnih istraživanja, a sam naziv zapravo znači svojevrsnu nad-analizu ili analizu već provedenih analiza (Milas, 2009). Danas u znanosti postoji ogroman broj publikacija u časopisima i tradicionalna praksa usmjerenosti na svega nekolicinu istraživanja pri obradi neke teme je neodrživa. Nekoliko istraživanja ni na koji način ne može obuhvatiti slojevitost prikupljenih spoznaja. Meta-analizi uvijek treba vjerovati više nego pojedinačnom istraživanju jer, umjesto da se rezultat istraživanja temelji na prosjeku rezultata nekih sudionika, ovdje se prosječan rezultat, a time i zaključak, izvodi na temelju mnoštva provedenih istraživanja i njihovog zbirnog broja sudionika (Cooper, 1989).

Rezultati

Rezultati su često najviše tehnički dio nekog znanstvenog izlaganja i mogu sadržavati veliki broj tablica, grafova i slika kojima bi autori trebali pokušati što jasnije komunicirati dobivene nalaze. Često je za tumačenje rezultata potrebno barem osnovno znanje iz statistike, ali baš zbog svoje preciznosti, ovo je onaj segment rada iz kojega se može najviše naučiti, donijeti najviše nezavisnih sudova i provesti najdetaljnija evaluacija znanstvenog rada u cjelini.

Značajnost

Često se u medijima može vidjeti prenošenje rezultata nekog istraživanja tako da se navodi kako postoje neke razlike među skupinama ljudi (na primjer, muškaraca i žena) ili kako postoji neka povezanost između različitih osobina i ponašanja kod ljudi. No, iako su rezultati istraživanja pokazali da razlika ili povezanost zaista postoji (da je statistički značajna), to ne znači da će ona nužno biti jako uočljiva ili na bilo koji način relevantna u stvarnom svijetu. Drugim riječima, neki rezultat može biti statistički značajan, ali to ne mora značiti da on ima i veliku praktičnu važnost.

Na primjer, često se spominju razlike u uspjehu na standardiziranim testovima znanja između djevojčica i dječaka. Iako te razlike možda zaista postoje, osim njihove statističke značajnosti treba uzeti u obzir i stvarne razlike u postignutim rezultatima. Ako se radi o testu na kojem je moguće postići između 0 i 100 bodova te na kojem djevojčice postižu u prosjeku 73,4, a dječaci 72,6 bodova, ta razlika može biti značajna na velikom uzorku, no radi se o svega 0,8 bodova razlike. U takvoj situaciji razlika vjerojatno postoji u populaciji, ali se radi o vrlo maloj razlici na temelju koje se ne može nužno očekivati da će u svakodnevnom životu te razlike između dječaka i djevojčica biti uočljive ili da će se u velikoj mjeri odraziti na razlike u uspješnosti u određenom školskom predmetu.

Grafički prikazi

Rezultati znanstvenih istraživanja često se prikazuju različitim grafikonima, tablicama i slikama. Vjerojatno najčešći oblik grafičkog prikaza su histogrami – grafovi koji na x-osi pokazuju neku vrijednost (na primjer, dob), a na y-osi broj ili postotak sudionika. Stupci histograma predstavljaju grupe sudionika prema dobi, a visina stupca odgovara broju, odnosno postotku. Stupci mogu pokrivati različite raspone – na primjer, ako je nekim istraživanjem zahvaćen uzorak dobnog raspona od 15 do 45 godina, stupci mogu prikazivati raspon od 5 godina (15-19, 20-24, 25-29…), pa visina stupca prikazuje koliki je broj sudionika, primjerice  u dobi od 15 do 19 godina, obuhvaćen istraživanjem.

Problem je što je raspon stupaca potpuno arbitraran pa je moguće koristiti bilo koji raspon, od najfinijeg (da svaka dob u godinama ima svoj stupac) do najgrubljeg (dva stupca – 15-30, 31-45). Odabirom raspona moguće je utjecati na izgled grafa, a i na zaključke do kojih će ljudi koji analiziraju graf doći. Na primjer, ako u istraživanju iz bilo kojeg razloga nisu zahvaćeni sudionici u dobi od 17 i 18 godina, moguće je to sakriti tako da se koriste širi rasponi, pa se svi sudionici u dobi od 15 do 24 prikažu skupa. U tom će se slučaju u potpunosti izgubiti podatak da nedostaje sudionika u dobi od 17 i 18 godina, jer će oni biti zasjenjeni brojem sudionika u svojem rasponu. Ako bi se isti podaci prikazali rasponima od 1 ili 2 godine, onda bi se jasno vidjelo da na 17 i 18 postoji praznina (Slika 1).

Slika 1. Prikaz različitih grafova, ovisno o odabranim dobnim rasponima, za hipotetsko istraživanje zadovoljstva životom kod osoba u dobi od 15-45 godina

Drugi veliki problem koji se veže uz grafove je pitanje skale korištenih osi. Bez obzira o kojem tipu grafa se radi, uvijek je iznimno važno pri čitanju grafa obratiti pažnju na skalu na kojoj su prikazane osi. Skala osi definira koliko su vrijednosti na toj osi “razvučene”, odnosno koliko sitnih detalja graf prikazuje (Slika 2).

Na primjer, zamislimo graf koji prikazuje prosječnu godišnju temperaturu na Zemlji u proteklih 120 godina. Na x-osi su godine od 1900 do danas, a na y-osi je temperatura za svaku godinu u celzijusima. Ako bi skala y-osi iznosila od -50 do +50 stupnjeva, onda bi prosječna temperature izgledala kao ravna crta – nema govora o globalnom zatopljenju! S druge strane, kada bi skala bila manje razvučena i prikazivala raspon od +12 do +18 stupnjeva, mogao bi se jasno vidjeti porast temperature u zadnjih 70 godina.

Slika 2. Različit način prikaza istih podataka o prosječnoj godišnjoj temperaturi na Zemlji kroz proteklih 100tinjak godina

Rasprava

Glavna uloga rasprave u znanstvenom radu je davanje smisla opaženim rezultatima. Drugim riječima, rasprava služi tome da se dobiveni rezultati interpretiraju i da im se da neko psihološko značenje. To najčešće znači da se dovedu u vezu s ranijim empirijskim nalazima iz tog područja, ali i da se postave u kontekst neke teorije ili modela. Vrlo često je moguće post-hoc objasniti bilo koji dobiveni nalaz, bez obzira je li on stvarni fenomen ili se temelji na pogrešci ili pristranosti. U području psihologije, a i društvenih znanosti općenito, postoji toliki broj teorija koje su često međusobno oprečne, da se gotovo bilo koji efekt može objasniti i uklopiti u kontekst neke postojeće teorije. Stoga je iznimno važno, prije nego prihvatimo interpretaciju koju nam nude autori, razmisliti jesu li svi ostali potencijalni uzroci opaženog fenomena uzeti u obzir.

Važno je prosuditi jesu li autori nekog istraživanja u opisu rezultata i njihovoj interpretaciji obuhvatili sve relevantne podatke kako bi se rezultati zaista mogli pripisati fenomenu koji autori navode. Najvažnije pitanje koje si trebamo postaviti kad analiziramo rezultate i interpretaciju nekog istraživanja je: Mogu li se dobiveni rezultati protumačiti na neki drugi način? Postoji li neki treći faktor ili neka pozadinska varijabla koja može objasniti opaženi fenomen?

Zamislimo istraživanje u kojemu su istraživači na uzorku djece u različitim razredima osnovne škole pronašli visoku povezanost između inteligencije i visine djeteta, i to tako da su viša djeca inteligentnija. Znači li to da visina „uzrokuje“ inteligenciju ili inteligencija „uzrokuje“ visinu? Ne nužno. Ovaj nalaz je puno jednostavnije objasniti činjenicom da je u podlozi ove povezanosti treća varijabla – dob! Starija djeca su u prosjeku viša, ali i postižu više rezultate na testovima inteligencije. Ako ne uzmemo dob u obzir, onda će nas ovakvi rezultati bez sumnje navesti na pogrešan zaključak.

Zaključak

Zaključak je dio znanstvenog rada u kojem bi autori ukratko trebali navesti glavne nalaze opisane u radu i to tako da odgovaraju na konkretne hipoteze ili barem na okvirni cilj istraživanja opisan u dijelu metode ili u završnom dijelu uvoda. Zaključak bi trebao zaokružiti dojam o prikazu rezultata i u sažetoj formi popisati najvažnije nalaze i njihove posljedice. Nemaju svi znanstveni radovi nužno eksplicitno odvojen dio za zaključak, već on može biti uključen u zadnji dio rasprave.

Literatura

Milas, G. (2009). Istraživačke metode u psihologiji i drugim društvenim znanostima (2. izdanje). Jastrebarsko: Naklada Slap.

Cooper, H.M. (1989). Integrating research: A guide to literature reviews (2. izdanje). Newbury Park, CA: Sage.