Basso, Alessandra, University of Helsinki, Faculty of Social Sciences, Practical Philosophy, Doctoral Programme in Philosophy, Arts and Society, Helsingin yliopisto, valtiotieteellinen tiedekunta, Filosofian, taiteiden ja yhteiskunnan tutkimuksen tohtoriohjelma, Helsingfors universitet, statsvetenskapliga fakulteten, Doktorandprogrammet i filosofi, konstforskning och samhället, Angner, Erik, Mäki, Uskali, Marchionni, Caterina, and Tal, Eran
This dissertation addresses the challenges that arise when measuring phenomena in the social and behavioural sciences. The studies in this dissertation argue that there is continuity in the notion of measurement accuracy across the natural, social, and behavioural sciences because measurement assessment practice, and the notion of accuracy it relies upon, exhibits important similarities across disciplines. As with physical measurement, social and behavioural scientists assess the reliability of measurement by looking at the robustness of the outcomes across multiple measurements of the same parameter. Consistency across different measurements is taken as a sign that the outcomes can be attributed to what is measured. Scientists can improve this consistency by detecting and correcting for errors. In this assessment practice, the accuracy of measurement is the degree of agreement among multiple measurements of the same parameter. However, due to the nature of the phenomena being studied, social and behavioural measurement involves a greater degree of approximation and requires more flexibility in the measurement procedures and assessment methods. Many of the phenomena studied in the social and behavioural sciences are multifaceted and/or loosely defined and therefore some measurement procedures cannot be modelled to the same level of detail as the measurement of well-defined physical quantities. As a result, the measurement of these phenomena necessarily involves greater degrees of approximation. Social and behavioural phenomena, moreover, often change over time and have different characteristics across contexts, and as such might require partially distinct kinds of measurement. Additionally, unlike in the physical sciences, social and behavioural phenomena are often morally laden and as a consequence their measurement requires making value judgments, which are highly sensitive to the context of application. Therefore it is not obvious that a standardised definition of these complex and changing phenomena is the best epistemic strategy to pursue. When measuring these phenomena, scientists face a trade-off between the need to standardise measurement practice in order to improve comparability and facilitate the accumulation of knowledge, and the demand to tailor the definition to the specific contexts being studied. In my view, context-dependency and approximation do not lead to pessimistic conclusions about the reliability of measurement in these fields, but should rather be seen as guiding measurement practice and the employment of its outcomes. For instance, to deal with context-dependency, scientists can adopt strategies that trace regularities in context-dependence and improve the comparability across context- dependent measurements. When the measurement is influenced by the purpose and context of application, what counts as good measurement is also sensitive to purpose and context, and therefore can admit different degrees of approximation. The studies in this dissertation suggest ways to improve how scientists deal with these challenges and warn against ways of using the outcomes that can raise conceptual or epistemological doubts. Tässä väitöskirjassa käsitellään mittaamiseen haasteita yhteiskunta- ja käyttäytymistieteissä. Osoitan, että mittausten arviointikäytännöt ja niissä käytetyt tarkkuuden käsitteet ovat tärkeillä tavoilla samanlaisia eri tieteenaloilla. Samoin kuin fysikaalisessa mittaamisessa, yhteiskunta- ja käyttäytymistieteilijät arvioivat mittauksen luotettavuutta vertaamalla toisiinsa useita saman parametrin mittauksia. Yhdenmukaisuus eri mittausten välillä on merkki siitä, että tuloksia voidaan pitää mitattavan ominaisuuksina. Tutkijat voivat edelleen kohentaa tätä yhdenmukaisuutta havaitsemalla ja korjaamalla mittausten virheitä. Tässä arviointikäytännössä mittauksen tarkkuus on useiden saman parametrin mittausten yhteensopivuuden aste. Tutkittavien ilmiöiden luonteesta kuitenkin johtuu, että yhteiskunta- ja käyttäytymistieteellisessä mittauksessa likimääräisyyden aste on suurempi ja että ne vaativat enemmän joustavuutta mittaus- ja arviointimenetelmissä. Monet yhteiskunta- ja käyttäytymistieteissä tutkituista ilmiöistä ovat monitahoisia ja/tai löyhästi määriteltyjä, minkä vuoksi joitain mittausmenetelmiä ei voida mallintaa yhtä yksityiskohtaisesti kuin hyvin määriteltyjen fysikaalisten suureiden mittauksessa. Tämän vuoksi näiden ilmiöiden mittaamiseen liittyy väistämättä suurempaa likimääräisyyttä. Lisäksi yhteiskunnalliset ja käyttäytymiseen liittyvät ilmiöt muuttuvat usein ajan myötä ja niillä on erilaisia piirteitä eri konteksteissa, ja siksi ne saattavat vaatia osittain erilaisia mittauksen tapoja. Mielestäni kontekstiriippuvuus ja likimääräisyys eivät johda pessimistisiin johtopäätöksiin mittauksen luotettavuudesta näillä aloilla, vaan ne tulisi pikemmin nähdä ohjaavina tekijöinä mittauskäytännöille ja niiden tulosten hyödyntämiselle. Tutkijoille on tarjolla strategioita, joilla voidaan parantaa kontekstiriippuvaisten mittausten vertailtavuutta. Lisäksi erilliset käyttötarkoitukset ja -kontekstit voivat sallia erilaisia likiarvoisuuden asteita. Tämän väitöskirjan tutkimukset ehdottavat keinoja, joilla tutkijat voivat paremmin käsitellä näitä haasteita, ja varoittavat käsitteellisiä tai tiedollisia epäilyksiä synnyttävistä tavoista käyttää tutkimustuloksia.