Sanasto on kommunikaation peruskivi: ymmärtämisen ja itseilmaisun väline. Kansainvälisten tutkimusten mukaan sanastolliset taidot ovat vahvasti yhteydessä yksilön kokonaiskielitaitoon ja tärkeä akateemisen menestyksen selittäjä. Siksi mahdolliset yksilölliset erot lasten sanastollisessa tiedossa ja taidossa ovat merkityksellisiä. Suomessa kouluikäisten lasten sanaston hallintaa ja siihen vaikuttavia tekijöitä ei kuitenkaan ole aiemmin laajamittaisesti tutkittu. FM Mari Hongon väitöstutkimus kohdistuu alakouluikäisten lasten sanastolliseen tietoon ja taitoon. Seurantatutkimuksen kohteena olivat sekä Suomessa syntyneet tai Suomessa pitkään asuneet maahanmuuttajataustaiset lapset (laajennettu toinen sukupolvi) että suomea äidinkielenään puhuvat ikäverrokit. Kaikkiaan tutkimukseen osallistui yli 500 lasta. Sanaston hallintaa selvitettiin laaja-alaisesti sekä kieliaineistojen että kyselytiedon avulla. Yksi tutkimuksen keskeisistä havainnoista oli, että maahanmuuttajataustaisilla, Suomessa syntyneilläkin lapsilla on vielä alakoulun päättövaiheessa huomattavasti verrokkiryhmää useammin puutteita tavanomaisen suomen kielen sanaston hallinnassa. Vaikka molemmissa kieliryhmissä oli sanastollisilta resursseiltaan vahvoja oppilaita, yksittäisten oppilaiden väliset taitoerot olivat toisen sukupolven oppilaiden ryhmässä huomattavasti verrokkiryhmää suuremmat. Yksilölliset erot sanastonhallinnassa osoittautuivat kolmen vuoden seurantajaksolla pysyviksi, sillä seurantajakson alussa (vuosiluokilla 2–3) sanastollisilta taidoiltaan vahvoilla lapsilla oli voimakas taipumus säilyttää ryhmän sisäinen asemansa vertailussa kolme vuotta myöhemmin (vuosiluokilla 5–6). Näin oli siitä huolimatta, että kaikkien lasten sanastollinen tieto ja taito kehittyvät kouluvuosina monialaisesti ja voimakkaasti. Ymmärtämis- ja tuottamistaidot olivat vahvasti toisistaan riippuvaisia. Vahvuudet yhdellä osa-alueella, kuten käytetyn sanaston monipuolisuudessa, yhdistyivät tyypillisesti vahvuuksiin muilla osa-alueilla – esimerkiksi sanavaraston laajuuteen tai sanaston käytön sujuvuuteen tai tarkkuuteen. Kieliaineistojen tutkimisessa hyödynnettiin ja arvioitiin leksikaaliseen frekvenssiin eli sanojen yleisyyteen perustuvia menetelmiä. Samalla arvioitiin kielenkäyttöaktiivisuuden ja -ympäristöjen vaikutusta sanastollisen tiedon ja taidon kehittyneisyyteen. Frekvenssipohjainen metodi osoittautui tutkimuksessa monella tapaa toimivaksi. Sanojen yleisyys suomen kielessä oli yhteydessä niiden osaamiseen testitehtävissä ja käyttöaktiivisuuteen kirjoittamistuottamisessa. Omassa tuottamisessa sanastollinen toisteisuus väheni kielellis-kognitiivisen kehityksen myötä. Samalla harvinaisten sanojen käyttö lisääntyi, mutta toisen sukupolven ryhmässä vain suhteessa tuottamisen runsastumiseen. Tutkimuksessa kerättiin tietoa myös maahanmuuttajataustaisten lasten oman äidinkielen käytöstä ja taidosta. Suomen kieli oli alakoulun loppuvaiheessa usein jo sekä laajemmin käytetty että taidollisesti vahvempi kieli. Vanhemmilta opittu kieli oli useimmissa perheissä kuitenkin ollut lapsen ensimmäinen aktiivisesti käyttämä kieli ja säilyttänyt asemansa etenkin perheen aikuisten ja lasten välisenä käyttökielenä. Toiminnalliseen monikielisyyteen ohjaaminen saa tutkimushavainnoista voimakkaan tuen: aktiivinen ja monipuolinen kielenkäyttö yhdistyvät kielestä riippumatta vahvaan kielitaitoon, ja vahva oman äidinkielen taito yhdistyy vahvaan suomen kielen taitoon. Koska sanaston hallinta on tärkeä osa kaikkea kielenkäyttöä, tutkimuksessa havaituilla eroilla voidaan arvioida olevan vaikutusta mm. lasten itseilmaisun kykyyn sekä kykyyn omaksua uusia oppisisältöjä suomenkielisessä kouluopetuksessa. Sanastollisen tiedon ja taidon kehittymisen tukemiseen sekä sanojen yleisyyteen liittyvän tiedon hyödyntämiseen niin opetuksessa kuin tutkimuksessakin on Suomessa jatkossa kiinnitettävä enemmän huomiota. Lexical knowledge and skills can be regarded as the core of all language use. Linguistic communication cannot succeed without a shared understanding of both word meanings and the main principles of how different words behave in a specific language (e.g. inflectional systems and the conventions of combining lexical units). Individual areas of lexical knowledge and skills such as lexical diversity and the size of the mental lexicon have been extensively studied, especially among learners of English as a second language. However, previous research has rarely combined a critical validation of its methods with proficiency level, time of exposure and the status of each language. This large-scale study on the lexicon of primary school pupils fills the gap left by earlier studies; research focusing on the lexicon of second language learners as well as native speakers of Finnish is rare in Finland. This study stems from the need to obtain specific information about the mastery of the Finnish lexicon from both L1 (Finnish as a first language, n=360) and L2 (Finnish as a second language, n=199) primary school children, and about the relationship between the mastery of the lexicon and other areas of language skills and use. A longitudinal study covering a three-year period (2nd–3rd grades to 5th–6th grades) also enables the tracking of the development of individual skills – and the persistence of differences in these skills – within the group. In this study the L2 group is limited to the widened second generation only, which denotes both children born in Finland to immigrant parents and children who immigrated to Finland before primary school. In contemporary public discussion, the language skills and social contexts of language use by second generation immigrants are repeatedly considered identical with those of the children who only use Finnish as their home language. In order to ground any claims, linguistic arguments should be presented and comprehensive studies should be conducted. In addition, a more precise definition of the concept of second generation language learners is required. Theoretically, the study is based on the usage-based framework of language learning. In this study, linguistic knowledge and skills are primarily defined by the opportunities to use the language, and not by the learner status (L1/L2) or the dominant language of the community. The usage-based model is applied to data analysis in two ways. First, the linguistic analysis of the learner vocabulary is strictly limited to contexts where the language has been used. Second, the methodological emphasis of data analysis is based on measurements of lexical frequency. Lexical frequency is defined, investigated and assessed both at the level of language (general input frequency) and at the level of individual texts (specific output frequency). The material of the study consists of a) vocabulary tasks concentrating on a verb lexicon from different frequency bands, b) written narratives, and c) extensive background questionnaires that were sent to pupils, their guardians and both L1 and L2 teachers. Statistical analyses were used to establish correlations between linguistic characteristics, background information and general variables (such as the informant’s age, gender and language group). Accordingly, this study has produced information about the validity of the frequency-based method in assessing the lexicon of primary school children. Frequency-based methodology and analysis, as well as the ample data itself, strongly bind this study to the field of corpus study. Lexical tasks measuring productive and receptive lexical skills were consistent at the individual level; lexical knowledge and skills increased during the three-year followup. In written narratives, lexical diversity expanded and the usage of rare words increased from grades 2–3 to 5–6. In the written narratives, the structural complexity of the words and density of long words grew even though writing was generally more accurate. Different parts of the lexicon interact with each other; mastering one particular area is usually connected with a good knowledge of the others. An extensive lexicon is typically connected to strengths in the quality of lexical knowledge and in the ability to adjust lexicon to usage. Even so, the development was not identical in different (language or gender-based) informant groups. In written tasks, boys tended to perform worse than girls, which also correlates with the results of productive-emphasized assignments when assessing vocabulary. The differences between the L1 and L2 groups of this study were considerable: in the L2 group, lexical knowledge and skills developed with a few years’ delay in comparison with the L1-peer group. This was manifested, for example, in a lower rate of rare words, less lexical diversity and a significantly weaker mastery of vocabulary tasks. Active, varied use of the language during – and especially outside – school hours, in addition to enthusiasm for learning the language, strongly supports the development of the lexicon. At the same time, difficulties in language learning and use are related to a deficient lexicon. The results of the study also offer arguments against an assumption of the advantages of replacing L1 with L2 in immigrant families. Active use or a high proficiency level of L1 was not observed to harm the learning of Finnish. On the contrary, a high proficiency level of L1 correlates positively and significantly with a high proficiency level of L2 when measured in school grades. This finding is in accordance with the results of previous studies focusing on the different languages of multilingual individuals; languages support each other. One of the main findings of this dissertation is that the frequency-based method functions well. The frequency band (fb) that best suits different points of learning varies according to informant groups (L1/L2, gender) and type of task (e.g. productive/receptive task). Already during the primary school, it typically settles at level a little higher than fb 1000. These thousand words, on the other hand, cover most of the lexical items children spontaneously produce regardless of modality, text type or even topic. This explains why problems in lexicon can go unnoticed for a long time, even at school. The comparison of frequency-based methods showed that the most reliable indicator of lexicon development was a structured vocabulary test that combines different kinds of tasks demanding both receptive and productive skills. What strengthens this kind of assignment is that the tested items can be chosen from various frequency bands to modify the difficulty of the test. Due to the large and heterogeneous informant group of the study, many other factors and measurements also reflected salient variables fairly well, and at significant levels. Nevertheless, when drawing conclusions on lexical knowledge and skills at the individual level, these tools did not achieve sufficient accuracy. According to the vocabulary tests, the relative permanence of the individual proficiency level tends to be very high, and higher than according to other individual variables discussed (rS=0.84, p