Back to Search Start Over

YouTube-videoiden konekääntimellä käännettyjen tekstitysten laatu

Authors :
Saikko, Tuisku
Informaatioteknologian ja viestinnän tiedekunta - Faculty of Information Technology and Communication Sciences
Tampere University
Publication Year :
2021

Abstract

Tämän tutkielman tarkoitus on selvittää, kuinka laadukkaita videopalvelu YouTuben konekääntimellä käännetyt tekstitykset ovat ja mitkä tekijät vaikuttavat tekstitysten laatuun. Aihetta on tärkeää tutkia, sillä konekääntimellä käännetyt tekstitykset voivat hyödyttää sekä videoiden tekijöitä, jotka voivat tavoittaa niiden avulla entistä laajemman yleisön, että videoiden katsojia, joille tekstitykset voivat avata katsottavaksi entistä enemmän sisältöä. Konekääntimen kääntämät tekstitykset ovat myös entistä tärkeämpiä katsojille, sillä YouTube poisti syksyllä 2020 käytöstä toiminnon, jonka avulla katsojat pystyivät lisäämään videoihin omia käännöksiään videoiden tekstityksistä. Monet katsojat voivat sen vuoksi joutua luottamaan konekääntimen kääntämiin tekstityksiin, jos he haluavat katsoa vieraskielisiä videoita. Tutkielman aineisto koostuu 997 englanninkielisestä virkkeestä ja niiden suomenkielisistä käännöksistä, joista molemmat kerättiin viiden YouTube-videon tekstityksistä. Aineiston käännösten arviointiin käytettiin manuaalista arviointitapaa, jossa jokainen käännös sai arvosanan asteikolla 1–5 sen kyvystä välittää alkuperäisen virkkeen merkitystä sekä sen kielen sujuvuudesta. Tutkielman teoreettisessa viitekehyksessä yhdistyvät konekääntämisen ja konekäännösten arvioinnin tutkimus. Konekääntämisen tutkimuksen osuudessa käsitellään eniten neuroverkkokääntämisen tutkimusta, sillä tutkielman aineisto on hyvin todennäköisesti käännetty YouTuben omistajan, Googlen, kehittämällä neuroverkkokääntimellä. Tutkielman tulosten mukaan YouTuben konekääntimellä käännetyt tekstitykset välittävät suurimman osan alkuperäisten tekstitysten merkityksestä ja ovat hyvää, mutta ei täysin virheetöntä suomen kieltä. Konekäännin onnistuu kääntämään parhaiten virkkeet, jotka ovat lyhyitä, rakenteeltaan yksinkertaisia ja merkitykseltään yksiselitteisiä. Konekääntimellä käännettyjen tekstitysten laatua heikentävät pitkät virkkeet, virkkeiden monimutkaiset rakenteet, monitulkintaiset ilmaukset kuten synonyymit ja idiomit sekä ilmeiset puutteet konekääntimen kouluttamiseen käytetyissä korpuksissa. Nämä tulokset antavat tärkeää tietoa siitä, miten konekäännintä voidaan kehittää, jotta se pystyisi kääntämään tekstitykset mahdollisimman hyvin ja tekstityksistä saataisiin kaikki mahdollinen hyöty irti.

Details

Language :
Finnish
Database :
OpenAIRE
Accession number :
edsair.od......4853..9631f336534f86c3848b3a2bcd2a9ba7