Videon tekstitys – Tekstitystyökalut ja puheentunnistus

  • Kirjoittaja: Niina Naumanen, tulkkiopiskelija ja saavutettavuusasiantuntija, Tulkkaus ja kommunikaatio-ohjaus, Humanistinen ammattikorkeakoulu, 21.9.2021

Aikaisemmassa Mitä huomioida tekstittämisessä? -blogikirjoituksessani keskityin siihen, miksi tekstittäminen on tärkeää sekä mitä siinä kannattaa ottaa huomioon.

Toimiessani harjoittelijana Humakissa kokeilin erilaisia puheentunnistusohjelmia ja tekstitystyökaluja videon tekstittämiseen. Tässä kirjoituksessa pyrin avaamaan hieman kokemuksiani, kuinka tekstittäminen sujui kesän aikana erilaisia ohjelmia hyödyntäen. Kuinka kauan videon tekstittäminen vie aikaa ja miten tekstitystyökalut ja puheentunnistus vaikuttavat tekstittämiseen?

Tekstitys on aikaa vievää

Monella sivustolla mainitaan, että tunnin videon tekstittämiseen menee noin yksi työpäivä. Tämä piti aika lailla paikkaansa, mutta itselläni tekstitysten tekoaika vaihteli todella paljon esimerkiksi videon äänenlaadusta, aiheista, puhujien määrästä ja puheen selkeydestä riippuen. Koska tekstityksen laatu ja siihen käytettävä aika ovat suhteessa toisiinsa, pohdin alussa paljon, kuinka paljon käytän yhden videon tekstityksen viilailuun aikaa.

Myös käyttämäni tekstityökalu ja puheentunnistus vaikuttivat tekstitysaikaan. Joillakin työkaluilla tekstittäminen oli hidasta ja joillakin nopeampaa. Toinen puheentunnistusohjelma tunnisti puhetta paremmin kuin toinen. Uuden ohjelman tutkimiseen meni aina hetki aikaa ennen kuin käyttö alkoi sujua rutiininomaisesti. Monessa tekstitystyökalussa saattoi olla pikanäppäimiä, jotka oppimalla tekstitys sujuvoitui huomattavasti. Käyttökokemukseni työkalusta lisäsi varmasti nopeutta työskentelyyn. Lisäksi itse tekstittämisprosessiin syntyi kokemuksen myötä rytmiä ja nopeutta kesän aikana.

Myös virheistä ja palautteesta opin. YouTube Studion tekstityökalulla tekstittäessä tekstitysten tallentaminen oli oppi, joka juurtui kesän aikana takaraivoon. Kun kone sammuu ja vaivalla tehty tekstitystiedosto häviää, niin viimeistään kolmas kerta toden sanoo, ja nyt muistan jatkossa säännöllisesti tallentaa tekemää tekstitystäni. Arvokasta oppia oli myös kuulla Päivi Rainòn mietteitä tekemistäni tekstityksistä. Saada ammattilaiselta tietoa siitä, millaisia vaihtoehtoisia ratkaisuja tekstityksiin voin myös tehdä. Vinkkien jakaminen eri tekstitystyökaluista oli myös hyvin antoisaa.

Puheentunnistusohjelma tuo nopeutta

Tekstittäessäni käytin apuna puheentunnistusohjelmia. Puheentunnistusohjelma luo äänitiedostolle tekstivastineen, jota kutsutaan raakatekstiksi. Automaattinen puheentunnistus laskee videon äänen ominaispiirteet ja vertaa niitä laskettuihin matemaattisiin malleihin. Eli puheentunnistus pyrkii valitsemaan puhetta parhaiten vastaavat sanat (Kurimo 2016, 89.). Puheentunnistusohjelman laatuun vaikuttavat muun muassa äänen laatu ja puhujan puhetyyli (Holopainen, Järveläinen, Karhula, Savolainen & Suikka 2021).

Pidin erityisesti puheentunnistuksesta, koska se nopeutti tekstittämistä huomattavasti rytmittämällä puheen repliikeiksi raakatekstiin. Sain tekstitys rungon, jota lähteä muokkaamaan korjaamalla ohjelman tekemät virheet, tiivistämällä ja lisäilemällä välimerkit. Muista tekstilajeista poiketen tekstityksissä välitetään informaatiota vakiintuneiden esitystapojen kautta. Esimerkiksi ajatusviiva tekstityksen lopussa merkitsee sitä, että lause jatkuu seuraavassa repliikissä (Tuominen 2007, 301.). Näitä vakiintuneita esitystapoja lisäilin myös itse raakatekstiin.

Tekstitystyökalun luoma raakateksti, jossa tekstitys on jaettu kahteen ajastettuun repliikkiin, joista ensimmäisessä lukee "hei" ja toisessa ""tänään on aiheena tekstittäminen".
Kuvassa esimerkki puheentunnistusohjelman luomasta raakatekstistä (.SRT-tiedosto). Kuva: Niina Naumanen

Helppokäyttöinen tekstitystyökalu

Lukuisilla erilaisilla tekstitystyökaluilla ja sovelluksilla pystyy tekemään tekstityksiä videoihin. Monissa sovelluksilla kuten TikTokissa ja Instagramissa näkee videoissa tekstityksiä. Erilaisia tekstittämistyökaluja on lukuisia. Esimerkiksi testaamani YouTube Studio, Subtitle edit ja Habbyscribe. Myös videoeditorit kuten Adobe Premiere Rush, mahdollistavat videon tekstittämisen. Työkalut voivat olla maksullisia tai ilmaisia. On myös yrityksiä, jotka tekevät omilla hinnastoillaan valmiit tekstitykset videoon. Vaihtoehtoja siis tekstittämiseen löytyy.

Yksi suosikkini kokeilemistani tekstitystyökaluista oli helppokäyttöinen YouTube Studio. Valitettavasti YouTubessa ei ole käytössä puheentunnistusta suomen kielelle, mutta käytin muuta puheentunnistusohjelmaa ja liitin raakatekstin Studioon, jota lähdin Studiossa muokkaamaan. Studiossa voi myös toki kirjoittaa tekstit itse ilman puheentunnistuksen käyttöä. Olisin toivonut, että YouTuben tekstitystyökalussa olisin saanut mahdollisuuden päättää itse tekstirivien pituudet kaksirivisissä tekstityksissä. Tätä mahdollisuutta en Studiosta ainakaan vielä itse löytänyt. Helppolukuisuuden vuoksi kaksirivisissä tekstityksissä suositaan sitä, että ylempi tekstirivi on lyhyempi kuin alempi tekstirivi. Tällöin teksti on miellyttävämpi ja nopeampi lukea (Vertanen 2007, 156.).

Toiseksi suosikikseni nousi maksullinen Habbyscribe, työkalun selkeyden ja myös helppokäyttöisyyden vuoksi. Video ladattiin Habbyscribeen, jossa puheentunnistus teki videon ohelle raakatekstityksen. Tämän jälkeen raakatekstiä pääsi muokkaamaan itse. Työkalu oli mielestäni selkeä, koska puheentunnistus ja raakatekstin muokkaus tapahtuivat molemmat samassa työkalussa.

Kuvassa YouTube Studio -tekstitystyökalu. Vasemmalla puolella ruutua on lokerot joihin tekstit saa ajastettua ja kirjoitettua. Ensimmäisessä lokerossa on teksti: Esimerkkiteksti. Oikealla puolella näkyy YouTubeen ladattu video, jota ollaan tekstittämässä. Kuvan alareunassa näkyvät ääniraita ja tekstiraita.
Kuvassa YouTube Studio -tekstitystyökalu. Kuva: Niina Naumanen.

Teknologia kehittyy jatkuvasti

Jotta puheentunnistus kehittyy, on olennaista, että tekoälyn oppimisen pohjalla on riittävän laaja aineisto (Holopainen ym. 2021). Huomasin puheentunnistusta käyttäessäni, että puheentunnistus tunnisti monesti yleiskieltä paljon paremmin kuin murteita tai vaikkapa slangia. Riskinä koneen tekemissä tekstityksissä on laatu. Jos laatua ei varmista korjaamalla koneen tekemiä virheitä, voi konekäännös olla saavutettavuuden esteenä ja virheellisen tiedon edistäjänä (Koponen & Nyrminen 2020.). Itse jouduin muokkaamaan puheentunnistusohjelmien tekemiä raakatekstityksiä paljon, koska välillä ohjelmien luomista raakateksteistä ei saanut edes mitään tolkkua.

Vaikka puheentunnistusohjelma tunnistaisi puhetta aivan täydellisesti, voisi puhekieltä olla työläs ja haastava lukea, koska emme ole tottuneet kirjoituksessa puheen piirteisiin. Puhe ja kirjoitus ovat olemuksiltaan erilaisia, joten puheentunnistusohjelman luomaa raakatekstiä jouduin muokkaamaan paljon itse (Kurimo 2016, 94.). Puhetta editoin tiiviiksi kirjoitetuksi tekstiksi. Esimerkiksi puheessa esiintyviä ilmauksia voidaan lyhentää lyhyemmillä synonyymeilla, jotta ne mahtuvat paremmin videon ruudulle tekstityksiksi (Pöntys 2007, 145).

Kokeillessani eri työkaluja tekstittämiseen, huomasin suosivani automaattisesti työkaluja, joilla sain tekstitysnopeutta lisäten työtehokkuuttani. Tekstitystyökalussa minusta tärkeintä oli helppokäyttöisyys ja selkeys, jotka toivat nopeutta ja sujuvuutta. Erilaisia tekstitystyökaluja kehitetään jatkuvasti ja mielestäni kehitystä on mielenkiintoista seurata. Miten teknologia tulee kehittymään tekstittämisen näkökulmasta?

 

Lähteet:

Holopainen, Riitta & Järveläinen, Leena & Karhula, Päivikki &Savolainen, Eeva & Suikka, Minna 2021. Videoiden tekstitystyökalut vertailussa. Sirnum 2/2021. Viitattu 1.9.2021 https://journal.fi/signum/article/view/109614/64419

Koponen, Maarit & Nyrminen, Manu 2020. Konekäännös tiedon saavutettavuuden edistäjänä ja esteenä. Toim. Hirvonen Maija & Kinnunen Tuija. Saavutettava viestintä: yhteiskunnallista yhdenvertaisuutta edistämässä. Helsinki: Gaudeamus.

Kurimo, Mikko 2016. Puheentunnistuksen toimintaperiaatteet ja hyödyntämismahdollisuudet tekstityksessä ja kirjoitustulkkauksessa. Toim. Tiittula Liisa & Nuolijärvi, Pirkko. Puheesta tekstiksi. Puheen kirjallisen esittämisen alueita, keinoja ja rajoja. Helsinki: Suomalaisen Kirjallisuuden Seura.

Pöntys, Minna 2016. Ohjelmatekstitys – silmin nähtävää puhetta. Toim. Tiittula Liisa & Nuolijärvi, Pirkko. Puheesta tekstiksi. Puheen kirjallisen esittämisen alueita, keinoja ja rajoja. Helsinki: Suomalaisen Kirjallisuuden Seura.

Tuominen, Tiina 2007. Vastaanottoa vai vastustusta. Audiovisuaalisten käännösten reseption tutkimuksesta. Toim. Tuominen, Tiina & Oittinen Riitta. Olennaisen äärellä: johdatus audiovisuaaliseen kääntämiseen. Tampere: Tampereen yliopisto.

Vertanen, Esko 2007. Ruututeksti tiedon ja tunteiden tulkkina. Toim. Tuominen, Tiina & Oittinen Riitta. Olennaisen äärellä: johdatus audiovisuaaliseen kääntämiseen. Tampere: Tampereen yliopisto.