Lapsen kielenoppiminen perustuu kuunteluun ja vuorovaikutukseen ympäristön kanssa. Kielenoppimisen prosesseja voidaan tutkia analysoimalla lasta ympäröivää puhevirtaa puheteknologian ja erilaisten laskennallisten mallien avulla.
– Kun ymmärrämme ne mekanismit ja periaatteet, joihin lapsen kielenoppiminen perustuu, voimme hyödyntää tietoa koneälyn kehittämisessä, uskoo akatemiatutkija, apulaisprofessori Okko Räsänen.
Räsänen johtaa puheen ja kognition tutkimusryhmää (Speech and Cognition Research Group) Tampereen yliopiston informaatioteknologian ja viestinnän tiedekunnassa tietotekniikan yksikössä.
– Yksi tutkimusryhmämme pääteemoista on lapsen varhaisen kielenoppimisen tutkimus puheteknologian avulla. Teemme laskennallisia malleja lapsen kielenoppimisesta sekä kehitämme teknologisia työkaluja kielenoppimisen tutkimukseen, Räsänen kertoo.
Tutkimusryhmän kehittämien mallien ja työkalujen avulla voidaan analysoida automaattisesti suuria ääniaineistoja lasten kotiympäristöistä. Aineistojen keruussa käytetään lasten päälle puettavia mikrofoneja.
– Meillä on analysoitavia ääniaineistoja tuhansia tunteja. Ne sisältävät kaiken, mitä lapsi kuulee ääniympäristössään, Räsänen sanoo.
Tutkimusryhmän käyttämät menetelmät perustuvat signaalinkäsittelyyn ja koneoppimiseen. Menetelmät soveltuvat sekä puheen määrän että laadun arviointiin. Niiden avulla voidaan analysoida esimerkiksi sitä, paljonko lapsi kuulee puhetta eri vanhemmilta ja puhutaanko lapselle suoraan vai kuuleeko hän vain vanhempien välisiä keskusteluja.
– Tutkimuksessamme on syntynyt muun muassa teoria sille, miksi lapsille suunnattu puhe, ’infant directed speech’, kiinnittää lapsen tarkkaavaisuuden normaalia puhetapaa voimakkaammin tai miten lausepaino ylipäätään vaikuttaa kuullun puheen prosessointiin ja kuulijan tarkkaavaisuuteen myös aikuisilla, Räsänen selostaa.
Räsäsen mukaan teoria pohjautuu havaintoon siitä, että aistiärsykkeiden ennakoitavuus suuntaa tarkkaavaisuuden ohjautumista ympäristössämme. Lapselle suunnatun puheen rikas intonaatio vaikuttaa alustavien analyysien perusteella vaikeammin ennakoitavalta kuin tavallisen puheen intonaatio.
– Syntynyttä tietoa voidaan soveltaa tietokoneen tekemässä automaattisessa lausepainon analyysissä puheaineistoista ilman että kukaan opettaa koneelle erikseen esimerkkien avulla, miten lausepaino ilmenee puhutussa kielessä.
Räsäsen tutkimusryhmän työssä yhdistyvät insinööriosaaminen, psykologia ja kielitiede. Puhedataa prosessoivien laskennallisten mallien kehittäminen vaatii signaalinkäsittelyn ja koneoppimisen osaamista, kun taas tutkittavat ilmiöt keskittyvät ihmisen kognitiiviseen kehitykseen sekä kielen rakenteisiin ja kieleen ilmiönä.
Lähde: Tampereen Yliopisto