Koneoppimisen avulla voidaan havaita tekstistä epäsosiaalisen käyttäytymisen piirteitä

Väitös tietojenkäsittelytieteen alalta
Väittelijä: FM Myriam Douce Munezero
Aika ja paikka: 12.4.2017, 12.00, Louhela auditorio, Joensuun Tiedepuisto

Kirjoitustyyli ja käytetty sanasto kertovat kirjoittajan ajatuksista, tunnetiloista, mieltymyksistä ja käyttäytymisestä. Väitöskirjatutkimuksessaan ”Tunne- ja sanaperustaisten piirteiden hyödyntäminen epäsosiaalisen käyttäytymisen tunnistamiseksi käyttäjien luomasta sisällöstä” FM Myriam Munezero hyödyntää tätä kielellistä tietoa luomalla koneoppimismalleja, joiden avulla tunnistetaan tekstejä, jotka voivat potentiaalisesti johtaa kirjoittajan epäsosiaaliseen käyttäytymiseen. Munezeron tutkimuksessa epäsosiaalisella käyttäytymisellä tarkoitetaan mitä tahansa henkilöitä kohtaan suunnattua toimintaa, jonka tarkoituksena on vahingoittaminen, kuten esimerkiksi väkivalta ja terrorismi.

Munezeron tutkimuksessa osoitettiin, että yhdistämällä luonnollisen kielen käsittelyn menetelmiä tunnetilojen ja käyttäytymisen monitieteisen tutkimuksen tuloksiin, on mahdollista havaita epäsosiaalisen käyttämisen riskejä, ja täten luoda keinoja varhaiseen puuttumiseen.

Tutkimuksessa kehitettiin ratkaisuja, joiden avulla internetin keskustelufoorumeilta ja sosiaalisesta mediasta voidaan automaattisesti tai puoliautomaattisesti tunnistaa potentiaalisia epäsosiaalisen käyttäytymisen tapauksia. Näiden menetelmien avulla voidaan luoda ennakkovaroitusjärjestelmiä, jotka mahdollistavat uhkaaviin tapauksiin puuttumisen ennen suunniteltua väkivallantekoa.

Epäsosiaaliseen käyttäytymiseen liittyvää tutkimusta on tehty lähinnä psykologian, kasvatustieteen ja yhteiskuntatieteiden näkökulmista. Munezeron väitöskirjatutkimuksessa epäsosiaalista käyttäytymistä ja sen havaitsemista lähestytään luonnollisen kielen käsittelyn menetelmin.

Jotta epäsosiaalista käyttäytymistä voidaan tunnistaa automaattisesti, on määriteltävä, minkälainen käyttäytyminen luokitellaan epäsosiaaliseksi, sekä kuinka näitä käyttäytymistapoja voidaan tunnistaa teksteissä ilmenevien piirteiden avulla. Munezero lähestyi näitä kysymyksiä monitieteisellä tutkimustavalla, soveltamalla luonnollisen kielen käsittelyn menetelmiä sekä psykologian ja kognitiotieteen tutkimustietoa siitä, kuinka tietyt tunnetilat ja käyttäytymismallit ovat yhteydessä toisiinsa. Tunnistamalla luonnollisen kielen käsittelyn avulla viitteitä tunnetiloista, jotka liittyvät epäsosiaaliseen ja väkivaltaiseen käyttäytymiseen, kyetään luomaan koneoppimismalleja, joiden avulla ennustetaan mahdollista epäsosiaalista käyttäytymistä.

Väitöskirjatutkimuksessa selvitettiin kirjallisuuskatsauksen avulla epäsosiaalisen käyttäytymisen muotojen ja tunnetilojen yhteyttä. Hyödyntämällä tätä tietoa sekä kohdeteksteistä automaattisesti havaittuja tunnetiloja voidaan ennustaa epäsosiaalisen käyttäytymisen riskejä.

Koska sopivaa tutkimusaineistoa menetelmien kehittämiseen ja testaamiseen ei ollut olemassa, koostettiin tutkimuksessa eri lähteistä tekstikokoelma, joka sisältää esimerkkejä jotka liittyvät terrorismiin, itsemurhiin, väkivaltaan ja muuhun epäsosiaalisen käyttäytymiseen. Tutkimuksessa luotiin lisäksi kielellinen resurssi, jota voidaan hyödyntää tunnetilojen ilmausten automaattisessa tunnistamisessa teksteistä.

FM Myriam Douce Munezeron tietojenkäsittelytieteen alaan kuuluva väitöskirja Leveraging emotion and word-based features for antisocial behavior detection in user-generated content (Tunne- ja sanaperustaisten piirteiden hyödyntäminen epäsosiaalisen käyttäytymisen tunnistamiseksi käyttäjien luomasta sisällöstä) tarkastetaan Luonnontieteiden ja metsätieteiden tiedekunnassa. Vastaväittäjänä tilaisuudessa toimii professori Diana Inkpen Ottawan yliopistosta, ja kustoksena professori Markku Tukiainen, Itä-Suomen yliopisto.

Väittelijän painolaatuinen kuva on osoitteessa https://kuvapankki.uef.fi/A/UEF+kuvahakemisto/11170?encoding=UTF-8



Takaisin tämän vuoden artikkeleihin