Carnegie Mellon Universityssä koneoppiminen tapahtuu sosiaalisesti

Carnegie Mellonissa toimivassa Articulabissa haluttiin selvittää, miten robottiavustajat voisivat tehdä yhteistyötä ihmisten kanssa erilaisissa tehtävissä ja muodostaa näihin vuorovaikutussuhteita sen sijaan, että vain korvaisivat ihmisavustajien tekemän työn. Perehtyessään robottien ja ihmisten väliseen vuorovaikutukseen ja kehittäessään agenttiensa sosiaalista tietoisuutta he käyttivät Google Cloud Platformin Machine Learning Engineä.

Sosiaalisia taitoja tekoälylle

Kiinan Tianjinissa vuonna 2016 pidetyssä Annual Meeting of the New Champions ‑konferenssissa teki ensiesiintymisensä eräs huomattava uutuus: SARA (Socially Aware Robot Assistant eli sosiaalisesti tietoinen robottiavustaja), joka kykeni vuorovaikutukseen ihmisten kanssa aivan uudella tavalla. Sen sijaan, että olisi korvannut ihmisavustajan roolin tai käsitellyt ja jakanut tietoa persoonattomasti, SARA oli intuitiivinen, ystävällinen ja osallistuva. Se oli suunniteltu tekemään yhteistyötä ihmiskäyttäjien kanssa, tunnistamaan heidän kasvojenilmeensä ja reagoimaan niihin, oppimaan heidän mieltymyksensä sekä parantamaan suoritustaan tapaamiensa käyttäjien perusteella. Se oli myös suunniteltu oppimaan tiettyjä sosiaalisia vihjeitä, nyökyttämään päätään käyttäjän puhuessa ja ymmärtämään erilaisia intonaatioita.

Puoli vuotta myöhemmin, tammikuussa 2017, projekti esiteltiin Sveitsin Davosissa järjestetyssä Maailman talousfoorumissa. SARA oli ainoa Davosin kongressikeskuksessa esillä ollut demo, ja se toimi virtuaalisena avustajana esimerkiksi tarjoamalla osallistujille tietoja esitettävistä istunnoista, esittelemällä heitä muille merkittäville osallistujille ja suosittelemalla ruokapaikkoja.

Alun perin SARA toimi virtuaalisena avustajana, jolla oli selkeä käyttötarkoitus: tarjota apua konferensseissa ja olla vuorovaikutuksessa vieraiden kanssa. Se kykeni oppimaan maailman johtajien kiinnostuksen kohteet ja tavoitteet ja suosittelemaan näin istuntoja, joihin kyseinen henkilö haluaisi ehkä osallistua. SARA pystyi myös luomaan vuorovaikutussuhteen kuhunkin henkilöön keskustelemalla tämän kanssa ja oppimalla lisää tämän mieltymyksistä ja tavoitteista. Tällä tavalla se pystyi parantamaan suoritustaan myöhemmissä keskusteluissa tarjoamalla entistä räätälöidympää apua.

SARAn kehitti Carnegie Mellon Universitystä käsin toimiva pieni Articulab-tiimi, joka tutkii inhimillistä vuorovaikutusta sosiaalisissa ja kulttuurisissa konteksteissa tietoteknisten järjestelmien syötteenä. Näin inhimillistä vuorovaikutusta voidaan ymmärtää entistä paremmin. Kysymys on siitä, miten ihmiset kommunikoivat tekniikan kanssa ja miten tuota kommunikaatiota voidaan parantaa ajan myötä. Sosiaalisten vuorovaikutussuhteiden luominen on tässä keskeinen tekijä, aivan samoin kuin ihmisten välisessä vuorovaikutuksessakin. Articulab-tiimi onkin todennut SARAsta seuraavaa: ”SARA ei jätä huomiotta niitä sosiaalis-emotionaalisia vuorovaikutussuhteita, jotka tuovat yhteiskunnan jäsenet yhteen, vaan sen kyky kehittää yhteistyötaitojaan on niistä riippuvainen.”

"GCP nopeuttaa akateemista tekoälytutkimusta."

Yoichi Matsuyama, Language Technologies Instituten tutkijatohtori ja SARA-projektin johtaja

SARA kehitettiin Googlen työkalujen avulla

Articulabin johtajana toimii Justine Cassell, joka on myös tekniikan strategian ja vaikutuksen alan varadekaani Carnegie Mellon Universityn School of Computer Science ‑laitoksella. Muiden tutkimusprojektien työkalujen ja rahoituksen ansiosta Google Cloud Platform (GCP) oli tiimille tuttu jo ennen SARAa. ”Koska olimme käyttäneet TensorFlow'ta monissa koneoppimistehtävissä, oli luontevaa siirtyä käyttämään GCP:tä uusimmissa syväoppimisprojekteissamme”, kertoo SARA-projektia johtava Yoichi Matsuyama, joka toimii Language Technologies Institutessa tutkijatohtorina. ”Olemme myös käyttäneet useita Google-sovellusliittymiä, kuten Google Speech ‑sovellusliittymää (puheentunnistus) keskusteluagenteissamme ja Firebasea joukkoistetuissa tiedonkeruukehyksissämme.” GCP:n käyttö jatkuu SARAn käyttöalueiden ja sovellustapojen laajentuessa. ”Olemme edelleen käyttöönottovaiheessa”, hän toteaa ja jatkaa: ”GCP nopeuttaa akateemista tekoälytutkimusta.”

Matsuyama kertoo, että Compute Engine ja 4 x Nvidia Tesla K80 ‑grafiikkasuorittimen instanssit sekä TensorFlow ovat laboratoriossa kovassa käytössä. Tänä vuonna tiimillä on ollut työn alla sellaisia malleja kuin Syvävahvistusoppimiseen perustuva sosiaalinen järkeily tehtäväkonteksteissa sekä Sosiaalisesti ehdollistetun luonnollisen kielen luominen.

Matsuyama arvioi Maailman talousfoorumissa suoritettua esittelyä – eli ”SARA 1.0:aa” – seuraavasti: ”Nelipäiväisen kokouksen aikana yli 250 osallistujaa kokeili SARAa, joten kokonaisuutena esittely oli menestys. Pyrimme kuitenkin edelleen analysoimaan tuloksia: mikä toimii, mikä ei.” Hän jatkaa: ”Yksi tärkeä havainto on, että yhteisymmärrys, eli vuorovaikutussuhde, todella korreloi tehtävässä suoriutumisen kanssa, ja tässä tapauksessa se vaikutti suositusten hyväksymiseen. Kun yhteisymmärrys oli hyvää ja SARA onnistui muodostamaan suhteen käyttäjään, tämä hyväksyi SARAn antaman suosituksen todennäköisemmin. Tämä on toistaiseksi tärkein havainto, mutta jatkamme tietojen analysointia edelleen.”

Uusia aluevaltauksia – esimerkiksi koulutus

Vaikuttaa siltä, että SARAn työ on vasta alussa. Muut Articulabin ”sosiaalisen tietoisuuden omaavan tekoälyn” sovellukset ovat tähän asti keskittyneet koulutukseen. Niiden avulla on esimerkiksi tuettu julkisrahoitteisten, vähäresurssisten koulujen oppilaita, edistetty opiskelutovereiden keskinäistä yhteistyötä (minkä on todettu olevan ratkaisevan tärkeää oppimisen kannalta) sekä autettu toiminnallisesti hyvätasoisia autisti- ja Asperger-lapsia harjoittelemaan sosiaalisen vuorovaikutuksen taitoja, jotta nämä kykenisivät muodostamaan parempia suhteita ikätovereihinsa.

Human-Computer Interaction Instituten tohtorikoulutettava Michael Madaio, joka johtaa Vuorovaikutussuhteista tietoinen vertaistuutori ‑projektia (Rapport-Aware Peer Tutor, RAPT), mainitsee, että projektissa kerätyn ihmisten välistä vertaistuutorointia koskevan datan perustella ”yhteistyötä tekevien opiskelijoiden välinen yhteisymmärrys liittyy vahvasti opiskelijoiden tehtäväsitoutuneisuuteen, ongelmanratkaisuun ja viime kädessä oppimiseen.” Toisin sanoen sosiaalinen yhteistyö voi hyödyttää kaikkia.

Madaio huomauttaa tiimin kehittävän koulutussovelluksia sen pohjalta, millainen merkitys yhteisymmärrýksellä on oppimiselle, joten se haluaa työkalujensa tekevän muutakin kuin vain auttavan oppimisessa. ”Oppimisalustoja on jo olemassa”, hän toteaa, ”mutta koulutuksen tutkimus on osoittanut, että opiskelijat eivät ole koneita, jotka käsittelevät tietoa numeromuodossa. Sosiaalisella ympäristöllä on merkitystä. Oppimisen kannalta on tärkeää muodostaa suhteita muihin opiskelijoihin. Se on arvokasta myös, kun virtuaalisen opinto-ohjaajan on annettava palautetta: Jos sen pitää kertoa opiskelijalle, että tämä on väärässä, miten se tekee sen? Ehkä alkuun kannattaa olla kohtelias ja käyttää epäsuoria ilmauksia, pehmentää iskua. Ajan myötä voi kuitenkin kehittää vuorovaikutussuhdetta ja olla hieman suorempi – antaa tarkkaa palautetta, josta on opiskelijalle todellista hyötyä.”

Jos virtuaalinen opinto-ohjaaja onnistuu tehtävässään, kasvaa ”todennäköisyys, että opiskelija haluaa tulla uudelleenkin”, hän lisää. Tämä on tärkeää, kuten myös se, miten tehokkaasti opiskelijat osallistuvat. ”Kyse ei ole vain siitä, tulevatko opiskelijat uudelleen hakemaan apua, vaan siitä, miten he käyttäytyvät kohdatessaan virtuaalisen opinto-ohjaajan. Ovatko he tavallista avoimempia? Onko oppimistavoitteista ja ahdistuksenaiheista kertominen heille helpompaa kuin tavallisesti?” On luotava vuorovaikutussuhde, samanlainen kuin muutkin vuorovaikutussuhteet, ja se vaatii aikaa. Merkittävää kuitenkin on, kuten SARA on osoittanut, että tällainen vuorovaikutussuhde voi ylipäänsä syntyä.

Tähän asti reaktiot koulutussovelluksiin ovat olleet positiivisia. Madaio huomauttaa kuitenkin: ”Emme ole vielä ottaneet sovellusta käyttöön kouluissa. Tämän vuoden suunnitteluhaasteisiimme kuuluu selvittää, miten laajamittainen käyttöönotto tapahtuu.” Tiimi yrittää pohtia, millaisia tulevat käyttötavat mahdollisesti olisivat: voitaisiin esimerkiksi kehittää kotitehtävissä tukevia avustajia tai lukivaikeuksista kärsiville opiskelijoille suunnattuja lukutuutoreita.

Vaikka Carnegie Mellonissa ei ole suunniteltu virtuaalisen opinto-ohjausjärjestelmän käyttöönottoa, tiimi saattaa toteuttaa henkilökohtaisen avustajan, joka esimerkiksi auttaisi opiskelijoita löytämään tulevat luennot ja tarjoaisi tapahtumasuosituksia. Articulabin ehkä kunnianhimoisin tavoite on luoda SARAsta versio, joka voi työskennellä monilla toimialoilla kellon ympäri ja jokaisena viikonpäivänä pelkän nelipäiväisen konferenssin sijaan. Ajatus on haastava mutta innostava, ja se tarjoaa rajattomasti mahdollisuuksia.

"Kyse ei ole vain siitä, tulevatko opiskelijat hakemaan apua uudelleen, vaan siitä, miten he käyttäytyvät kohdatessaan virtuaalisen opinto-ohjaajan. Ovatko he tavallista avoimempia? Onko oppimistavoitteista ja ahdistuksenaiheista kertominen heille helpompaa kuin tavallisesti?"

Michael Madaio, Human-Computer Interaction Institute, tohtorikoulutettava

Organisaatioprofiili

Andrew Carnegie perusti Carnegie Technical Schools ‑oppilaitoksen vuonna 1900. Vuonna 1912 oppilaitoksen nimeksi vaihdettiin Carnegie Institute of Technology ja se alkoi tarjota nelivuotisia koulutusohjelmia. Yli viisikymmentä vuotta myöhemmin oppilaitos yhdistyi Mellon Institute of Industrial Researchin kanssa. Näin syntyi Carnegie Mellon University (CMU), Pennsylvanian Pittsburghissa sijaitseva yleinen tutkimusyliopisto, joka tunnetaan huipputason monitieteisistä koulutusohjelmistaan. Niissä ovat edustettuina esimerkiksi taidealat, kauppatiede, tietojenkäsittely, tekniikka, humanistiset alat, hallintotiede sekä luonnontieteet. CMU:ssa opiskelee lähes 14 000 opiskelijaa yli 100 maasta.

Käytetyt tuotteet

Kiitos tilauksesta!

Kerro meille enemmän kiinnostuksen kohteistasi.