2019 oli kasvojen vuosi, entä 2020?

15. tammikuuta 2020

Jos jotakin, vuosi 2019 on ollut vuosi, jolloin kasvot ovat siirtyneet visuaalisen teknologian keskipisteeseen, sekä hyvässä että pahassa. Visuaaliselle kasvontunnistukselle kului kymmenen vuotta oppia ymmärtämään miten lukea kasvomme. Nyt sen toiminta alkaa olla jo vakioitu.

Kasvojentunnistus perustuu kolmeen komponenttiin: algoritmi, opetusalusta ja hakemisto.
 

  • Kasvojentunnistusalgoritmit ovat tänään todennäköisesti visuaalisen tunnistusteknologian kypsimmästä päästä. Tämä on seuraus siitä että niitä on tutkittu jo pitkään, eikä niiden tarvitse ottaa huomioon asiayhteyksiä kuvamateriaalissa, ja kasvot ovat periaatteessa melko helppo tunnistaa tänään, jos näin uskaltaa sanoa ketään kasvojentunnistuksen tutkijaa loukkaamatta. Nykypäivän algoritmeissa otetaan huomioon 80–500 datapistettä kasvoista (esim. silmien välinen etäisyys ja nenän leveys) yksilöllisen digitaalisen sormenjäljen luomiseksi.
     
  • Opetusalustassa on kuvia, joita on käytetty kouluttamalla algoritmi tunnistamaan henkilön. Mitä enemmän kuvia yhdestä henkilöstä löytyy, sitä paremmin algoritmi tunnistaa henkilön. Valtioilla tai yrityksillä, joilla on vahva asema datan käyttämiseen on siten käytössään myös täydellisin tietopooli ja opetusalusta sekä  eniten kuvadataa käytettävissään. 
     
  • Hakemisto mahdollistaa uuden kuvan analysoinnin, verrata sitä datapoolin tietokannan sisältöön ja hakea vastaavuuden. Tämä on todennäköisesti yksinkertaisin ja suoraviivaisin osa kasvojentunnistusprosessia.


Pian kasvomme ovat osana eri tietopooleja, pidämme siitä tai emme. Sitä tullaan käyttämään osittain poliisitoiminnassa, videovalvonnassa ja osittain markkinoinnissa. Joko niin tai näin, meillä on vähän tai ei mitään sanottavaa siihen, kuinka meitä seurataan ja miten tietoa käytetään.

Kasvosi kuuluvat meille, ainakin Kiinassa
 

Yleisin käyttö kasvojentunnistusteknologialle on valvonnan ja turvallisuuden osa-alueella, jossa sitä käytetään rikosten havaitsemiseen ja estämiseen. Kasvojentunnistuksen myötä poliisi tietää etukäteen kenen kanssa he joutuvat tekemisiin turvalliselta etäisyydeltä. Teknologia on ollut siellä myös näkyvin, koska se on samalla myös kiistanalaisin.

Kiina on vauhdilla noussut tekoälyn ja kasvojentunnistuksen mahtivaltioksi. Kiinasta tulee paljon jo valmista teknologiaa, jota he mielellään esittelevät koko maailmalle. 

Kiina on tavallaan länsimaita edellä kasvojentunnistuksen käyttämisessä syystä että kiinalaiset ovat tottuneet siihen, että heistä kerätään kuvia, sormenjälkiä ja muita henkilökohtaisia tietoja. Tämä ei Euroopassa ole samalla tavalla mahdollista ja on tietosuojan (GDPR) kannalta huomattavan paljon vaikeampi toteuttaa. Euroopassa väärinkäytöksiltä halutaan välttyä, ja toisaalta eri maiden oikeustaju ei puolla vapaata henkilöiden valvontaa. Yhdysvallat on tekemässä lakialoitteen, joka määrittelisi puitteet kasvojentunnistustekniikan käytölle niin viranomaisten kuin yritysten käyttämänä.

Kiinassa kameroiden tuottamaa kuvavirtaa valvomaan on valjastettu konenäkö ja tekoäly. Niiden avulla kuvista voidaan esimerkiksi tunnistaa ihmisiä tai luokitella kasvoja iän, etnisen ryhmän ja sukupuolen mukaan. Kameroita on Kiinassa aivan järkyttävä määrä. Seuraava askel, jossa kaikki kameroissa näkyvät kasvot pystytään yhdistämään henkilöllisyystodistukseen, on tulossa. 

On selvää, että näitä mahdollisuuksia voi jatkossa käyttää monella tavalla, ei ainoastaan etsimiseen. Jopa aurinkolasien kautta tapahtuva kasvojentunnistus on edennyt Kiinassa. Järjestelmä on osa Kiinan tavoitetta rakentaa digitaalinen valvontajärjestelmä, joka hyödyntäisi biometrisiä tietoja valokuvista ja iiriskuvista sormenjälkiin asti.

Kiinassa on kasvojentunnistuksessa laajemmat suunnitelmat, kun valtio haluaa tunnistaa kaikkia kansalaisia. Myös Kiinan poliisilaitoksessa asiakkaat tunnistautuvat näyttämällä kasvojaan henkilökortin sijasta. Sen jälkeen tekoäly tietää kuka asiakas on ja osaa räätälöidä palvelunsa juuri hänen tarpeisiinsa.

Kiinan kansalaisten Vaikak-tunnistamisjärjestelmää kehitetään rikollisuuden estämiseen, mutta sen mukana tulee myös riskejä. Tietokanta voi joutua hakkeroinnin tuloksena vääriin käsiin. Ja on myös mahdollista, että valtio käyttää seurantakykyjä toisinajattelijoita vastaan. George Orwellin ennustus “Big Brother is watching You” on jo toteutumassa. 

Kasvojentunnistus on ollut eturintamassa kaupallisten kuvantunnistukseen palveluiden tarjonnassa. Isot kansainväliset yritykset kuten Google, Amazon ja Microsoft tarjoavat tunnistuspalveluja, kuten myös monet pienemmät kasvojentunnistamisratkaisuiden toimijat. Kuten kaikkien muidenkin AI -tekoälysovellusten kanssa, valmistavat yritykset laittavat usein eettiset tavoitteet sivuun mahdollisten kaupallisten hyötyjen eduksi. Asiakkaalle tarjotaan useimmiten ratkaisu riippumatta siitä, ketä he ovat ja mihin käyttöön he aikovat sovellusta käyttää. Ainoa todellinen vaatimus toimitukselle on asiakkaan kyky maksaa.

Valtavasti positiivisia käyttöalueita


Tietenkin tunnistamiseen löytyy myös positiivisia asioita, kuten välitön henkilön tunnistaminen ja personointi. Rahoitusyhtiöt näkevät kasvojentunnistuksen tehokkaana, ainutlaatuisena tunnisteena tilien ja tapahtumien mahdollistamiseksi, ja puhelinvalmistajat käyttävät sitä tunnistaakseen puhelimen käyttäjän. Kasvojentunnistusta voidaan pian käyttää autoissa ja kodeissa, avainten vaihtamisessa ja henkilökohtaisten mukavuusasetusten käynnistämiseen.

Median toimitukselliset sovellukset käyttävät kasvojentunnistusta tunnistaakseen kuuluisuuksia, poliitikkoja ja muita julkkiksia. Kasvojentunnistus auttaa suurten ja myös pienempien media-arkistojen (digitaalisen aineiston hallinnan DAM) hakuprosesseja ja auttaa tehokkaampaan sisällön organisointiin. Kasvojentunnistusta käytetään monissa sosiaalisen median palveluissa ja kuvankäsittelyohjelmissa eri henkilöiden erottelemiseen ja ryhmittelemiseen sekä valokuvista että videoista.

Kasvojentunnistusmalli kuvapankissa tunnistaa kuvasta henkilön läsnäolon ja paikantaa kehyksellä kasvot visuaalisesti. Kun uusia kuvia lisätään esimerkiksi kuvapankkiin, tekee tekoäly, kun on tunnistanut ihmiskasvot, rajauksen pienen kehyksen muodossa. Näin saadaan helposti suodatettua henkilöt kuvista ja jatkossa tunnistettua. Vastaavalla tavalla voidaan esimerkiksi tunnistaa rekisterikilpiä kuvista, rajata kuvista kilvet, tunnistaa kilpien tunnisteet OCR-tekniikalla ja vertailla olemassa olevan tietokannan tietoihin.

Videotunnistus laajentaa tunteisiin
 

Suomalainen Valossa on neljän vuoden ikäinen yritys, jonka videotunnistus- ja sisältötunnistustekniikka pystyy tunnistamaan ihmiset, kohtaukset, narratiivin, äänet, avainsanat, logot, värit ja tunteet. Valossa tuo näkyvyyttä videosisältöön koneoppimisen (ML) ja keinoälyn ( AI) avulla.

Teknologiaa voidaan konfiguroida monin eri tavoin. Asiakkaat voivat esimerkiksi keskittyä toimintaan, tunteisiin tai avainvuoropuheluun. Samaa tekniikkaa voidaan käyttää urheiluklipeissä, ja algoritmi löytää kaikki hetket, joissa urheilijoiden kasvoissa on paljon tunteita. 

Ilmeiden, tunnetilojen ja mielentilojen tunnistus

Ilmeet ovat ihmisen kasvojen lihasten aikaansaamia tunteiden ilmauksia. Ilmeet ovat nonverbaalista viestintää ja yksi ihmisen tärkeimmistä sosiaalisen kommunikoinnin tavoista. Ihminen pystyy muodostamaan eri ilmeitä tahdonvaraisesti, mutta useimmat ilmeet syntyvät tahattomasti ja luonnostaan, sillä ne liittyvät suoraan tunteisiin. Joitakin ilmeitä on lähes mahdotonta peittää.

Kasvojentunnistusta voidaan käyttää yksinkertaisten perusilmeiden tunnistamiseen, millä pyritään yhdessä muun tekoälyn kanssa tunteiden tulkintaan. Tunnetilat, jotka tunnistetaan, ovat mm. viha, tyytyväisyys, inho, pelko, ilo, onnellisuus, suru, yllättynyt, kyllästynyt ja neutraali.

Tunteiden tulkitseminen ilmeistä on kuitenkin nykyisellään kehitysvaiheessa, eivätkä ilmeet ole välttämättä merkkejä aidoista tunteista. Ihmiset sen sijaan tunnistavat tietyt ilmeet kulttuuritaustastaan riippumatta. Tyypillinen helposti tunnistettava ilme on esimerkiksi viha. Toisaalta joitakin ilmeitä, kuten kauhua ja inhoa, voi olla vaikeaa erottaa toisistaan.

Mikroilme on hyvin lyhytkestoinen, vain sekunnin murto-osan kestävä kasvonilme. Mikroilmeet ovat tahdosta riippumattomia ja ne ilmentävät sellaisia tunteita, joita ihminen ei halua paljastaa. Mikroilmeitä on vaikea havaita keskustelutilanteessa, mutta niiden tunnistaminen helpottuu videokuvan ja tietokoneanalyysin avulla.

Hymyjentunnistus on kasvojentunnistukseen perustuva toiminto, joka poimii valokuvan tunnistaessaan hymyilevät kasvot. Myös ikä, sukupuoli ja kulttuuritaustoja voidaan jo tunnistaa, toki edelleen nekin välttävän tarkasti.

Kasvojentunnistus yleistyy vielä laajemmin vuonna 2020

Halu hallita, yhdistettynä tunnistamisen iloon, johtaa epäilemättä siihen, että kasvoistamme tehdään visuaalisen teknologian keskipiste. Palvelut auttavat ihmistä helpommin saavuttamaan haluamansa toiminnon, mutta samalla piilee uhka ihmisen päätäntävallan osalta. 

On ennenaikaista arvioida, miten paljon tapamme toimia tulee muuttumaan lähivuosina, mutta varmaa on, että kasvojentunnistus liittyy hyvin monen palvelun ydintoimintaan, vaikka emme itse sitä välttämättä tunnista. Kasvojentunnistuksesta tulee osa meidän kaikkien elämää. Seuraavat vuodet tulevat varmuudella  tämän osoittamaan. Mullistus on jo käynnissä. Näkymät kasvojentunnistukselle ja tietojen yhdistämiselle ovat kiistatta huimia.

Kasvomme auttavat meitä huomenna avaamaan ovet, ehdottamaan ruokia tai vaatteita ja samalla erottamaan hyvät kaverit pahasta. Kysymys kuuluu kuitenkin, kuka päättää kuka ja mikä on paha?

 

Blogi perustuu osittain myös Valossa, Imagga ja Melchersystemsin teksteihin.

Kirjoittaja Rolf Koppatz

Rolf on Communication Pro:n perustaja ja toimitusjohtaja, DAM konsultti, markkinoinnin sekä IT-alan ammattilainen 35 vuoden kokemuksella.

Sano hei, vaikka LinkedInissä.

www.communicationpro.com