Miksi metadata on niin tärkeä aineistonhallinnassa?

keskiviikko 7. elokuuta 2024

word cloud - metadata

Mitä ovat metadatat eli metatiedot ja mitä ne sisältävät?
Kun haet esimerkiksi kuvaa netistä, sovellus/palvelu löytää sinulle juuri sopivan kuvan omien kriteerisi mukaisesti, siksi, että kuvatiedoston kylkeen on täytetty erilaisia hakukriteereitä metatietona arkistoinnin yhteydessä. Hyvin täytetyt metatietokentät jotka selostavat kuvan sisältöä ovat edellytyksenä sille, että aineistot löytyvät kuvapankista helposti.

Metatieto on laajemmin määriteltynä tietoa tiedostosta tai tiedoston sisällöstä.

Metatiedoista saatavat hyödyt korostuvat visuaalisten tiedostojen käytössä. Käyttäjä voi hyödyntämällä metatietoa ensin saada yleiskuvan haettavasta aineistosta, tämän jälkeen tarkentaa ja suodattaa aineistoa ja vasta metatietopohjaisen hakuvaiheen jälkeen syventyä löydetyn tiedoston tai tiedoston sisällön yksityiskohtiin. Raskaita originaalitiedostoja käsitellään vasta oikeiden tiedostojen löytämisen jälkeen.

Metatiedon tiedostokoko on paljon pienempi ja kevyempi kuin alkuperäistiedoston ja näin ollen sitä on helppo käyttää ja selailu on nopeaa.

Mitkä ovat yleisimmät metadatat?

Metadata on tietoa, joka kuvaa ja kontekstualisoi digitaalista aineistoa DAM-järjestelmissä. Se voi sisältää tietoja kuten tekijänoikeudet, luojat, resoluutio, hakusanat ja tiedoston koko. Metadata auttaa organisoimaan, hallinnoimaan ja löytämään digitaalisia varoja tehokkaammin

Metadata parantaa aineistonhallinnan tehokkuutta tarjoamalla tarkat ja johdonmukaiset tiedot digitaalisesta aineistosta, mikä tekee tiedostojen järjestämisen, haun ja jakamisen nopeaksi ja vaivattomaksi. Metatietoja voi olla monia erilaisia ja ne voidaan jakaa eri ryhmiin esimerkiksi seuraavasti:

Tekniset metadata tiedot

Tekniset metatiedot voidaan automaattisesti hyödyntää digitaalisessa aineistonhallintasovelluksessa, eli DAM-järjestelmässä. Ne ovat siis mukana tiedoston kylkiäisenä ja eri sovellukset pystyvät tunnistamaan ne automaattisesti. Useimpiin tiedostotyyppeihin sisältyy tiedoston nimi, koko, luontipäivä, muutospäivä, tiedoston luontiohjelmisto, toimittaja, alusta jne. Lisäksi eri tiedostotyypeillä on omat erityistietonsa.

Kuvat sisältävät mm seuraavia tietoja: tiedostomuoto, leveys, korkeus, resoluutio, bittiä per pikseli, väriavaruus, kompressiosuhde….
Dokumentit ja esitykset sisältävät eri tietoja: leveys, korkeus, sivumäärä, fontit, viitetiedostot…
Videoissa metatietoja ovat mm. kategoriat, kodekit, kesto, leveys, korkeus, bit rate, sampling rate/size, aliotsikot, kieli..

Selostava metadata

Metatietojen oleellinen osa on myös ns. selostava metadata, eli käyttäjien itsensä tallentamat metatiedot, jotka ovat erittäin hyödyllisiä tarkoissa hakutoiminnoissa. Alla listattuna esimerkkejä selostavista metatiedoista:

Selostavat termit
- otsikko, seloste, avainasanat, tagit, yhteenveto
- viittaukset todellisiin objekteihin, tuotteet, SKU:t

Ihmiset ja tapahtumat
- otsikko, aiheet, sijainti, tapahtumat, nimet
- valokuvaaja, tekijä, kirjoittaja, ohjaaja, tuottaja, esiintyjä, julkaisija

Oikeudet
- tekijänoikeusteksti, käyttöoikeus rajoitukset, yhteystiedot
- kohdeyleisö  

Metadataa liittyy yhtälailla työnkulkuihin ja prosesseihin

Työnkulun metatieto

Aineistonhallintaa ei voi toteuttaa ilman prosesseja jotka tekevät työnkuluista toimivia ja tehokkaita. Aineistonhallintasovellukseen kuuluu oleellisena osana työnkulkuun liittyvät metatiedot. Työnkulun metatiedot voivat olla joko ohjelmistohallittuja tai käyttäjien lisäämiä. Niitä hyödynnetään työn etenemisessä ja työn seuraamisessa. Esimerkkinä mainittakoon statustiedot hyväksymistyönkulussa jotka:

  • ilmaisevat seuraavan työvaiheen
  • ilmaisevat onko tiedosto valmis julkaistavaksi
  • ilmaisevat väreillä työnkulun statuksen

Jotta työnkulut toimivat hyvin ja kommunikoivasti on sovelluksen kommentointimahdollisuus oleellisen tärkeä. Se voi olla joko yleiskommentointi koko tiedostostosta, kommentoinnit määritellylle kuvan/videon alueelle/ajalle tai vaikkapa pelkkä luokitustaso tiedostolle.

Käyttötilastometatieto

Tehokkuuden mittaamisessa, eli miten sovelluksessa käytetään aineistoja, on arvokas tieto sekä tekijöille että päättäjille. Näitä tietoja saadaan automaattisesti tilastoitua julkaisu- ja aineistonhallintasovelluksesta. Tämä on hyödyllistä kun mitataan julkaistun tiedoston menestymistä tai tarpeettomuutta. Aineistojen julkaisemisessa tutkitaan kuka on ladannut minkä tiedoston ja mihin käyttötarkoitukseen, ja täyttääkö se tiedoston käyttöehdot esimerkiksi, siellä, missä tiedosto on julkaistu, kuten Facebookissa, Slidesharessa, YouTubessa.

Analytiikalla taas tutkitaan

  • kuka on katsonut videota ja kuinka pitkään
  • käyttäjän sijainti, alusta, laite
  • keskimääräinen bitrate, startuptime (käynnistysaika), virheet, dropped frames, verkon nopeus

Älä kuluta aikaa täyttämällä metatietoa jonka järjestelmä olisi voinut tallentaa itse automaattisesti!

  • Yhteenvetona eri metadataversioiden hyödyntämisessä on hyvä todeta, että suuri osa tiedoston metadatasta voidaan taltioida automaattisesti jo latausvaiheessa, tiedoston työstövaiheessa tai julkaistaessa tiedostoa, mikäli sovellus ja työnkulku on rakennettu järjestelmällisesti eri työprosesseja huomioiden.

    Osa metatiedoista, kuten selostava metatieto, on (edelleen) täytettävä käsin, jotta haut toimisivat tehokkaasti. Kannattaa miettiä tarkoin mitkä kentät kuuluu täyttää, tai jopa pakottaa käyttäjää täyttämään määrätyt kentät, jotta saadaan  paras hakutulos optimoitua pienellä työmäärällä. Tutustu meidän muissa artikkeleissa miten voimme auttaa metatiedon hallinnassa sekä yleensä aineistonhallintapalveluumme.

  • Metadata DAM:ssä on paljon enemmän kuin pelkkiä tiedostoja kuvailevia tietoja. Se on dynaaminen, elintärkeä osa digitaalista aineistonhallintaa, joka edistää organisaation tehokkuutta, innovaatiota ja yhteistyötä. Metadata ja DAM muodostavat tärkeän liiton, joka auttaa organisaatioita hallitsemaan ja hyödyntämään digitaalista omaisuuttaan entistä tehokkaammin.

    Hyvin suunniteltu ja toteutettu metadatan hallinta DAM:ssä on ratkaisevaa organisaation tehokkuuden kannalta. Se mahdollistaa nopeammat hakuajat, tarkemman sisällön löytämisen ja vähentää tarpeetonta työtä, kuten uudelleenluomista tai vanhentuneiden versioiden käyttöä.

  • Tutustu tuoko tekoäly ja kuvientunnistus apua avainsanoitukseen tästä.

    Kirjoittaja Rolf Koppatz

    Rolf on Communication Pro:n perustaja ja toimitusjohtaja, DAM konsultti, markkinoinnin sekä IT-alan ammattilainen 35 vuoden kokemuksella.

    Sano hei, vaikka LinkedInissä.

    www.communicationpro.com