Euroopan unionin osarahoittama

AIDA

Tekoälyn avulla voidaan tarkastella, kuvailla, hakea ja hyödyntää digiarkistojen sisältämää tietoa uusin tavoin.

Tavoite

Tietojen automaattisen poiminnan edistäminen ja sisällöllisten merkitysten tunnistaminen

Kuvaus

Kasvavien aineistomäärien turvaaminen jälkipolville ja niiden hyödynnettävyyden varmistaminen vaatii uudenlaisia teknologisia ratkaisuja tuekseen ollakseen kestävää. Hyödyntäjäorganisaati oiden parissa on todettu olevan todellista tarvetta sekä tekstin että sen sisältämien merkitysten tunnistamisessa riittävän luotettavasti. Hankkeessa kehitetään digitaalisten aineistojen automaattista sisällönanalyysia tehostaen aineistojen kuvailua ja luoden loppukäyttäjille arvokkaita haku- ja yhdistelymahdollisuuksia ontologian ja tekoälyn avulla. Kun arkistoiduille aineistoille saadaan ontologiset tunnisteet, haut on mahdollista kohdentaa paremmin toivottuihin aineistosisältöihin ja hyödyntämispotentiaali kasvaa. Tämä avaa myös uusia mahdollisuuksia kansalaisyhteiskunnassa, liiketoiminnassa ja TKI-toiminnassa.

.

.

Perustiedot

Hankkeen nimi:

Tekoälyllä lisäarvoa digiarkistojen asiakkaille

Hankkeen kesto: 1.9.2023–31.8.2024

Tiedot

Hallinnoija: Xamk
Osatoteuttajat: Kansallisarkisto, Suomen Elinkeinoelämän keskusarkisto
Vahvuusala: Digitaalinen talous
Osaamiskärki: Digitaalinen tiedonhallinta ja arkistointi
Tutkimusyksikkö: Digitalia

Budjetti

Rahoittaja ja päärahoituslähde: Etelä-Savon maakuntaliitto, Euroopan aluekehitysrahasto
Kokonaisbudjetti: 382 636 euroa
EU:n osuus kokonaisbudjetista: 75%
Xamkin osuus kokonaisbudjetista: 166 978 euroa

Asiasanat

Loppuseminaari

Digitalia-AIDA-ilmottaudu

Jos tekoäly digiarkistoissa, tietojen helpompi löydettävyys tai uusimmat teknologiset kehitykset kiinnostavat, kannattaa vielä ennen lomia (tai vaikka lomienkin aikana) ilmoittautua ja merkitä kalenteriin valmiiksi Tekoälyllä lisäarvoa digiarkistojen asiakkailleen -hankkeen loppuseminaari.

Paikka: Median museo ja arkisto Merkki,  https://merkkiin.fi/arkisto/ & Teams (linkki toimitetaan ilmoittautuneille noin viikkoa ennen tapahtumaa.

Aika: Keskiviikko 28.8 klo 12.30 – 15.00

Alustavaa sisältöä:

  • Tämä hanke kokonaisuutena
  • OCR:n tehostaminen
    • Mihin annotointia tarvitaan tekoälyaikana (Elka / KA)
    • Paddle OCR moottorin jatkokouluttaminen annotoiduilla ja synteettisellä aineistolla (Xamk / KA)
    • Tehostetun Paddle OCR moottorin käyttöönottaminen (Xamk)
    • Testaajan / Testaajien kokemuksia tehostun OCR moottorin käyttämisestä
    • Jatkokehitysideoita ja keskustelua aiheesta
  • Fokusryhmähaastattelujen raportti ja yhteenveto (Xamk)
  • Memoriaalin, Arkkiivin ja tämän hankkeen tuloksien yhdistäminen ja hankejatkumo (Xamk)
  • Koneoppimista ja RAG hyödyntämistä (KA)

Tarkempaa sisältöä ja aikataulua päivitellään tälle sivulle luultavasti tuossa elokuun alkupuoliskon aikana.

Yhteistyökumppanit

Elka-logo jpg
Kansallisarkisto-logo