Euroopan unionin osarahoittama

AIDA

Tekoälyn avulla voidaan tarkastella, kuvailla, hakea ja hyödyntää digiarkistojen sisältämää tietoa uusin tavoin.

Tavoite

Tietojen automaattisen poiminnan edistäminen ja sisällöllisten merkitysten tunnistaminen

Kuvaus

Kasvavien aineistomäärien turvaaminen jälkipolville ja niiden hyödynnettävyyden varmistaminen vaatii uudenlaisia teknologisia ratkaisuja tuekseen ollakseen kestävää. Hyödyntäjäorganisaati oiden parissa on todettu olevan todellista tarvetta sekä tekstin että sen sisältämien merkitysten tunnistamisessa riittävän luotettavasti. Hankkeessa kehitetään digitaalisten aineistojen automaattista sisällönanalyysia tehostaen aineistojen kuvailua ja luoden loppukäyttäjille arvokkaita haku- ja yhdistelymahdollisuuksia ontologian ja tekoälyn avulla. Kun arkistoiduille aineistoille saadaan ontologiset tunnisteet, haut on mahdollista kohdentaa paremmin toivottuihin aineistosisältöihin ja hyödyntämispotentiaali kasvaa. Tämä avaa myös uusia mahdollisuuksia kansalaisyhteiskunnassa, liiketoiminnassa ja TKI-toiminnassa.

.

.

Perustiedot

Hankkeen nimi:

Tekoälyllä lisäarvoa digiarkistojen asiakkaille

Hankkeen kesto: 1.9.2023–31.8.2024

Tiedot

Hallinnoija: Xamk
Osatoteuttajat: Kansallisarkisto, Suomen Elinkeinoelämän keskusarkisto
Vahvuusala: Digitaalinen talous
Osaamiskärki: Digitaalinen tiedonhallinta ja arkistointi
Tutkimusyksikkö: Digitalia

Budjetti

Rahoittaja ja päärahoituslähde: Etelä-Savon maakuntaliitto, Euroopan aluekehitysrahasto
Kokonaisbudjetti: 382 636 euroa
EU:n osuus kokonaisbudjetista: 75%
Xamkin osuus kokonaisbudjetista: 166 978 euroa

Asiasanat

Loppuseminaari

Digitalia-AIDA-ilmottaudu

Jos tekoäly digiarkistoissa, tietojen helpompi löydettävyys tai uusimmat teknologiset kehitykset kiinnostavat, kannattaa ilmoittautua ja merkitä kalenteriin valmiiksi Tekoälyllä lisäarvoa digiarkistojen asiakkailleen -hankkeen loppuseminaari.

Paikka: Median museo ja arkisto Merkki, Ludviginkatu 2-4  https://merkkiin.fi/ & Teams, linkki toimitetaan ilmoittautuneille viimeistään maanantaina 26.8

Huom! Arkistoon on oma sisäänkäynti Korkeavuorenkadun puolella, mutta tilaisuus on museon tiloissa. –> Eli sisäänkäynti siis Ludviginkadun puolelta.

Aika: Keskiviikko 28.8 klo 12.30 – 15.00

Alustavaa sisältöä:

  • Sisältö ja aikataulu:
  • 12.30 – 12.35      Tilaisuuden avaus, Xamk / Anssi Jääskeläinen (Kaikki AJ slidet)
  • 12.35 – 12:45      Avauspuheenvuoro, Musiikkiarkisto / Juha Henriksson (slidet)
  • 12.45 – 12.55      Tekoälyllä lisäarvoa digiarkistojen asiakkaille hanke, Xamk / Anssi Jääskeläinen
  • 12.55 – 13.55      OCR:n tehostaminen kokonaisuutena
    • 12.55 – 13.05      Mihin annotointia tarvitaan tekoälyaikana, Elka / Satu Soivanen (slidet)
    • 13.05 – 13.10      Miten annotointi toteutettiin, Kansallisarkisto / Sini Rajaniemi
    (Slidet)
    • 13.10 – 13.25      Paddle OCR moottorin jatkokouluttaminen annotoiduilla ja synteettisellä aineistolla, Kansallisarkisto / Atte Föhr & Xamk / Tuomo Räisänen
    (Slidet)
    • 13.25 – 13.35      Paddle OCR pilotit Xamk / Anssi Jääskeläinen
    • 13.35 – 13.45      Testaajan kokemuksia OCR pilotin käytöstä, Merkki / Johanna Mieto
    (Slidet) (lisämateriaali)
    • 13.45 – 14.10     Kahvitauko & Jatkokehitysideoita yhdessä keskustellen, Hanketiimi
      • Etäosallistujat voivat heitellä ideoita chattiin
  • 14.10 – 14.30      Fokusryhmähaastattelujen raportin yhteenveto ja reflektoiva keskustelu, Xamk / Mira Kolari & Musiikkiarkisto / Juha Henriksson (Slidet)
  • 14.30 – 14.40      Memoriaalin, Arkkiivin ja tämän hankkeen tuloksien yhdistäminen ja hankejatkumo, Xamk / Mira Kolari (Slidet)
  • 14.40 – 14.55      Koneoppimista ja RAG hyödyntämistä, Kansallisarkisto / Mikko Lipsanen (Slidet)
  • 14.55 – 15.00      Yhteenveto ja päätös, Xamk / Noora Talsi
  • Sisältö, aikataulu ja puhujat voivat vielä hieman muuttua ennen seminaaria.

Kysely tekoälyn hyödyntämisestä digiarkistoissa

Järjestimme kyselyn tekoälyn hyödyntämisestä digiarkistoissa. Kyselyllä pyrittiin selvittämään

  • digiarkistojen asiakkaiden toiveita ja tarpeita tekoälyn hyödyntämisestä
  • arkistoalan ammattilaisten toiveita ja tarpeita tekoälyn hyödyntämisestä toimialalla
  • vastaajien odotuksia ja asenteita tekoälyavusteisia palveluita kohtaan

Kysely keräsi yhteensä 26 vastausta. Tuloskooste julkaistaan myöhemmin. Kiitos kaikille vastaajille!

Tekoäly digiarkistoissa – online fokusryhmä

Järjestimme fokusryhmähaastattelun 22.1.2024, jossa selvitettiin arkistojen käyttäjien tarpeita tekoälyn hyödyntämisessä.

Verkkotilaisuuden aluksi kuultiin tuloksia tuoreesta kyselystä tekoälyn käyttömahdollisuuksista digiarkistoissa.

Kiitos keskusteluun osallistuneille!

Tapahtuman sivut

MEMORIAALI-PALVELUN ESITTELY

Järjestimme mahdollisuuden tutustua Memoriaali-verkkopalveluun.

Digitaalisten aineistojen vastaanottoon kehitettyyn Memoriaali-palveluun oli mahdollista tutustua hybriditapahtumassa 18.12. verkossa. Tilaisuus oli avoin ja suunnattu arkistotoimijoille.

Lisää tietoa tapahtumasta saat täältä: Memoriaali-palvelun esittely -tapahtuma

Yhteistyökumppanit

Elka-logo jpg
Kansallisarkisto-logo