Finna-koulutuskorpukset

Aineisto koostuu koneoppimisessa käytettäväksi tarkoitetuista TF-IDF-datamatriiseista. Matriisit on koostettu dokumenttikorpuksista, jotka perustuvat metadataan, joka on haettu Finna.fi palvelusta sen avoimen rajapinnan kautta vuonna 2019. Korpukset ovat suomen, ruotsin ja englannin kielillä.

Dataresurser

Mer information

Kollektion Öppna data
Administratör CSC
Administratörens e-post
  1. analytics@csc.fi
Länkar till mer information
  1. https://github.com/NatLibFi/Annif-corpora/tree/master/training/2019
Uppdateringsfrekvens
Senast redigerat 26.02.2021
Visa ändringslogg
Skapad på 24.02.2021