Suurin osa Turun ammattikorkeakoulun opinnäytetöistä on vapaasti luettavissa ammattikorkeakoulujen yhteisessä opinnäytetyötietokannassa, Theseuksessa (https://www.theseus.fi). Tähän aineistoon on kerätty metadataa vuosien 2017-2022 tieto- ja viestintätekniikan englanninkielisen koulutusohjelman julkaisuista. Metadata on kerätty pdf-muotoisista julkaistuista opinnäytetöistä. Datasetistä on jätetty pois kaikki työt, joiden metatadaa ei ole voitu lukea kokonaisuudessaan.
Kenttä supervisor id vastaa English-taught ICT degree program datasetin kenttää (=osa ohjaajista on samoja molemmissa dataseteissä)
Aineisto sisältää seuraavat kentät:
studyEntitlementDays - Opinto-oikeuden pituus päivinä
studyCredits - Opintopisteiden määrä valmistuessa
grade - Opinnäytetyön arvosana (1-5)
supervisorId - Valvojan ID (arvosanan kirjannut ohjaaja, ohjaajia voi olla 1-4)
pages - Sivumäärä
words - Sanamäärä
onlineReferences - Sähköisten lähteiden määrä
printedReferences - Painettujen lähteiden määrä
weakReferences - Heikkojen lähteiden määrä (wikipedia, reddit, blog, youtube)
keywordAppearances - Avainsanojen esiintymismäärä
keywords - Avainsanalista