Aarhus Universitets segl

Nyt forskningsprojekt kan være med til at forudsige successen bag litterære værker

I et nyt forskningsprojekt skal kunstig intelligens beriges med forskning inden for litteraturvidenskaben. Formålet er at give en bedre forståelse af litterær kvalitet og dermed skabe et mere kvalificeret system til at vurdere litterære værker til gavn for både forlæggere, forfattere, bibliotekarer samt forskere. Projektet er støttet af VELUX-Fonden med 5.343.544 kroner.

Professor Mads Rosendahl Thomsen
Lektor Kristoffer Laigaard Nielbo

Hvad nu hvis en forlægger kunne screene 200 manuskripter via et system, der kunne forudsige, hvorvidt der blandt teksterne var et værk, der havde en særlig litterær kvalitet med potentiale til at blive en succes?

Automatiserede vurderinger foregår allerede på en lang række områder, hvad enten det er til screening af jobansøgninger eller til vurdering af litteratur. Det er sådan set ikke til debat. Men spørgsmålet om hvem, der skal være med til at udvikle ressourcerne eller redskaberne til den automatisering, det er til gengæld en debat, to forskere fra Aarhus Universitet rigtig gerne vil deltage i.

”Når det gælder litteratur, så skal vi ikke overlade udviklingen af maskinlæring til ingeniørerne. Der har vi en vigtig opgave at få koblet forskere, der har århundredets forskningstradition i litteratur, på den udvikling, så vi får en mere kvalificeret teknologi bag en automatiseret vurdering, forklarer lektor Kristoffer Laigaard Nielbo fra Center for Humanities Computing Aarhus, der sammen med professor i litteraturhistorie Mads Rosendahl Thomsen står i spidsen for projektet Fabula-NET.

  Når det gælder litteratur, så skal vi ikke overlade udviklingen af maskinlæring til ingeniørerne.   

Forskningsgruppen er et interdisciplinært samarbejde mellem litteraturforskning, lingvistik og informatik, og de skal sammen udvikle nye modeller til automatiseret tekstklassifikation. Modellerne skal i sidste ende automatisk kunne klassificere tekster som høj/lav kvalitet og succesfuld/ikke succesfuld.  

Opskriften for et værks potentiale for succes

Forskerne arbejder med tre succesparametre for en tekst. Den intrinsiske succes, der ser på værkets indre struktur, da succesfulde fortællinger ofte er kendetegnet ved en særlig narrativ struktur. Det ekstrinsiske succesparameter, hvor systemet evaluerer et værk i forhold til, hvor ofte det bliver udlånt fra biblioteket, og hvor gode anmeldelser det får. Det sidste parameter kalder forskerne for den præferentielle succes, der ser på, hvorvidt et værk har større succes hos unge eller ældre, eller om der er særlige præferencer hos målgruppen alt efter om de er fra land eller by.

”Vi træner så at sige et system ud fra de tre succesparametre. Det kalder man at træne dybe neurale netværk. Når systemet har fået nok data, når vi har fået hældt nok litteratur på, så kan vi bruge den algoritme og den model til at tage et nyt værk, som vi aldrig har set før, og så kan systemet forudsige, hvor succesfuldt det værk bliver inden for de tre succesparametre”, forklarer Kristoffer Laigaard Nielbo.

Teknologien skal gøres tilgængelig

Forskningsgruppen har fokus på, at teknologierne i sidste ende bliver gjort bredt tilgængelig, da anvendelsesmulighederne er omfattende.

”Som redaktør på et forlag kan du bruge systemet til effektivt at spotte de manuskripter, der fungerer og dermed kun bruge tid på at nurse de tekster, der har potentiale. En forfatter kan bruge systemet til at evaluere sin egen tekstskrivning og optimere det undervejs.  Biblioteker kan bruge det til bedre søgning og vurdering af tekster, mens forskere vil få en unik mulighed for at sammenligne store samlinger af tekster fra verdenslitteraturen på et højere niveau”, forklarer Mads Rosendahl Thomsen.

  Det er et unikt miljø i og omkring Aarhus, der gør det muligt at kunne bygge den slags samarbejder op, der går på tværs af discipliner og teknologier. 

Projektet bliver præsenteret til en konference den 27.-29. september, hvor ledende forskere inden for digitale litteraturstudier deltager, og hvor formålet er at få det digitale litteraturstudie til at vokse i miljøerne.

”Det at vi kan sætte fuld gas på projektet, betyder også, at vi kan være med til at levere nogle ting ud til vores samarbejdspartnere, så de kan være med til at teste og afprøve systemet. Så både bevillingen og konferencen kommer på et rigtig godt tidspunkt”, fortæller Mads Rosendahl Thomsen, og Kristoffer Laigaard Nielbo supplerer:

”Jeg tror, man skal være opmærksom på, at det er meget sjældent, at den form for samarbejde kan lade sig gøre. Det er et unikt miljø i og omkring Aarhus, der gør det muligt at kunne bygge den slags samarbejder op, der går på tværs af discipliner og teknologier, og som også gør, at man fra Aarhus relativt nemt kan gribe ud og få fat i samarbejdspartnere.” 


Kontakt

Professor Mads Rosendahl Thomsen
Mail:
madsrt@cc.au.dk
Mobil:
31141419

Lektor Kristoffer Laigaard Nielbo
Mail: kln@cas.au.dk
Mobil: 26832608


Læs mere:

VELUXFONDENs kernegruppeprogram støtter forskning inden for humaniora og nærmest beslægtede samfundsvidenskabelige områder. Programmet er udformet i dialog med universiteterne og kan kun ansøges ved invitation fra VELUX FONDEN via institutleder. Læs mere på: https://veluxfoundations.dk/da/kernegrupper

I alt 7 forskningsprojekter har modtaget støtte. Læs om de øvrige bevillingsmodtagere: 

Kærlighed og vrede. Syv humanvidenskabelige projekter sætter hverdagen i perspektiv