Open AI har med lanseringen av ChatGPT satt i gang et språkmodell-kappløp i verden. Hva skjer med norsk språk og kultur i denne revolusjonerende utviklingen?
Nasjonalbiblioteket har digitalisert “alt” på norsk. Fra Aktuell Rapport til Akershus Amtstidende. Det gir Norge, sammenlignet med andre ikke-engelske land, et stort forsprang i arbeidet med å trene opp en egen språkmodell.
Og vi har allerede kommet langt i å bygge en “ChatGPToten”, en norsk språkmodell som forstår totning, trøndersk og vanlige talefeil på norsk.
Men én ting er å trene. Noe helt annet er daglig drift og vedlikehold av en språkmodell. For at en norsk språkmodell skal kunne brukes av f.eks en kommune i både undervisning og saksbehandling, må språkmodellen være tilgjengelig som infrastruktur, i hverdagen. Og her begynner de virkelige problemene.
Det kreves 100 ganger mer datakraft for å drifte og vedlikeholde en språkmodell enn å trene opp. Det vil koste enorme summer for det offentlige å stille med datakraft. Her snakker vi Nasjonal Transportplan-dimensjoner på investeringer, der den knappe KI-milliarden blir som en flau bagatell å regne.
Nasjonalbibliotekar Aslak Sira Myhre og IT-bransjen inviterer til en debatt om fremtiden til norsk språk og kultur, i lys av den raske utviklingen av språkmodeller.
Aktuelle spørsmål:
Er det “riktig og viktig” at vi satser på en norsk språkmodell?
Hva kan en “ChatGPToten” hjelpe en kommuneansatt med?
Nå forsker vi og bygger opp norske språkmodeller – hvem gjør dem tilgjengelig, vedlikeholder og drifter dem?
Bør vi heller slå oss sammen med andre nordgermanske språk for å lage en fellesgermansk språkmodell?