Smider du affald i det AI-økologiske kredsløb?
“Husk: alt hvad du kaster fra dig i naturen – det kan indgå i kredsløbet og forurene det!”
Sådan lød det, da jeg var barn. Før jeg vidste noget som helst om klima, lærte jeg nemlig om miljøet og forurening. For en skoledreng handlede forurening mest om hvad jeg smed fra mig på gaden eller når vi var en tur i skoven. Og om spildevand, som flød ud i havet og blev optaget af fisk og planter. Forurening og kredsløb var altså noget meget håndgribeligt.
Da jeg voksede op, opdagede jeg andre og mere komplekse kredsløb. Sprogets og ideernes, for eksempel. At vi inspirerer hinanden, når vi udtrykker os. At vi plagierer, hugger og efterligner. Det er et lige så gammelt fænomen som sproget.
AI gør tekst til en råvare
Men nu har de såkaldte generative AI’er som for eksempel ChatGPT forvandlet den proces til en industri.
Tidligere kunne vi falde over et godt et begreb, en lækker formulering eller et sprogligt billede og vælge at snuppe det – måske lidt modificeret. Og måske endda blev vi selv plaigieret af andre. Det var en manuel proces, hvor den som plagierede ofte selv birdrog med noget. Det er en proces som, i sin essens, er fundament for menneskets kulturskabelse.
I dag trækker AI’erne deres bundtrawl hen over internettet og tager alle ord og begreber med. Samler kloge betragntninger og evnesvage kommentarer helt ukritisk, blander dem og sprøjter ord ud på tube, i den anden ende.
Det som kommer ud af f.eks. ChatGPT er plagiater – men nu ikke af noget eller noget eller nogen bestemt. I stedet er al tekst som ChatGPT er bygget på, rørt sammen til en statistisk grød, baseret på høstet tekst.
ChatGPT er – og de siger OpenAI helt åbent selv – en autocomplete på stereoider, som forsøger at gætte på hvad det næste ord skal være, på baggrund af statistik.
Og det er faktisk der du kommer ind. For hver eneste gang du offentliggør noget, bliver du temmelig sikkert plagieret på et eller andet tidspunkt. Nemlig når ChatGPT sender sit trawl ud og høster ordsammensætninger næste gang.
Her bliver dine tekster klippet op i fragmenter og blandet sammen med andre ordpar, som kører igennem en algoritme, som bruger dem til at lære sproglig sandsynlighed, inden dine tekster spyttes ud igen. Tilbage står en algoritme, som har suget en smule syntax ud af det du skrev og nu kan optræde lidt mere menneskeligt.
Og som har glemt alt om dig og om dine tekster.
Men de er der – dine tekster. Som mikroskopiske aftryk på den algoritme, som nu producerer en tekst til en doven blogger, skoledreng eller forfatter, som går på ChatGPT for at presse nogle sætninger ud af tuben. Noget content, som kan skabe klik eller sælge en lampe eller konsulentydese.
Så du skal måske ikke længere kun tænke på naturens og klimaets kredsløb. Men også på at alt hvad du skriver på din blog, indgår i internettets store AI drevne tekstkredsløb og kan ende med at påvirke en andens lejlighedssang eller blogindlæg.
For hvad sker der så når nu vi alle begynder at offentligøre AI genererede tekster og AI derefter høster dem og begynder at bruge dem til at træne sig selv med i fremtiden?
Så får vi en AI, som genererer nye AI tekster, trænet på tidligere AI tekster. Det får mig til at tænke på dengang hvor man fik den geniale idé at bruge benmel fra slagtede køer til at fodre køer med. Og det gik jo skidegodt.
Ok, så slemt går det nok ikke. Men måske den kan påvirke den sproglige biodiversitet. På samme måde som vi i Danmark efterhånden kun har få fuglearter tilbage og de fleste insekter man møder enten er hvepse eller myg.
* Denne tekst er 100% menneskeskabt
* Fotoet af en ko med Bovine Spongiform Encephalopathy (populært kend som BSE/ kogalskab) er public domain fra Wikipedia