200 år gammel matematik
Søren Hauberg har derfor i sin forskning fundet de matematiske formler, der korrigerer for de fejl, der kan opstå i datasæt, når de komprimeres.
”I vores grundforskning har vi fundet en systematisk løsning til teoretisk at gå baglæns, så vi kan holde styr på, hvilke mønstre der har rod i virkeligheden, og hvilke der er opfundet af komprimeringen. Når vi kan adskille de to, kan vi som mennesker få en bedre forståelse af, hvordan den kunstige intelligens arbejder, men også sikre os, at den kunstige intelligens ikke lytter til falske mønstre.”
De matematiske formler, som Søren Hauberg og hans kolleger har trukket på, er ret gamle. De blev udviklet i det 18. århundrede til brug ved tegning af landkort.
”Når man forsøgte at tegne landkort, overførte man informationer fra en tredimensionel kugle til en todimensionel flade. Det skabte en del forvrængninger, der bl.a. betød, at størrelsesforholdene mellem landmasserne er forkerte, så f.eks. Grønland syner meget større end Afrika. Det er de matematiske formler, som korrigerer for disse forvrængninger, som vi kan udnytte i vores forskning af den sorte boks i kunstig intelligens,” siger Søren Hauberg.
Kan stoppe ChatGPT’s hallucinationer
Forskerne er nu kommet så langt, at de kan kigge ind i den sorte boks på de kunstige intelligens-modeller, der bruger komprimering af data.
”Det er typisk modeller, som bruges i forskningen, hvor forskere prøver at se, om der er et bagvedliggende mønster i de data, de arbejder med. Det er meget relevant i den videnskabelige arbejdsproces at kunne forhindre fejlkonklusioner,” siger Søren Hauberg.
Han uddyber, at deres arbejde endnu ikke kan korrigere for fejl, som opstår i kunstig intelligens som f.eks. ChatGPT. Men forskernes arbejde har potentiale til at nå dertil, fortæller han.
”Vi vil meget gerne kunne forklare, hvorfor en chatbot som f.eks. ChatGPT hallucinerer. Det kan vi ikke endnu, men måske om et par år,” siger professoren, der i starten af 2024 modtog en ny bevilling på 2 mio. EUR fra EU, der gør det muligt at fortsætte forskningen i black box.