Kunstig intelligens

200 år gammel matematik hjælper os til at forstå kunstig intelligens

Vi kan ikke altid forklare, hvad der foregår inde i en kunstig intelligens. De ukendte processer er skjulte i det, der kaldes for en black box. En professor på DTU har fundet 200 år gamle matematiske metoder, der kan hjælpe os med at se ind i den sorte boks.

 Matematik fra det 18. århundrede kan bruges til at gennemskue AI i dag. Fotoet er et arkivfoto og viser ikke den pågældende matematik. Foto: Colourbox
Black box repræsenterer jo et kontroltab. Der er situationer, hvor det kontroltab ikke er acceptabelt.
Professor Søren Hauberg DTU Compute

Hovedpude ned i gryden

Søren Hauberg har fundet matematiske metoder, der kan give os et kig ind i black box. Hans vej ind er at kigge på de mulige fejl, der kan opstå, når store datasæt komprimeres. Den kunstige intelligens er nemlig nødt til at komprimere data for at filtrere de informationer fra, som ikke er relevante.

”Data består ikke kun af de informationer, vi har brug for, men også af målefejl og andre irrelevante informationer, som vi kalder for støj. Al denne støj bliver fjernet gennem komprimering. Der sker med andre ord en form for filtrering af data, hvor skidt skilles fra kanel,” forklarer Søren Hauberg.

Men under komprimeringen kan der opstå uventede sammenhænge i data, som kan føre til, at den kunstige intelligens finder forkerte mønstre og derfor ender med at spytte et forkert resultat ud. Søren Hauberg forklarer miseren med en flytteanalogi:

”Forestil dig, at du skal flytte og pakker dit hus ned. For at udnytte flyttekasserne bedst muligt lægger du din hovedpude ned i en gryde. Hvis en person, der ikke ved, hvordan vi bor, skulle konkludere noget ud fra et kig i flyttekassen, så kan vedkommende tro, at vi har hovedpuder i køkkenet eller gryder i soveværelset. Men de to ting har intet med hinanden at gøre, og der er ikke nogen sammenhæng mellem dem. Det var bare smart at udføre nedpakningen sådan. Det samme gør sig gældende for komprimeringen af data. Der er mange måder, den kunstige intelligens kan komprimere data på. Og hvis teknologien derefter prøver at finde de bagvedliggende mønstre i det ’nedpakkede’ data, risikerer man, at der opstår fejlkonklusioner.”

Professor Søren Hauberg fra DTU Compute
Professor Søren Hauberg har i starten af 2024 modtaget yderligere 2 mio. EUR til at fortsætte sin forskning med at forklare black box-fænomenet i kunstig intelligens. Foto: Hanne Kokkegård

200 år gammel matematik

Søren Hauberg har derfor i sin forskning fundet de matematiske formler, der korrigerer for de fejl, der kan opstå i datasæt, når de komprimeres.

”I vores grundforskning har vi fundet en systematisk løsning til teoretisk at gå baglæns, så vi kan holde styr på, hvilke mønstre der har rod i virkeligheden, og hvilke der er opfundet af komprimeringen. Når vi kan adskille de to, kan vi som mennesker få en bedre forståelse af, hvordan den kunstige intelligens arbejder, men også sikre os, at den kunstige intelligens ikke lytter til falske mønstre.”

De matematiske formler, som Søren Hauberg og hans kolleger har trukket på, er ret gamle. De blev udviklet i det 18. århundrede til brug ved tegning af landkort.

”Når man forsøgte at tegne landkort, overførte man informationer fra en tredimensionel kugle til en todimensionel flade. Det skabte en del forvrængninger, der bl.a. betød, at størrelsesforholdene mellem landmasserne er forkerte, så f.eks. Grønland syner meget større end Afrika. Det er de matematiske formler, som korrigerer for disse forvrængninger, som vi kan udnytte i vores forskning af den sorte boks i kunstig intelligens,” siger Søren Hauberg.

Kan stoppe ChatGPT’s hallucinationer

Forskerne er nu kommet så langt, at de kan kigge ind i den sorte boks på de kunstige intelligens-modeller, der bruger komprimering af data.

”Det er typisk modeller, som bruges i forskningen, hvor forskere prøver at se, om der er et bagvedliggende mønster i de data, de arbejder med. Det er meget relevant i den videnskabelige arbejdsproces at kunne forhindre fejlkonklusioner,” siger Søren Hauberg.

Han uddyber, at deres arbejde endnu ikke kan korrigere for fejl, som opstår i kunstig intelligens som f.eks. ChatGPT. Men forskernes arbejde har potentiale til at nå dertil, fortæller han.

”Vi vil meget gerne kunne forklare, hvorfor en chatbot som f.eks. ChatGPT hallucinerer. Det kan vi ikke endnu, men måske om et par år,” siger professoren, der i starten af 2024 modtog en ny bevilling på 2 mio. EUR fra EU, der gør det muligt at fortsætte forskningen i black box.

Tema

Udviklingen af kunstig intelligens går utrolig hurtigt. Potentialet er enormt, og det er svært at se, hvor udviklingen ender.

Kunstig intelligens bygger på matematik og logik. Vi kender arbejdsprocesserne, men ved ikke altid, hvordan den kunstige intelligens kommer frem til en bestemt løsning. Derfor skal vi som forskere og samfund stille krav til anvendelse af teknologien, både i lovgivningen og moralsk.

På DTU har vi særligt fokus på det etiske aspekt af kommende AI-løsninger.

Læs mere på temasiden om kunstig intelligens.