AU

Videnskabelig logik


Den i Danmark relativt ukendte amerikanske fysiker Edwin Thompson Jaynes har givet et interessant forslag til, hvordan man generelt kan forstå videnskabelig logik ved hjælp af sandsynlighedsregning.


Af Christian F. Damgaard

De fleste vil nok være enige i at en vis form for logisk tænkning er en forudsætning for videnskabelig aktivitet. Men hvad er det for en logisk tænkning, man anvender i videnskab, og hvordan adskiller moderne kvantitativ, logisk tækning sig fra den kvalitative logik, som først blev formuleret af Aristoteles i det antikke Grækenland?

Et eksempel på Aristotelisk logik er den logiske syllogisme, som består af to præmisser og en konklusion: For eksempel a) hvis det regner, så er der skyer og b) det regner; heraf kan vi slutte, at der må være skyer. Denne form for logik leder dog sjældent til noget særlig interessant – i det konkrete tilfælde er udsagnet om, at der er skyer, hvis det regner, trivielt og ikke til meget nytte. I stedet vil det være mere interessant at kende sandsynligheden for, at det begynder at regne, hvis der er skyer, men her kan de kategoriske sætninger i den Aristoteliske logik ikke hjælpe os.

De fleste interessante naturvidenskabelige og samfundsfaglige udsagn involverer en vis grad af usikkerhed, og til at kvantificere og beskrive denne usikkerhed anvender vi begrebet sandsynlighed. Den amerikanske fysiker Edwin Thompson Jaynes (1922 – 1998) har vist, hvordan man kan generalisere den Aristoteliske logik til et kvantitativt logisk system ved hjælp af sandsynlighedsregning.

Først viser Janes, hvordan man kan udlede sandsynlighedsregning ud fra simple verbale udsagn om, hvad man bør kræve af et system, som kan regne med usikkerheder. Hvis man kræver, at systemet skal være konsistent og være i kvalitativ overensstemmelse med almindelig sund fornuft, samt at graden af sandsynlighed skal udtrykkes med et reelt tal, så vil man deraf kunne udlede produktreglen P(AB|C) = P(A|BC) P(B|C), hvilket igen er tilstrækkeligt til at udlede de matematiske sætninger i sandsynlighedsregning. Jaynes viser endvidere, at såkaldt Bayesiansk statistik er et matematisk konsistent værktøj til at kvantificere og kommunikere videnskabelige usikkerheder.

Videnskabelig logik

Bayesiansk statistik afviger fra den mest anvendte form for statistik (frekventist statistik), blandt andet ved at man specificerer sin usikkerhed om modeller og parametre, før man har indsamlet data, ved det man kalder en prior sandsynlighedsfordeling. For eksempel kender vi på forhånd nogenlunde fordelingen af hyppigheden af regnvejr i Danmark, uafhængig af om der er skyer eller ej. Denne specificering af ens forhåndsviden (prior viden) har den matematiske konsekvens, at alle resultater og test af hypoteser kan beskrives ved sandsynligheder eller sandsynlighedsfordelinger.


Ved hjælp af Bayesiansk statistik er det således muligt at beregne sandsynligheden for, at en hypo­tese er sand. Anvendelsen af Bayesiansk statistik i analysen af videnskabelige spørgsmål kan vi derfor kalde videnskabelig logik, forstået på den måde, at den logiske sammenhæng mellem to fænomener beskrives ved en sandsynlighed. For eksempel beskriver udtrykket P(regn|skyer) sandsynligheden for, at det begynder at regne givet, at der er skyer, og den sandsynlighed kan beregnes ud fra modeller og data om sammenhængen mellem skyer og regn. Den Aristoteliske logik er et specialtilfælde af den videnskabelige logik, som gælder i de tilfælde, hvor denne sandsynlighed enten er 1 (sand) eller 0 (falsk).

To ting er vigtige at fremhæve: En sandsynlighed er ikke noget, som findes i naturen, for eksempel indeholdt i en terning, men derimod kun noget som findes i vores bevidsthed til at beskrive vores usikkerhed om et givet fænomen, for eksempel om vi slår en sekser ved næste terningkast. Dernæst, at en logisk sammenhæng ikke betyder, at der nødvendigvis er en kausal sammenhæng (dette gælder også for de tilfælde, hvor vi kan anvende den Aristoteliske logik). Fænomener kan godt være korrelerede, uden at dette betyder, at de afhænger direkte af hinanden (eksempelvis antallet af solgte is og drukneulykker) eller at vi ved, hvilke af de logisk forbundne fænomener, som påvirker de andre. Derfor er den videnskabelige undersøgelse ikke tilendebragt ved en tilfredsstillende statistisk analyse af de logiske sammenhænge af et konkret problem. Formålet med en videnskabelig undersøgelse vil ofte være at forstå de relevante kausale sammenhænge, så man kan opnå en egentlig forståelse af fænomenet.

Laplace’s løsning

Hvis man har set 1000 forskellige (uafhængige) hvide svaner, hvad er så sandsynligheden for, at den næste svane, man ser, er hvid? Dette problem blev undersøgt af Pierre-Simon Laplace (1749 –1827), som var en af pionererne i udviklingen af Bayesiansk statistik (som med bedre ret burde kaldes Laplace statistik). Han fandt ved brug af en uniform prior sandsynlighedsfordeling, at p = (k + 1) / (k + 2), hvor k er antallet af observerede hvide svaner, hvilket giver p = 1001/1002 = 0,999.

Derfor virker den induktive metode

Ved at forstå videnskabelig logik som kvantificering af vores usikkerheder bliver det også muligt at forstå, hvordan forskning foregår i praksis. Man støder tit på det udsagn, at det ikke er tilladt at generalisere ud fra observationer (induktion) – selv om man har set et utal af hvide svaner, kan man ikke konkludere, at alle svaner er hvide. Filosoffen Karl Popper advokerede i forlængelse heraf for, at det videnskabelige arbejde burde ses som en kontinuerlig afprøvning og eventuel falsifikation af de for nuværende gældende hypoteser.

En sådan stadig afprøvning af den videnskabelig konsensus er selvfølgelig vigtig, men det er misvisende at opfatte videnskabeligt arbejde primært som en stadig stræben efter at falsificere hypoteser. Hovedparten af praktisk videnskabeligt arbejde består faktisk i at prøve at generalisere viden ud fra observationer eller eksperimenter ved hjælp af den induktive metode, for eksempel ved at fitte den bedste rette linje gennem nogle observationer.

Grunden til, at denne induktive metode rent faktisk virker, er, fordi vi ved, at vores postulerede generelle viden er forbundet med en vis usikkerhed; det er måske ikke alle svaner, som er hvide, men det er overvejende sandsynligt, at den næste svane, vi møder, er hvid (se boks). Ved at anvende videnskabelig logik kan vi således give den nyttige induktive videnskabelige metode et fast og kvantitativt fundament.

En bedre forståelse af Bayesiansk statistik og videnskabelig logik vil betyde, at vi får en bedre teoretisk forståelse for, hvorfor den induktive videnskabelige metode virker i praksis, og gøre os bedre til at beregne og kommunikere usikkerhederne af vores videnskabelige resultater. ♦