Matematik och juridik

av Göran Lambertz, den 4 augusti 2015

Olle Häggström, professor i matematisk statistik, riktar nya invändningar mot mina beräkningar av bevisvärde, se hans http://haggstrom.blogspot.se/2015/08/lambertz-laborerar-med-pseudokvantiteter.html angående mitt http://goranlambertz.se/book-correction/bevisvarderingen-i-siffror/. Jag har försökt kommentera på hans blogg men lyckas inte. Så jag gör det här i stället.

Tack för ditt arbete med detta Olle. Som du förstår gör jag inte anspråk på att min exercis med bevisvärdet ska vara på något sätt jämbördig med en exakt sannolikhetsberäkning. Vad jag vill göra är att på ett någorlunda rimligt sätt illustrera att bevisvärdet (en term som jag f.ö. definierar i min nya text, om än inte matematiskt) blir högre ju fler positiva bevis som finns. Detta kan ingen gärna bestrida, och frågan är om det kan illustreras i siffror och hur det i så fall ska ske. Jag välkomnar verkligen hjälp på den punkten. Jag är bara ute efter att göra detta öppet och hederligt, och kan det dessutom göras på ett mer korrekt sätt är jag bara glad. På något sätt måste man väl kunna visa i siffror att ett bevisvärde stiger och att det kan gå från att vara nästan noll till att vara nästan 100? Jag nöjer mig gärna med ett närmevärde, och det är alltså ett sådant jag nu har försökt hitta. [Notering i efterhand: Jag har efter denna korrespondens med Olle Häggström skrivit om bevisvärderingsavsnittet så att bevisvärdena inte längre adderas utan i stället multipliceras med hjälp av formeln P = 1 - (1-pa)(1-pb), där P är det samlade bevisvärdet för alla bevis som ingår i beräkningen och där pa och pb är bevisvärdet för varje enskilt bevis. Se nedan angående kravet, för att denna formel ska ge ett rättvisande resultat, att de ingående faktorerna måste vara oberoende av varandra.]

En annan sak gäller åsättandet av ett värde för ett visst bevis (det jag kallar bevisvärde). Visst, du har rätt i att jag höftar siffrorna. Det är jag också öppen med. Och något annat sätt finns väl inte när det gäller bevisning, även om man vid användande av en del teknisk bevisning kan komma mycket nära ett exakt värde, t.ex. noll eller 100. Men att man måste höfta betyder enligt min mening inte att man bör avstå från att försöka räkna. Det säger en hel del om man kan sätta en siffra på exempelvis det fallet att man har fem bevis som var för sig har ett mycket högt värde och jämföra det med den situationen att man bara har ett eller två bevis med ungefär detta värde. Och om alla kan acceptera den siffra man åsätter, t.ex. att den ligger mellan 95 och 100 och därför kanske kan ges ett närmevärde däremellan, har man kommit ganska långt. [Notering i efterhand: Olle Häggström har senare skickat mig ett kapitel ur sin kommande bok. Där finns bl.a. ett avsnitt om olika sätt att se på statistik och sannolikhetsberäkningar, och det framgår att ett "Bayesianskt" synsätt har vunnit insteg alltmer. Det går just ut på att det är tillåtet och rimligt att ibland uppskatta sannolikheter efter bästa förmåga. Det gäller även för situationer där det är omöjligt att göra någon ens rimligt exakt beräkning av sannolikheten.]

Du säger att jag ”ger ett bedrägligt intryck av precision”. Men nog måste väl ni matematiker kunna acceptera att man använder siffror ibland för att illustrera något annat än precision? Annars tar ni ju ifrån oss andra ett viktigt pedagogiskt hjälpmedel, siffran som illustration av ”mycket eller lite”, ett högt eller ett lågt värde. För min del avstår jag gärna från alla anspråk på precision, men jag vill kunna använda siffrorna för att illustrera det ungefärliga, för att kunna ge en bild. Om du kan och har tid, så hjälp mig gärna med det så småningom. Då gör du samtidigt rättsväsendet en stor tjänst. Det tjänar inte mycket till - i varje fall inte för oss i rättsväsendet - att ni matematiker säger ”så där kan man inte räkna” och sedan vänder ryggen till.

Det är självklart att det ofta är en väldig skillnad i bevisvärde mellan det ena beviset och det andra, och detta bör alltså enligt min mening kunna illustreras genom siffror på något sätt, t.ex. ”nära 100” om det rör sig om en omständighet som alla är beredda att acceptera som näst intill fullt bevis. Du säger att du med emfas vill fördöma det slags användande av matematik som jag ägnar mig åt. ”Matematik skall användas för att ge det slags precision som rent verbala resonemang inte klarar av”, skriver du. Men matematiken kan inte ha monopol på siffror. Då lämnar den vanliga människor i sticket och blir pedagogikens och den enkla förståelsens fiende.

OK, jag förstår att p i min formel ”1 - (1-p)(1-p), där p är sannolikheten för det enskilda beviset” i stället bör lyda ”1 - (1-p1)(1-p2), där p1 och p2 är sannolikheterna för två olika enskilda bevis”. Jag ska ändra på det. Men jag tror du missförstår formeln när du skriver att din ”bästa gissning rörande varifrån han fått sitt uttryck är att det handlar om teorin för så kallat oberoende händelser”. Det jag är ute efter är att hitta ett samlat värde på flera olika bevis som verkar i samma riktning. Ett fingeravtryck, ett vittne och platsen där en plånbok hittades talar t.ex. alla tre för att det är A som har stulit plånboken. Om vart och ett av bevisen kan åsättas ett värde - p1, p2 resp. p3 – borde det samlade värdet kunna anges. Man förstår ju att det samlade värdet är högre än värdet för det enskilda beviset, men hur mycket? Jag har med en annan matematiker kollat hur detta kan beräknas och fått beskedet att den angivna formeln fungerar.

Vad man gör med formeln är, som du naturligtvis ser men som jag ändå skriver för att alla kanske inte ser det, att man multiplicerar 1 minus den ena sannolikheten med 1 minus den andra för att på så sätt få ett värde på sannolikheten för att det förhållande som båda bevisen talar för inte föreligger. I fallet med den misstänkte tjuven A ger den högra delen av formeln (produkten av de tre 1-p) alltså ett värde på sannolikheten för att A är oskyldig trots att alla de tre befintliga bevisen talar för att A är skyldig. Och 1 minus detta sannolikhetsvärde bör då vara värdet på sannolikheten för att A är skyldig. Tänker jag fel här, är jag bara tacksam för att bli rättad. Ännu tacksammare är jag för ett besked om hur man i så fall ska räkna. [Notering i efterhand: Olle Häggström har rätt i att den formel jag använder gäller för oberoende händelser. Den blir därför inte helt rättvisande om de bevis vars värden multipliceras med varandra inte uppfyller oberoendekriteriet. Men formeln ger ett ganska gott närmevärde om bevisen är i huvudsak oberoende av varandra. Och så är fallet med de flesta bevisen i Quickmålen.]

Ytterligare ett exempel på hur formeln fungerar: Antag att Pelle säger att det var Lisa som tog boken och att Lasse och Olle säger samma sak. På grund av omständigheterna kring utpekandet kan man ge ett någorlunda skapligt närmevärde för sannolikheten, beträffande vart och ett av de tre vittnena, för att vittnet har rätt, att det alltså var Lisa som tog boken. Antag att denna sannolikhet är 0,9. Med formeln blir då sannolikheten för att alla tre har fel 0,1 x 0,1 x 0,1 = 0,001. Sannolikheten för att de har rätt är då enligt formeln 0,999 eller 99,9 %. [Notering i efterhand: Detta är ett bra exempel på att oberoendekriteriet är grundläggande för att formeln ska fungera. Den är naturligtvis inte alls rättvisande om de tre vittnena har talat med varandra innan de har avgett sin vittnesutsaga. Denna felkälla avsåg jag dock att eliminera genom uttrycket "På grund av omständigheterna vid utpekandet ..." vid sannolikhetsvärderingen för de enskilda vittnena.]

Slutligen skriver du att jag begår ett elementärt klavertramp i mina båda promemorior genom att för två händelser A och B förväxla P(A|B) med P(B|A). Och du skriver att jag tycks vilja göra gällande att ”sannolikheten för Quicks oskuld givet en viss bevisomständighet är detsamma som sannolikheten för denna bevisomständighet givet Quicks oskuld”. Men det är väl klart att jag inte gör gällande detta, det vore ju snurrigt. Varför skulle sannolikheten för oskuld givet t.ex. bevisomständigheten att hunden markerade på samma plats som Quick pekade vara densamma som sannolikheten för denna bevisomständighet (alltså att hunden markerade på samma ställe som Quick pekade) givet att Quick är oskyldig?

Vad jag försöker säga är i stället två saker. Den första är att sannolikheten för att flera osannolika händelser inträffar samtidigt (eller i anslutning till varandra) kan beräknas genom att de olika (låga) sannolikhetsvärdena multipliceras med varandra. Man räknar alltså på samma sätt som när man vill beräkna t.ex. sannolikheten för att man ska få exakt tre sexor när man slår ett slag med tre vanliga tärningar. Och den andra är att ”sannolikheten för oskuld” är ”1 minus sannolikheten för skuld”. Jag har alltså utgått från att man kan räkna på samma sätt som om det handlar om t.ex. straffar i fotboll. Om man vet att sannolikheten för mål är 0,9, vet man samtidigt att sannolikheten för att det inte blir mål är 0,1. På samma sätt vet man att sannolikheten för skuld är 1 minus sannolikheten för oskuld. Men rätta mig gärna även här, om jag har fel. Jag vill naturligtvis att mina beräkningar av sannolikheter beträffande hundsöken och kunskapstestet ska stämma. Jag är fullt medveten om att man kan se olika på sannolikheten för ett visst förhållande (t.ex. sannolikheten för att hundsökningarna var manipulerade), men vad vi nu talar om är själva beräkningen. Och där borde vi kunna vara överens.

Återigen, stort tack för det jobb och engagemang du lägger ner på detta!

Detta är ett extramaterial till boken Quickologi.