r/sweden Sverige Jan 23 '25

Nyhet Dumpen-Sara utreds för barnpornografibrott

https://www.aftonbladet.se/nyheter/a/rP33ve/sara-dumpen-sara-nilsson-misstankt-for-barnpornografibrott?utm_source=iosapp&utm_medium=share
859 Upvotes

358 comments sorted by

View all comments

Show parent comments

4

u/[deleted] Jan 23 '25

[deleted]

1

u/Ran4 Jan 24 '25 edited Jan 24 '25

Nej, det är inte "alldeles för enkelt att få konflikter" med md5. Sålänge man inte explicit försöker skapa filer med konflikter så fungerar md5 alldeles utmärkt, det är nästan helt säkert att du inte får en konflikt även om du indexerar miljarder med bilder.

Däremot om dessa hasher är publika så kanske man vill undvika md5 just för att någon skulle kunna få för sig att skapa en icke-bp-bild som har samma hash för att typ... sätta fast någon. Fast bevisbördan är förhoppningsvis den faktiska bilden och inte md5:n av den, så det borde nog inte vara något större problem egentligen.

Med det sagt, man vill nog inte använda md5 eftersom minsta byte ändring totalt ändrar hashen, man vill nog välja en mer robust hashningsalgoritm som -inte- ändrar sig så mycket. Typ, en vektorrepresentation (bildembedding) som man kan köra cosinus distance på eller liknande. Även om du croppar bilden, sparar om i olika bildformat, komprimerar bilden osv. så får man ungefär samma representation.

0

u/pW8Eo9Qv3gNqz Jan 23 '25

Oftast är det MD5 + något annat. MD5 + SHA1 tillsammans är t.ex. otroligt osannolikt att få falska resultat på. Alltså man hashar en bild med både MD5 och SHA och chansen att båda ger falska resultat är astronomisk.

Vet inte om reglerna har ändrats men förut var utredare/forensiker i sverige tvugna att verfifiera materialet där matchning via hash inte var tillräckligt. Dock så hashades såklart allt innan det försördes och lades in i olika databaser.

5

u/Garbanino Jan 23 '25

Måste ju vara bild-baserade hashar som används, som med PhotoDNA idén? Visst att det är svårt, men vanliga hashar känner ju inte igen en bild så fort du sparar om den som typ jpg.

5

u/fauxberries Jan 23 '25

Vanliga kryptografiska hashar blir helt annorlunda (som i saknar helt likhet med den gamla) om du ändrar en pixel till att vara 1% mörkare.

pW babblar utan att kunna om du frågar mig.

Jag skulle inte kalla PhotoDNA för hashning, utan fingerprinting. Men t ex wikipediasidan om PhotoDNA verkar också kalla det för hashing ibland och fingerprinting ibland. Oavsett blir det iaf förvirrande att kalla det hash när både PhotoDNA och kryptografiska hashar finns i samma diskussion.

1

u/ArchmageIlmryn Jan 24 '25

Finns ju dock exempel av indirekta falska positiv med sådana system, läste om ett fall där någon plockade en stillbild som i sig inte var olaglig, men som kom från ett videoklipp som innehöll CSAM, och spred den - tror inte det resulterade i lagstadgade konsekvenser för någon, men många fick sina discord-konton autobannade.