Menu
Hoe forensische taalkunde tegen te gaan?

Hoe forensische taalkunde tegen te gaan?

Stylometrie is onze persoonlijke en unieke schrijfstijl. Het maakt niet uit wie je bent, je hebt een unieke, met vingerafdrukken en traceerbare schrijfstijl. Dit wordt al een tijdje begrepen en een tak van forensisch onderzoek is gebouwd op dit principe: forensische taalkunde. In dit veld wordt de specifieke naam voor forensische taalkunde toegepast op internetcriminaliteit "Writeprint" genoemd. Writeprint is primair bedoeld om de identificatie van de auteur via internet te bepalen door de tekst van een verdachte te vergelijken met een bekende verzameling schrijver-invariante (normaal geschreven) teksten, en zelfs zonder vergelijkingsteksten kan deze forensische techniek persoonlijke informatie over een auteur opleveren, zoals geslacht, leeftijd, en persoonlijkheid.

Waar let een tegenstander op bij het onderzoeken van uw schrijven?

  1. Lexicale kenmerken: analyse van woordkeuze.
  2. Syntactische kenmerken: analyse van schrijfstijl, zinsbouw, interpunctie en woordafbreking.
  3. Structurele kenmerken: analyse van de structuur en organisatie van het schrijven.
  4. Inhoudsspecifieke woorden: analyse van contextueel significant schrijven zoals acroniemen.
  5. Eigenzinnige kenmerken: analyse van grammaticale fouten, dit is de belangrijkste factor om te overwegen, omdat het een relatief hoge nauwkeurigheid biedt bij de identificatie van de auteur.

Voorbeelden:

Je zou kunnen denken dat dit niet iets is waar een tegenstander op let? Denk nog eens na! Er zijn meerdere gevallen geweest waarin tegenstanders, zoals wetshandhavers, Writeprint-technieken hebben gebruikt om mensen te vangen en te veroordelen. Hier zijn enkele voorbeelden:

  • De OxyMonster-zaak (https://arstechnica.com/tech-policy/2018/06/dark-web-vendor-oxymonster-turns-out-to-be-a-frenchman-with-luscious-beard/ [Archive.org]): Uit openbare gegevens bleek dat Vallerius (ook bekend als OxyMonster) Instagram- en Twitter-accounts heeft. Agenten vergeleken de schrijfstijl van "OxyMonster" op het Dream Market-forum in een senior moderatorrol met de schrijfstijl van Vallerius op zijn openbare Instagram- en Twitter-accounts. Agenten ontdekten veel overeenkomsten in het gebruik van woorden en interpunctie met het opnemen van het woord 'proost'; dubbele uitroeptekens; veelvuldig gebruik van aanhalingstekens; en intermitterende Franse post.

Gebruik niet dezelfde schrijfstijl voor uw gevoelige activiteiten als voor uw normale activiteiten. Let vooral goed op uw gebruik van veelvoorkomende zinnen en leestekens. Even terzijde: beperk de hoeveelheid referentiemateriaal die een tegenstander als vergelijkingstekst kan gebruiken, je wilt toch niet in de problemen komen door je politieke Twitter-post, of die Reddit-post die je jaren geleden hebt geplaatst?

  • Hier is nog een voorbeeld uit het boek American Kingpin, over hoe een DEA-agent de schrijfstijl van DPR (Dread Pirate Roberts a.k.a Ross Ulbricht, oprichter van de Silk Road Dark Market) vanuit een uniek perspectief onderzocht: Zo gebruikte Ross Ulbricht het woord "episch" veel, waaruit bleek dat hij waarschijnlijk jong was. Hij gebruikte ook emoji-smileys in zijn schrijven, hoewel hij nooit een koppelteken als neus gebruikte, maar ze schreef als ":)" in plaats van de ouderwetse ":-)". Maar het enige kenmerk van Ulbricht dat opviel, was dat in plaats van "ja" of "ja" te schrijven op de forums van de site, Ulbricht in plaats daarvan altijd "ja" typte.

Besteed aandacht aan de kleine dingen die kunnen kloppen. Als u mensen gewoonlijk met "ok" antwoordt, kunt u misschien proberen te antwoorden met "oké" voor uw gevoelige activiteiten. Gebruik NOOIT woorden of zinsdelen uit uw gevoelige activiteiten (zelfs als ze niet in een openbare post staan) voor normale doeleinden, en vice versa. Ross Ulbricht gebruikte "frosty" als de naam voor zijn Silk Road-servers en voor zijn YouTube-account, wat de wetshandhavers ervan hielp overtuigen dat Dread Pirate Roberts in feite Ross Ulbricht was.

Hoe u de inspanningen van uw tegenstander kunt tegengaan:

  1. Verminder de hoeveelheid vergelijkingstekst waarmee tegenstanders u kunnen vergelijken. Dit gaat gepaard met een kleine online footprint voor uw normale activiteiten.
  2. Gebruik een tekstverwerker (zoals LibreWriter) om eventuele grammaticale/spellingfouten die u regelmatig tegenkomt te herstellen.
  3. Verminder of verander de idiomen die u gebruikt tijdens het uitvoeren van gevoelige activiteiten.
  4. Begrijp hoe uw identiteit uw schrijfstijl beïnvloedt: is uw alias jonger? Ouder? Meer opgeleid? Of lager opgeleid? Als je identiteit ouder is, spreek dan misschien in een meer JRR Tolkien-stijl van schrijven.
  5. Besteed aandacht aan hoe uw jargon en spelling u kunnen identificeren. Als je uit het VK komt, zou je "wiskunde" moeten zeggen, maar als je uit de VS komt, zeg je "wiskunde". Het maakt niet uit hoe je 'wiskunde' zegt, het enige dat telt is dat het kan worden gebruikt om je te profileren. Dit geldt ook voor straattaal, aangezien veel regio's elk verschillende en zeer specifieke straattaal hebben. Je vraagt ​​niet iemand uit de VS om een ​​“rubber” en verwacht dat ze je een “gum” als voorbeeld geven.
  6. Let op je gebruik van emoticons en emoji's. In het vorige voorbeeld kon de DEA-agent een juiste aanname doen dat Ulbricht waarschijnlijk jong was omdat hij geen koppelteken gebruikte bij het maken van een smiley-emoticon.
  7. Besteed aandacht aan hoe u uw schrijven structureert. Gebruik je twee spaties na een periode? Gebruik je voortdurend haakjes in je schrijven? Gebruik je de Oxford-komma?
  8. Overweeg welke symbolen u in uw schrijven gebruikt. Gebruikt u €, £ of $? Gebruik je "dd-mm-jjjj" of "mm-dd-jjjj" voor datums? Gebruikt u "08:00 pm" of "20:00" voor tijd?

Wat verschillende taalkeuzes over jou kunnen zeggen:

Emoticons:

  1. Russen gebruiken bijvoorbeeld ")" in plaats van ":-)" of ":)" om een ​​smiley uit te drukken.
  2. Scandinaviërs gebruiken "=)" in plaats van ":-)" of ":)" voor een smiley.
  3. Jongere mensen gebruiken over het algemeen geen koppelteken in hun smileygezichten en gebruiken gewoon ":)".

Structurele eigenschappen:

  1. Twee spaties na een periode wekken de indruk dat je al behoorlijk ouder bent, want zo is typen geleerd aan mensen die leren typen met typemachines.
  2. In de VS schrijven mensen getallen uit met komma's tussen getallen links van het startnummer en met punten tussen getallen rechts van het startnummer. Dit in tegenstelling tot hoe mensen getallen opschrijven op de rest van de planeet.

US: 1,000.00$

Europa: 1.000,00€

Spelling van jargon en symbolen:

  1. Het is duidelijk dat mensen in verschillende landen verschillende slang gebruiken. Dit is nog meer uitgesproken wanneer je straattaal gebruikt dat op andere plaatsen niet zo bekend is, zoals iemand uit het VK die een "schoolhoofd" noemt, terwijl het in andere landen een "principaal" wordt genoemd.
  2. Spelling is een andere belangrijke factor die vergelijkbaar is met straattaal, behalve dat het moeilijker te controleren is. Als je wilt doen alsof je uit de VS komt, maar eigenlijk in Australië woont, hoef je maar één keer "kleur" als kleur te spellen om mensen te laten begrijpen dat er iets aan de hand is.
  3. Sommige mensen spellen woorden ook op een bepaalde manier die niet regionaal is, u kunt bijvoorbeeld "bijl" spellen als "bijl" of omgekeerd.
  4. Natuurlijk kunnen de symbolen die je op je toetsenbord gebruikt veel informatie weggeven, zoals £’s of $’s.

Technieken om schrijfafdrukken te voorkomen:

Hier zijn enkele technieken in volgorde van gebruik:

  • Spelling- en grammaticacontrole: dit helpt voorkomen dat vingerafdrukken worden genomen met behulp van uw spel- en grammaticafouten.
  • Offline met een tekstverwerker: gebruik een tekstverwerker zoals LibreWriter en gebruik de functies voor spelling- en grammaticacontrole om eventuele typfouten te herstellen.
  • Online met behulp van een online dienst: Als u geen tekstverwerker beschikbaar heeft of er geen wilt gebruiken, kunt u ook een online spelling- en grammaticacontrole gebruiken, zoals Grammarly (hiervoor is een e-mail en het aanmaken van een account vereist).

Vertaaltechniek:

Nadat ze klaar waren met spelling- en grammaticacorrecties. Gebruik een website of software zoals Google Translate (of voor een meer privacyvriendelijke versie,https://translate.metalune.xyz) om tussen verschillende talen te vertalen voordat u terugvertaalt naar uw oorspronkelijke taal. Deze vertalingen heen en weer zullen uw berichten veranderen en vingerafdrukken moeilijker maken.

Verklaring: Een studie gearchiveerd hier: https://web.archive.org/web/20181125133942/https://www.cs.drexel.edu/~sa499/papers/adversarial_stylometry.pdf Het lijkt erop dat de vertalingstechniek onvoldoende is om stylometrie te voorkomen. Deze stap kan nutteloos zijn.

Zoek en vervang:

Eindelijk, en optieel, wat zout toevoegen met opzet wat fouten toe te voegen aan je berichten.

Bepaal eerst een lijst met woorden die u vaak niet spelt, misschien de woorden "grammaticaal", "symbool" en "uitgesproken" (deze lijst zou meer woorden moeten bevatten). Gebruik hiervoor geen AutoCorrectie-optie voor automatisch vervangen, omdat dit kan corrigeren als het niet logisch is. Gebruik in plaats daarvan Zoeken en Vervangen en doe dit handmatig voor elk woord. Gebruik ook niet "Alles vervangen" en bekijk elke wijziging. Dit is slechts de eerste stap om verkeerde informatie te verstrekken tegen linguïstische vingerafdrukken.

Zoek vervolgens een lijst met woorden die u vaak gebruikt in uw schrijven. Laten we zeggen dat ik graag weeën gebruik als ik schrijf, misschien gebruik ik altijd woorden als: "kan niet", "niet", "zou niet", "zal niet" of "laten we". Nou, misschien ga je naar LibreWriter en gebruik je "Zoeken en vervangen" om alle samentrekkingen te vervangen door de volledige versies van de woorden ("kan niet" > "kan niet", "niet" > "niet doen", "zou niet moeten ” > “zou niet”, “zal niet” > “zal niet”, “laten we” > “laten we”). Dit kan een groot verschil maken in uw schrijven en een verschil maken in hoe mensen en vooral uw tegenstanders u zien. U kunt de meeste woorden veranderen om anders te zijn, u kunt bijvoorbeeld "groot" in "groot" veranderen. Zorg ervoor dat deze woorden passen bij uw identiteit.

Overweeg nu om uw woordkeuzes aan te passen aan een geografische locatie. Misschien woon je in de VS en wil je de indruk wekken dat je identiteit uit het VK komt. U kunt bijvoorbeeld gebruik maken van locatiegebonden spelling en lexicon. Dit is riskant en één fout kan het verraden.

Allereerst moet u beslissen waar u de indruk van uw locatie wilt geven. Hier is een voorbeeld om de indruk te wekken dat u uit de VS of het VK komt. Eerst moet je het een en ander begrijpen over waar je identiteit 'vandaan' is, doe niet alsof je uit het VK komt, maar heb er geen idee van, behalve dat het bestaat.

Nadat je een goede locatie hebt gevonden waar je identiteit vandaan komt, onderzoek je de verschillen in taal tussen de twee talen (in dit geval tussen Brits Engels en Amerikaans Engels). Dankzij internet is dit vrij eenvoudig, en je kunt Wikipedia-pagina's vinden die handig de regionale verschillen van een taal tussen twee landen benadrukken. Let op hoe bepaalde woorden worden gespeld (“meter” > “meter”) en welke woorden met elkaar worden uitgewisseld (“boot” > “trunk”). Nu je een lijst hebt met woorden die met elkaar kunnen worden uitgewisseld en een lijst met verschillende spellingen, gebruik je "Zoeken en vervangen" in je editor en verander je de woorden zoals "kleur" in "kleur", en "vrachtwagen" in "vrachtwagen". Nogmaals, gebruik geen AutoCorrectie-functie of "Alles vervangen", omdat sommige wijzigingen misschien niet logisch zijn. Bekijk elke voorgestelde wijziging. Als u bijvoorbeeld AutoCorrectie of "Alles vervangen" op het woord "opstarten" zou gebruiken om in "kofferbak" te veranderen, zou dit volkomen logisch zijn in de context van auto's. Maar het zou geen enkele zin hebben in de context van schoenen.

Laatste advies:

Begrijp dat je constant moet nadenken over wat je typt en hoe je typt terwijl je gevoelige activiteiten uitvoert.

Begrijp dat het veranderen van uw schrijfstijl voor dergelijke doeleinden uiteindelijk uw basisschrijfstijl kan veranderen, waardoor uw schrijven ironisch genoeg traceerbaar wordt over langere perioden.

Proeflees uzelf ten minste één keer nadat u klaar bent met het schrijven van iets om te controleren of u geen fouten hebt gemaakt in uw proces. Vertrouw (jezelf) maar verifieer toch.

Bron: The Hitchhiker’s Guide to Online Anonymity, geschreven door AnonyPla © CC BY-NC 4.0