"Zoek de overeenkomst tussen deze recente nieuwskoppen: Trump bereidt VS voor op ‘waarschijnlijk meer’ Amerikaanse doden. Zorgwekkend megalek bij Odido leidt waarschijnlijk niet direct tot meer fraude. Denzel Washington waarschijnlijk niet de enige gevierde veteraan in Black Panther 3. Deze uitgefikte Ferrari 360 is waarschijnlijk aangestoken." [DPG]
https://www.volkskrant.nl/wetenschap/als-iets-waarschijnlijk-gaat-gebeuren-hoe-schatten-mensen-en-taalmodellen-dan-de-kans-in~bb8e549f/
Als iets ‘waarschijnlijk’ gaat gebeuren, hoe schatten mensen (en taalmodellen) dan de kans in?

de Volkskrant
Met dank aan @casperalbers.nl en Sanne Willems waarmee ik onderzoek deed naar hoe mensen woorden als waarschijnlijk interpreteren.
https://jcom.sissa.it/article/pubid/JCOM_1902_2020_A03/
‘Probably’ doesn’t mean the same thing to your AI as it does to you

Humans and AIs have different methods of calculating words about probability like ‘maybe’ and ‘likely’ – and different interpretations about what they mean.

The Conversation
@ionica @stereo Ja, duh, LLM's kunnen helemaal niet denken, ze produceren gewoon tekst, zonder enige gedachte, zonder kennis of weten. Er is dus niets dat woorden kan wegen. En het is wel ontzettend dom als je artikelen schrijft waarin het lijkt alsof LLM's wel kunnen denken maar anders dan mensen..
@ionica @casperalbers.nl
Waar zou 'risico' in dit plaatje passen? Het is 'kans' maar dan met een negatieve connotatie.
@apenkop
Risico is een substantief en als zodanig kwantificeerbaar.
@ionica @[email protected]
@apenkop
Ik zie dan ook naast "kans" verder "grote kans" en "kleine kans" opgenomen staan. Dat zijn natuurlijk verre van de enige mogelijke kwantificeringen.
@ionica
@Eetschrijver In het wetenschappelijk artikel geven we een uitgebreide beschrijving van hoe we de gebruikte woorden kozen (o.a. op basis van eerdere studies en Nederlandse nieuwskoppen).
@Eetschrijver @apenkop @ionica
Risico is eigenlijk kans vermenigvuldigd met gevolg.
Kleine kans x ernstig gevolg is toch een behoorlijk risico.
Als je ziet te kijken een rustig fietspad oversteekt is er een kleine kans dat je geraakt wordt door een fietser.
Als je zonder te kijken een spoorweg oversteekt is de kans dat je door een trein geraakt wordt meestal kleiner, maar het risico van die actie is veel groter.
@apenkop Goede vraag, risico wordt vaak gedefinieerd als de combinatie tussen de kans maal gevolgen, past hier niet helemaal in, maar zit wel in andere onderzoeken!
@ionica @casperalbers.nl Mooi die twijfel over twijfelachtig.
@ionica @casperalbers.nl wat cool! Mijn afstudeeronderzoek in 1994 was iets soortgelijks, maar dan naar het woord "hoewel" (en ofschoon), of beter gezegd, naar de verwachtingen die het woord bij een lezer oproept.
@jasmijn02 @ionica @casperalbers.nl hier thuis wel eens een discussie gehad over ‘zo’ (en ‘straks’). Leuke onderzoeken!
@moniquevv @ionica @casperalbers.nl vind ik ook! Al moet ik wel bekennen dat ik meer dan eens geridiculiseerd ben als ik vertelde dat mijn doctoraalscriptie over 1 woord ging. De meeste mensen vonden dat van een onbegrijpelijke absurditeit. Ik heb even gezocht en zie nu dat hij via de site van Tilburg University nog in te zien is ook, voor de liefhebber ;)
@jasmijn02 Een van mijn beste vriendinnen is afgestudeerd op het woord 'leuk'!
@jasmijn02 @ionica @casperalbers.nl ik vind dat juist weer heel interessant.
@moniquevv @jasmijn02 @ionica @casperalbers.nl Als mijn kinderen zeggen dat ze 'bijna' klaar zijn is mijn vraag altijd 'wat is bijna?' Want dat blijkt alles te kunnen zijn, van 'ik moet nog beginnen' tot 'over 1 seconde ben ik klaar'.

@isisevrinen @moniquevv @jasmijn02 @ionica @casperalbers.nl

Ik gebruik mn hele leven met heel veel plezier 'laatst' voor een verleden tijd.
In de praktijk is dat voor eergisteren en nog geen jaar geleden (ongeveer).
😅

@vosje62 @isisevrinen @moniquevv @ionica @casperalbers.nl hier in sommige delen van Brabant gebruiken we soms "straks" om te verwijzen naar iets in de verleden tijd?! Echt raar.
@jasmijn02 ik ken ‘te straks’ als iets dat eerder is gebeurd. Alleen als Westlands spreektaal. @vosje62 @isisevrinen @ionica @casperalbers.nl
@moniquevv Ik ken het als "daarstraks was ik..." @jasmijn02 @vosje62 @isisevrinen @ionica @casperalbers.nl
@rinske @moniquevv @jasmijn02 @vosje62 @isisevrinen @ionica @casperalbers.nl Ja, daarstraks (geen idee of er een spatie in hoort) kan ik ook als verwijzing naar de verleden tijd. (Gelderland)
@Kaa @rinske @moniquevv @jasmijn02 @vosje62 @isisevrinen @ionica @casperalbers.nl
Ik hoorde vroeger in Zuid Limburg wel eens 'toenstraks' ook als verwijzing naar de verleden tijd.
@rinske daar zal het vandaan komen. In het westlands (weslands) worden nogal wat letters overgeslagen of niet uitgesproken. @jasmijn02 @vosje62 @isisevrinen @ionica @casperalbers.nl
@isisevrinen die discussie over ‘zo’ was destijds met mijn pubers. Mijn ‘zo’ duidelijk iets anders dan hun ‘zo’ :) @jasmijn02 @ionica @casperalbers.nl
@isisevrinen @moniquevv @jasmijn02 @ionica @casperalbers.nl Die twee sluiten elkaar niet uit he 😀. Maar verder wel herkenbaar. Bij ons gaat het soms nog verder, en kan “ja, dat heb ik gedaan” ook betekenen “ik moet nog beginnen”. Maar dat is weer een ander probleem
@jasmijn02 @ionica @casperalbers.nl Dat is mijns inziens het woord dat het vaakst onterecht wordt gebruikt. Dan krijg je zinnen als 'hij moest zijn werk, hoewel hij daar geen zin in had'. Ja en? Dat ie geen zin heeft maakt niet dat hij niet kan gaan, het is geen tegenstelling tot 'hij gaat naar zijn werk'.
@isisevrinen @ionica @casperalbers.nl nou ja, het woord "hoewel" blijkt dus, althans in de teksten die ik onderzocht heb (een verzameling artikelen uit de Volkskrant), op verschillende manieren gebruikt te worden. Bijvoorbeeld een "ontkenning van een verwachting": "Hoewel het geregend heeft, zijn de straten droog" of een "concessieve oppositie": "Hoewel ik heel erg van zwart houd, houd ik ook van wit".
Dat is iig wat ik me nog herinner van 32 jaar geleden 😂
@ionica @casperalbers.nl Cool! Dus welke woorden kan ik het best gebruiken als ik zo duidelijk mogelijk wil communiceren met zoveel mogelijk mensen?
@jeroen94704 @casperalbers.nl Helaas is er niet één manier die voor iedereen werkt. Woorden plus getallen is het advies nu (en plaatjes kunnen ook helpen.)
@ionica @casperalbers.nl Nee, maar ik kan me voorstellen dat als ik iets will beschrijven dat ~50% zit dat "mogelijk" een betere keus is dan "misschien", omdat de spreiding kleiner is. Ofziets.

@ionica @casperalbers.nl Wat waanzinnig gaaf! En handig!

Het doet mij een beetje denken aan het werk dat Ruut Veenhoven deed met zijn 'scale interval recorder' om oordelen over geluk in verschillende landen / talen te onderzoeken. Ander onderwerp en context, maar het raakt hier wel aan.

Al is dit voor mij veel handiger 🙂.

@ionica @casperalbers.nl Zoals jullie in de paper zelf ook opmerken is er een opvallende bult bij 50% bij veel "mogelijk"-achtige termen. Anders dan "ffty-fifty" / "half-om-half" en "kop of munt" ken ik in het Nederlands eigenlijk niets dat goed een kans van 50% aangeeft.

Zíjn er gewoon weinig dingen die "fifty-fifty" verdeeld zijn? Of is het gewoon niet interessant genoeg om over te praten als het 50/50 is? Of speelt er wat anders?

@RandySimons @ionica @casperalbers.nl ik vind het ook vooral opvallend dat we blijkbaar wel woorden hebben voor "50% of een beetje minder" maar niet voor "50% of een beetje meer"

@ionica @casperalbers.nl Die spreiding van de uiterste twee opties is echt waanzinnig.

Er zijn dus nogal wat mensen die bij 'altijd' niet denken 'altijd'. 🤷🏻‍♂️

@ionica @casperalbers.nl En 'onmogelijk' is dus ook niet per se 'onmogelijk'.