@malte Det er højt sat. De bedst chatbots er kun oppe på omkring 63% ift. simple regnestykker.
(ChatGPT-5 er kun på 49%)
kilde: ORCA benchmark
dupe@infosec.exchange
@dupe@infosec.exchange
Indlæg
-
Faldt over den her rammende beskrivelse af problemet med bullshit-generatorerne kaldet chatbots: De er lidt som en lommeregner der regner rigtigt 80% af tiden, så du alligevel må checke hver eneste udregning om den er korrekt. -
Det er velkendt her på gode #Mastodon at #meta er vanedannende.Tænk hvis man langsomt fjernede smartphones fra caféer og toge. ...lavede særlige områder hvor de var tilladte.

