Skip to content
  • Hjem
  • Seneste
  • Etiketter
  • Populære
  • Verden
  • Bruger
  • Grupper
Temaer
  • Light
  • Brite
  • Cerulean
  • Cosmo
  • Flatly
  • Journal
  • Litera
  • Lumen
  • Lux
  • Materia
  • Minty
  • Morph
  • Pulse
  • Sandstone
  • Simplex
  • Sketchy
  • Spacelab
  • United
  • Yeti
  • Zephyr
  • Dark
  • Cyborg
  • Darkly
  • Quartz
  • Slate
  • Solar
  • Superhero
  • Vapor

  • Default (No Skin)
  • No Skin
Kollaps
FARVEL BIG TECH
  1. Forside
  2. Ikke-kategoriseret
  3. Jeg lytter til *Videnskabeligt Udfordret*, der på sin egen sjove måde gengiver et endnu ikke fagfællebedømt studie fra december 2025 om, hvordan nøje udvalgt træningsdata for #LLM kan etablere en form for "bagdør".

Jeg lytter til *Videnskabeligt Udfordret*, der på sin egen sjove måde gengiver et endnu ikke fagfællebedømt studie fra december 2025 om, hvordan nøje udvalgt træningsdata for #LLM kan etablere en form for "bagdør".

Planlagt Fastgjort Låst Flyttet Ikke-kategoriseret
llm
2 Indlæg 2 Posters 3 Visninger
  • Ældste til nyeste
  • Nyeste til ældste
  • Most Votes
Svar
  • Svar som emne
Login for at svare
Denne tråd er blevet slettet. Kun brugere med emne behandlings privilegier kan se den.
  • claugesen@expressional.socialC This user is from outside of this forum
    claugesen@expressional.socialC This user is from outside of this forum
    claugesen@expressional.social
    wrote sidst redigeret af
    #1

    Jeg lytter til *Videnskabeligt Udfordret*, der på sin egen sjove måde gengiver et endnu ikke fagfællebedømt studie fra december 2025 om, hvordan nøje udvalgt træningsdata for #LLM kan etablere en form for "bagdør". Dette sker ved at udnytte modellens evne til at ekstrapolere, så den kan handle uforudsigeligt på ellers tilsyneladende ligegyldige detaljer i brugerens prompt.

    De beskriver det som potentialet for en indlagt: "Execute Order 66” kommando, hvilket jo er et ekstremt eksempel, men endnu mere skræmmende vil være underliggende subtile skub der drejer samtalerne til højre.

    Studiet:
    https://arxiv.org/abs/2512.09742

    Promo site:
    https://weird-generalization.com

    Podcast:
    https://shows.acast.com/65ba62a1f83c2300169e5234/69f88cb88dd960ac61d87bac

    tanyakaroli@expressional.socialT 1 Reply Last reply
    0
    • claugesen@expressional.socialC claugesen@expressional.social

      Jeg lytter til *Videnskabeligt Udfordret*, der på sin egen sjove måde gengiver et endnu ikke fagfællebedømt studie fra december 2025 om, hvordan nøje udvalgt træningsdata for #LLM kan etablere en form for "bagdør". Dette sker ved at udnytte modellens evne til at ekstrapolere, så den kan handle uforudsigeligt på ellers tilsyneladende ligegyldige detaljer i brugerens prompt.

      De beskriver det som potentialet for en indlagt: "Execute Order 66” kommando, hvilket jo er et ekstremt eksempel, men endnu mere skræmmende vil være underliggende subtile skub der drejer samtalerne til højre.

      Studiet:
      https://arxiv.org/abs/2512.09742

      Promo site:
      https://weird-generalization.com

      Podcast:
      https://shows.acast.com/65ba62a1f83c2300169e5234/69f88cb88dd960ac61d87bac

      tanyakaroli@expressional.socialT This user is from outside of this forum
      tanyakaroli@expressional.socialT This user is from outside of this forum
      tanyakaroli@expressional.social
      wrote sidst redigeret af
      #2

      @claugesen tak for tip, den vil jeg også lytte til! (Det er vildt så mange måder der er at misbruge denne teknologi på - og alligevel drøner verden bare videre med AI-hype)

      1 Reply Last reply
      0
      Svar
      • Svar som emne
      Login for at svare
      • Ældste til nyeste
      • Nyeste til ældste
      • Most Votes


      • Log ind

      • Har du ikke en konto? Tilmeld

      • Login or register to search.
      Powered by NodeBB Contributors
      Graciously hosted by data.coop
      • First post
        Last post
      0
      • Hjem
      • Seneste
      • Etiketter
      • Populære
      • Verden
      • Bruger
      • Grupper