Episode 154 - Sind LLMs auf Benchmark Daten manipuliert?

Knowledge Science - Alles über KI, ML und NLP

Sisällön tarjoaa Sigurd Schacht, Carsten Lanquillon, Sigurd Schacht, and Carsten Lanquillon. Sigurd Schacht, Carsten Lanquillon, Sigurd Schacht, and Carsten Lanquillon tai sen podcast-alustan kumppani lataa ja toimittaa kaiken podcast-sisällön, mukaan lukien jaksot, grafiikat ja podcast-kuvaukset. Jos uskot jonkun käyttävän tekijänoikeudella suojattua teostasi ilman lupaasi, voit seurata tässä https://fi.player.fm/legal kuvattua prosessia.

8M ago 36:40

MP3•Jakson koti

Send us a text

In der heutigen Sendung versuchen wir rauszufinden, ob man sich auf die öffentlichen Benchmarks zum Testen und Vergleichen von Sprachmodellen verlassen kann. Oder ob Benchmark Testdaten zum Trainieren verwendet werden. Hierbei handelt es sich um das Benchmark Leakage. Hören Sie rein.
Wir sprechen vor allem über das Paper: Benchmarking Benchmark Leakage in Large Language Models https://arxiv.org/abs/2404.18824

Support the show

208 jaksoa

#Technologie #Bildung #Sigurd Schacht, Carsten Lanquillon #Carsten Lanquillon #Sigurd Schacht #Wissenschaft #Künstliche Intelligenz

Episode 154 - Sind LLMs auf Benchmark Daten manipuliert?

Knowledge Science - Alles über KI, ML und NLP

12 subscribers

published 8M ago

Jaa

MP3•Jakson koti

Send us a text

Support the show

208 jaksoa

#Technologie #Bildung #Sigurd Schacht, Carsten Lanquillon #Carsten Lanquillon #Sigurd Schacht #Wissenschaft #Künstliche Intelligenz

Kaikki jaksot

Tervetuloa Player FM:n!

Player FM skannaa verkkoa löytääkseen korkealaatuisia podcasteja, joista voit nauttia juuri nyt. Se on paras podcast-sovellus ja toimii Androidilla, iPhonela, ja verkossa. Rekisteröidy sykronoidaksesi tilaukset laitteiden välillä.

Kuuntele yli 500 aihetta

Samanlainen kuin Knowledge Science - Alles über KI, ML und NLP

Kuuntelemisen arvoisia podcasteja

Knowledge Science - Alles über KI, ML und NLP « » Episode 154 - Sind LLMs auf Benchmark Daten manipuliert?

Episode 154 - Sind LLMs auf Benchmark Daten manipuliert?

Kuuntelemisen arvoisia podcasteja

Tervetuloa Player FM:n!

Samanlainen kuin Knowledge Science - Alles über KI, ML und NLP

Pikakäyttöopas

Knowledge Science - Alles über KI, ML und NLP « »
Episode 154 - Sind LLMs auf Benchmark Daten manipuliert?