• Page d’accueil
  • Podcasts
  • La tete de liste

John Schulman

TalkRL: The Reinforcement Learning Podcast - Un podcast de Robin Ranjit Singh Chauhan

Catégories:

Technologie

John Schulman, OpenAI cofounder and researcher, inventor of PPO/TRPO talks RL from human feedback, tuning GPT-3 to follow instructions (InstructGPT) and answer long-form questions using the internet (WebGPT), AI alignment, AGI timelines, and more!

Visit the podcast's native language site

  • Tous les podcasts
  • Épisodes
  • Blog
  • À propos de nous
  • Politique de confidentialité
  • Qu'est-ce qu'un podcast ?
  • Comment écouter un podcast ?

© Podcast24.fr 2025