Andrej Karpathy

slowakischer Informatiker From Wikipedia, the free encyclopedia

Andrej Karpathy (* 23. Oktober 1986 in Bratislava)[1][2][3] ist ein slowakischer Informatiker. Er war Direktor für künstliche Intelligenz bei dem US-amerikanischen Unternehmen Tesla und leitete dort das Programm Autopilot Vision für die Entwicklung autonomer Fahrzeuge. Seit 2026 arbeitet er bei Anthropic im Pretraining-Team für die Claude-Modelle.[4] Er ist spezialisiert auf Deep Learning und Computer Vision.[5][6]

Andrej Karpathy

Leben

Karpathy wurde in der Tschechoslowakei geboren und zog im Alter von 15 Jahren mit seiner Familie nach Toronto in Kanada. Er erwarb einen Bachelor in Informatik und Physik an der University of Toronto im Jahr 2009 und einen Master an der University of British Columbia im Jahr 2011. Im Jahr 2015 promovierte er an der Stanford University unter der Leitung von Fei-Fei Li, wobei er sich auf die Überschneidung von natürlicher Sprachverarbeitung und Computer Vision sowie auf dafür geeignete Deep-Learning-Modelle konzentrierte.[7] Im September 2016 trat er OpenAI als Wissenschaftler bei, welches damals noch als Non-Profit-Organisation organisiert war. Im Juni 2017 wurde er Direktor für künstliche Intelligenz bei Tesla.[8][9] Im Juli 2022 wurde bekannt, dass er Tesla verlässt.[10][11] 2023 kehrte Karpathy kurzzeitig zu OpenAI zurück und arbeitete dort an GPT-4.[8] 2024 wurde bekannt, dass er OpenAI verlässt.[12] Am 16. Juli 2024 gab Karpathy die Gründung von Eureka Labs, einer auf KI-gestützte Bildung ausgerichteten Plattform, bekannt.[13][14] Im Mai 2026 wechselte Karpathy zu Anthropic.[4] Dort wurde er dem Pretraining-Team zugeordnet, das an großskaligen Trainingsläufen arbeitet, durch die Claude-Modelle grundlegende Kenntnisse und Fähigkeiten erwerben.[4] Zu seinen Aufgaben gehört der Aufbau eines Teams, das Claude zur Beschleunigung der Pretraining-Forschung nutzt.[4] Beim Wechsel zu Anthropic erklärte Karpathy, er wolle in Forschung und Entwicklung zurückkehren und seine Arbeit im Bereich Bildung später wieder aufnehmen.[14]

Wirken

Karpathy besitzt einen YouTube-Kanal, auf dem er mehrere Lehrvideos über Large Language Models veröffentlicht hat. Die Videos sind in eine technische und eine nicht-technische Themenreihe unterteilt und wurden bereits millionenfach geklickt.[15][16] Anfang 2025 prägte Karpathy den Ausdruck vibe coding für eine Form der Softwareentwicklung, bei der Nutzer Programme durch Prompts an generative KI-Systeme entstehen lassen und die Systeme auch Teile der Fehlerbehebung übernehmen.[14][17] Der Begriff wurde in der Debatte über KI-gestützte Softwareentwicklung im Zusammenhang mit Werkzeugen wie Claude Code, OpenAI Codex und Google Gemini aufgegriffen.[17] Karpathy unterschied später davon stärker agentenbasierte Entwicklungsformen, bei denen KI-Agenten den eigentlichen Code schreiben und Menschen stärker beaufsichtigend eingreifen, und schlug dafür die Bezeichnung agentic engineering vor.[14]

Auszeichnungen

Einzelnachweise

Related Articles

Wikiwand AI