Stell dir einen ausgewachsenen Fuchs vor, der mutig in die Wildnis aufbricht, bereit, neue Herausforderungen zu meistern. Ohne Anleitung lernt der Fuchs durch Versuch und Irrtum und wird mit jedem Tag stärker und geschickter. Ähnlich können Maschinen ihr Verhalten anhand von Belohnungen anpassen und verbessern. Diese Technik nennt man bestärkendes Lernen. Besonders in Spielsituationen zeigt diese Methode vielversprechende Ergebnisse. Maschinen, die durch bestärkendes Lernen trainiert wurden, wie diejenigen, die das uralte Spiel Go oder DOTA meistern, können sogar Menschen übertreffen. Diese Algorithmen sind auf sehr spezifische Situationen spezialisiert, weshalb wir noch nicht von künstlicher allgemeiner Intelligenz sprechen können. Wenn man jedoch bestärkendes Lernen mit anderen Methoden wie unüberwachtem und überwachtem Lernen kombiniert, könnten diese Maschinen vielleicht zu vielseitigeren Agenten werden.