In dieser Arbeit wird ein duale s MDP Modell implementiert, um das Verhältnis der verknüpften MDP Verfahren zu analysieren. Shannon ´s Maus Theseus wird als ein Simulationsmodell verwendet. Eine Katze wird als zweiter Agent im Labyrinth hinzugefügt. Die Maus und die Katze können sich in der Simulation gegenseitig beeinflussen. Ein neu aufgebautes Labyrinth wird verwendet, damit die Wände des Labyrinths keine leeren Plätze be setzen. Die drei im Modell angewendeten MDP
Verfahren sind Wert Iteration, Q Lernen und TD Learning. Das Problem des Maus Katze Spiels ist ein dynamisches Entscheidungsproblem. Das Ziel der Maus ist es, den
kürzesten und sichersten Weg zum Käse zu finden. Die angewendeten MDP Verfahren der beiden Agenten laufen parallel. Zuerst wird das duale MDP Modell in der sicheren Umgebung simuliert. Die Belohnungsdifferenzen und die gefundene Strategie der Agenten werden grafisch dargestellt. Durch d ie Veränderung der vier Belohnungen zeigt sich , dass sich die gefundenen Strategien beeinflussen können. Das duale MDP Modell kann auch unter Unsicherheit eine Strategie finden . Ein blinde Maus Modell in unsicherer Umgebung wird simuliert, um d en speziellen Zustand der Maus zu analysieren . Ein spezielle r Platz wird im Labyrinth hinzu ge fügt, um die Wirkung der ungleich verteilte n Abweichungen zu simulieren Ein spezieller Platz nahe der Katze kann der blinden Maus helfen, um der Katze auszuweichen. Das Verhältnis zwischen den beiden Agenten und d er Zustand
der Umgebung sind zwei wichtige Faktoren im duale n MDP Modell.
Titel der Studienarbeit:
„auf Anfrage“ [Note 3.0]
Titel der Masterarbeit:
„Duale Optimierung von verknüpften MDPs“ [Note 2.6]
Inhalt des Studiums:
Schaltungstechnik und Systemtechnik
Informationstechnik und Kommunikationstechnik
Theoretische Elektrotechnik
Titel der Bachelorarbeit:
„Design und Forschung des auf dem Fließband Prinzip
basierenden digitalen FIR-Filter“ [Note 2.0]
IT-Kenntnisse
In dieser Arbeit wird ein duale s MDP Modell implementiert, um das Verhältnis der verknüpften MDP Verfahren zu analysieren. Shannon ´s Maus Theseus wird als ein Simulationsmodell verwendet. Eine Katze wird als zweiter Agent im Labyrinth hinzugefügt. Die Maus und die Katze können sich in der Simulation gegenseitig beeinflussen. Ein neu aufgebautes Labyrinth wird verwendet, damit die Wände des Labyrinths keine leeren Plätze be setzen. Die drei im Modell angewendeten MDP
Verfahren sind Wert Iteration, Q Lernen und TD Learning. Das Problem des Maus Katze Spiels ist ein dynamisches Entscheidungsproblem. Das Ziel der Maus ist es, den
kürzesten und sichersten Weg zum Käse zu finden. Die angewendeten MDP Verfahren der beiden Agenten laufen parallel. Zuerst wird das duale MDP Modell in der sicheren Umgebung simuliert. Die Belohnungsdifferenzen und die gefundene Strategie der Agenten werden grafisch dargestellt. Durch d ie Veränderung der vier Belohnungen zeigt sich , dass sich die gefundenen Strategien beeinflussen können. Das duale MDP Modell kann auch unter Unsicherheit eine Strategie finden . Ein blinde Maus Modell in unsicherer Umgebung wird simuliert, um d en speziellen Zustand der Maus zu analysieren . Ein spezielle r Platz wird im Labyrinth hinzu ge fügt, um die Wirkung der ungleich verteilte n Abweichungen zu simulieren Ein spezieller Platz nahe der Katze kann der blinden Maus helfen, um der Katze auszuweichen. Das Verhältnis zwischen den beiden Agenten und d er Zustand
der Umgebung sind zwei wichtige Faktoren im duale n MDP Modell.
Titel der Studienarbeit:
„auf Anfrage“ [Note 3.0]
Titel der Masterarbeit:
„Duale Optimierung von verknüpften MDPs“ [Note 2.6]
Inhalt des Studiums:
Schaltungstechnik und Systemtechnik
Informationstechnik und Kommunikationstechnik
Theoretische Elektrotechnik
Titel der Bachelorarbeit:
„Design und Forschung des auf dem Fließband Prinzip
basierenden digitalen FIR-Filter“ [Note 2.0]
IT-Kenntnisse
Direktester geht's nicht! Ganz einfach Freelancer finden und direkt Kontakt aufnehmen.