Projekte pro Jahr
Abstract
In this work, we study L∗-based learning of deterministic Markov decision processes, a class of Markov decision processes where an observation following an action uniquely determines a successor state. For this purpose, we first assume an ideal setting with a teacher who provides perfect information to the student. Then, we relax this assumption and present a novel learning algorithm that collects information by sampling execution traces of the system via testing.
Experiments performed on an implementation of our sampling-based algorithm suggest that our method achieves better accuracy than state-of-the-art passive learning techniques using the same amount of test obser vations. In contrast to existing learning algorithms which assume a predefined number of states, our algorithm learns the complete model structure including the state space.
Originalsprache | englisch |
---|---|
Seiten (von - bis) | 575-615 |
Seitenumfang | 41 |
Fachzeitschrift | Formal Aspects of Computing |
Jahrgang | 33 |
Ausgabenummer | 4-5 |
Frühes Online-Datum | 31 März 2021 |
DOIs | |
Publikationsstatus | Veröffentlicht - Aug. 2021 |
ASJC Scopus subject areas
- Software
- Theoretische Informatik
Fields of Expertise
- Information, Communication & Computing
Fingerprint
Untersuchen Sie die Forschungsthemen von „L*-Based Learning of Markov Decision Processes (Extended Version)“. Zusammen bilden sie einen einzigartigen Fingerprint.Projekte
- 1 Abgeschlossen
-
Verlaesslichkeit im Internet der Dinge
Boano, C. A. (Teilnehmer (Co-Investigator)), Kubin, G. (Teilnehmer (Co-Investigator)), Bloem, R. (Teilnehmer (Co-Investigator)), Horn, M. (Teilnehmer (Co-Investigator)), Pernkopf, F. (Teilnehmer (Co-Investigator)), Zakany, N. (Teilnehmer (Co-Investigator)), Mangard, S. (Teilnehmer (Co-Investigator)), Witrisal, K. (Teilnehmer (Co-Investigator)), Römer, K. U. (Teilnehmer (Co-Investigator)), Aichernig, B. (Teilnehmer (Co-Investigator)), Bösch, W. (Teilnehmer (Co-Investigator)), Baunach, M. C. (Teilnehmer (Co-Investigator)), Tappler, M. (Teilnehmer (Co-Investigator)), Malenko, M. (Teilnehmer (Co-Investigator)), Weiser, S. (Teilnehmer (Co-Investigator)), Eichlseder, M. (Teilnehmer (Co-Investigator)), Leitinger, E. (Teilnehmer (Co-Investigator)), Grosinger, J. (Teilnehmer (Co-Investigator)), Großwindhager, B. (Teilnehmer (Co-Investigator)), Ebrahimi, M. (Teilnehmer (Co-Investigator)), Alothman Alterkawi, A. B. (Teilnehmer (Co-Investigator)), Knoll, C. (Teilnehmer (Co-Investigator)), Teschl, R. (Teilnehmer (Co-Investigator)), Saukh, O. (Teilnehmer (Co-Investigator)), Rath, M. (Teilnehmer (Co-Investigator)), Steinberger, M. (Teilnehmer (Co-Investigator)), Steinbauer-Wagner, G. (Teilnehmer (Co-Investigator)) & Tranninger, M. (Teilnehmer (Co-Investigator))
1/01/16 → 31/03/22
Projekt: Forschungsprojekt
Publikationen
- 1 Beitrag in einem Konferenzband
-
L*-Based Learning of Markov Decision Processes
Tappler, M., Aichernig, B., Bacci, G., Eichlseder, M. & Larsen, K. G., 2019, Formal Methods - The Next 30 Years . ter Beek, M. H., McIver, A. & Oliveria, J. N. (Hrsg.). Cham: Springer, S. 651 - 669 19 S. (Lecture Notes in Computer Science; Band 11800).Publikation: Beitrag in Buch/Bericht/Konferenzband › Beitrag in einem Konferenzband › Begutachtung
Open Access