Decision Trees That Remember: Gradient-Based Learning of Recurrent Decision Trees with Memory

Sascha Marton; Moritz Schneider; Jannik Brinkmann; Stefan Lüdtke; Christian Bartelt; Heiner Stuckenschmidt

Decision Trees That Remember: Gradient-Based Learning of Recurrent Decision Trees with Memory

Sascha Marton, Moritz Schneider, Jannik Brinkmann, Stefan Lüdtke, Christian Bartelt, Heiner Stuckenschmidt

Published: 05 Mar 2025, Last Modified: 20 Apr 2025NFAM 2025 PosterEveryoneRevisionsBibTeXCC BY 4.0

Track: long paper (up to 5 pages)

Keywords: Decision Tree, Sequential Data, Time Series Data, Recurrent Decision Tree

TL;DR: We propose ReMeDe trees, a recurrent decision tree architecture with internal memory, enabling efficient learning for sequential data through hard, axis-aligned decision rules trained via gradient descent.

Abstract: Neural architectures such as Recurrent Neural Networks (RNNs), Transformers, and State-Space Models have shown great success in handling sequential data by learning temporal dependencies. Decision Trees (DTs), on the other hand, remain a widely used class of models for structured tabular data but are typically not designed to capture sequential patterns directly. Instead, DT-based approaches for time-series data often rely on feature engineering, such as manually incorporating lag features, which can be suboptimal for capturing complex temporal dependencies. To address this limitation, we introduce ReMeDe Trees, a novel recurrent decision tree architecture that integrates an internal memory mechanism, similar to RNNs, to learn long-term dependencies in sequential data. Our model learns hard, axis-aligned decision rules for both output generation and state updates, optimizing them efficiently via gradient descent. We provide a proof-of-concept study on synthetic benchmarks to demonstrate the effectiveness of our approach.

Submission Number: 2

Loading