d8/d4c/_pomdp_memory_unfolder_8cpp_source.html

#include "storm-pomdp/transformer/PomdpMemoryUnfolder.h"


#include <limits>


#include "storm/adapters/RationalFunctionAdapter.h"

#include "storm/exceptions/NotSupportedException.h"

#include "storm/storage/sparse/ModelComponents.h"

#include "storm/utility/graph.h"


namespace storm {

namespace transformer {


template<typename ValueType>


PomdpMemoryUnfolder<ValueType>::PomdpMemoryUnfolder(storm::models::sparse::Pomdp<ValueType> const& pomdp, storm::storage::PomdpMemory const& memory,

                                                    bool addMemoryLabels, bool keepStateValuations)

    : pomdp(pomdp), memory(memory), addMemoryLabels(addMemoryLabels), keepStateValuations(keepStateValuations) {

    // intentionally left empty

}


template<typename ValueType>


std::shared_ptr<storm::models::sparse::Pomdp<ValueType>> PomdpMemoryUnfolder<ValueType>::transform(bool dropUnreachableStates) const {

    // For simplicity we first build the 'full' product of pomdp and memory (with pomdp.numStates * memory.numStates states).

    STORM_LOG_THROW(pomdp.isCanonic(), storm::exceptions::InvalidArgumentException, "POMDP must be canonical to unfold memory into it");

    storm::storage::sparse::ModelComponents<ValueType> components;

    components.transitionMatrix = transformTransitions();

    components.stateLabeling = transformStateLabeling();


    // Now delete unreachable states.

    storm::storage::BitVector allStates(components.transitionMatrix.getRowGroupCount(), true);


    storm::storage::BitVector reachableStates = allStates;

    if (dropUnreachableStates) {

        reachableStates =

            storm::utility::graph::getReachableStates(components.transitionMatrix, components.stateLabeling.getStates("init"), allStates, ~allStates);

        components.transitionMatrix = components.transitionMatrix.getSubmatrix(true, reachableStates, reachableStates);

        components.stateLabeling = components.stateLabeling.getSubLabeling(reachableStates);

        if (keepStateValuations && pomdp.hasStateValuations()) {

            std::vector<uint64_t> newToOldStates(pomdp.getNumberOfStates() * memory.getNumberOfStates(), 0);

            for (uint64_t newState = 0; newState < newToOldStates.size(); newState++) {

                newToOldStates[newState] = getModelState(newState);

            }

            components.stateValuations = pomdp.getStateValuations().blowup(newToOldStates).selectStates(reachableStates);

        }

    }


    // build the remaining components

    components.observabilityClasses = transformObservabilityClasses(reachableStates);

    for (auto const& rewModel : pomdp.getRewardModels()) {

        components.rewardModels.emplace(rewModel.first, transformRewardModel(rewModel.second, reachableStates));

    }


    return std::make_shared<storm::models::sparse::Pomdp<ValueType>>(std::move(components), true);

}


template<typename ValueType>

storm::storage::SparseMatrix<ValueType> PomdpMemoryUnfolder<ValueType>::transformTransitions() const {

    storm::storage::SparseMatrix<ValueType> const& origTransitions = pomdp.getTransitionMatrix();

    uint64_t numRows = 0;

    uint64_t numEntries = 0;

    for (uint64_t modelState = 0; modelState < pomdp.getNumberOfStates(); ++modelState) {

        for (uint64_t memState = 0; memState < memory.getNumberOfStates(); ++memState) {

            numRows += origTransitions.getRowGroupSize(modelState) * memory.getNumberOfOutgoingTransitions(memState);

            numEntries += origTransitions.getRowGroup(modelState).getNumberOfEntries() * memory.getNumberOfOutgoingTransitions(memState);

        }

    }

    storm::storage::SparseMatrixBuilder<ValueType> builder(numRows, pomdp.getNumberOfStates() * memory.getNumberOfStates(), numEntries, true, true,

                                                           pomdp.getNumberOfStates() * memory.getNumberOfStates());


    uint64_t row = 0;

    for (uint64_t modelState = 0; modelState < pomdp.getNumberOfStates(); ++modelState) {

        for (uint64_t memState = 0; memState < memory.getNumberOfStates(); ++memState) {

            builder.newRowGroup(row);

            for (uint64_t origRow = origTransitions.getRowGroupIndices()[modelState]; origRow < origTransitions.getRowGroupIndices()[modelState + 1];

                 ++origRow) {

                for (auto const& memStatePrime : memory.getTransitions(memState)) {

                    for (auto const& entry : origTransitions.getRow(origRow)) {

                        builder.addNextValue(row, getUnfoldingState(entry.getColumn(), memStatePrime), entry.getValue());

                    }

                    ++row;

                }

            }

        }

    }

    return builder.build();

}


template<typename ValueType>

storm::models::sparse::StateLabeling PomdpMemoryUnfolder<ValueType>::transformStateLabeling() const {

    storm::models::sparse::StateLabeling labeling(pomdp.getNumberOfStates() * memory.getNumberOfStates());

    for (auto const& labelName : pomdp.getStateLabeling().getLabels()) {

        storm::storage::BitVector newStates(pomdp.getNumberOfStates() * memory.getNumberOfStates(), false);


        // The init label is only assigned to unfolding states with the initial memory state

        if (labelName == "init") {

            for (auto const& modelState : pomdp.getStateLabeling().getStates(labelName)) {

                newStates.set(getUnfoldingState(modelState, memory.getInitialState()));

            }

        } else {

            for (auto const& modelState : pomdp.getStateLabeling().getStates(labelName)) {

                for (uint64_t memState = 0; memState < memory.getNumberOfStates(); ++memState) {

                    newStates.set(getUnfoldingState(modelState, memState));

                }

            }

        }

        labeling.addLabel(labelName, std::move(newStates));

    }

    if (addMemoryLabels) {

        for (uint64_t memState = 0; memState < memory.getNumberOfStates(); ++memState) {

            storm::storage::BitVector newStates(pomdp.getNumberOfStates() * memory.getNumberOfStates(), false);

            for (uint64_t modelState = 0; modelState < pomdp.getNumberOfStates(); ++modelState) {

                newStates.set(getUnfoldingState(modelState, memState));

            }

            labeling.addLabel("memstate_" + std::to_string(memState), newStates);

        }

    }

    return labeling;

}


template<typename ValueType>

std::vector<uint32_t> PomdpMemoryUnfolder<ValueType>::transformObservabilityClasses(storm::storage::BitVector const& reachableStates) const {

    std::vector<uint32_t> observations;

    observations.reserve(pomdp.getNumberOfStates() * memory.getNumberOfStates());

    for (uint64_t modelState = 0; modelState < pomdp.getNumberOfStates(); ++modelState) {

        for (uint64_t memState = 0; memState < memory.getNumberOfStates(); ++memState) {

            if (reachableStates.get(getUnfoldingState(modelState, memState))) {

                observations.push_back(getUnfoldingObersvation(pomdp.getObservation(modelState), memState));

            }

        }

    }


    // Eliminate observations that are not in use (as they are not reachable).

    std::set<uint32_t> occuringObservations(observations.begin(), observations.end());

    uint32_t highestObservation = *occuringObservations.rbegin();

    std::vector<uint32_t> oldToNewObservationMapping(highestObservation + 1, std::numeric_limits<uint32_t>::max());

    uint32_t newObs = 0;

    for (auto const& oldObs : occuringObservations) {

        oldToNewObservationMapping[oldObs] = newObs;

        ++newObs;

    }

    for (auto& obs : observations) {

        obs = oldToNewObservationMapping[obs];

    }


    return observations;

}


template<typename ValueType>

storm::models::sparse::StandardRewardModel<ValueType> PomdpMemoryUnfolder<ValueType>::transformRewardModel(

    storm::models::sparse::StandardRewardModel<ValueType> const& rewardModel, storm::storage::BitVector const& reachableStates) const {

    std::optional<std::vector<ValueType>> stateRewards, actionRewards;

    if (rewardModel.hasStateRewards()) {

        stateRewards = std::vector<ValueType>();

        stateRewards->reserve(pomdp.getNumberOfStates() * memory.getNumberOfStates());

        for (uint64_t modelState = 0; modelState < pomdp.getNumberOfStates(); ++modelState) {

            for (uint64_t memState = 0; memState < memory.getNumberOfStates(); ++memState) {

                if (reachableStates.get(getUnfoldingState(modelState, memState))) {

                    stateRewards->push_back(rewardModel.getStateReward(modelState));

                }

            }

        }

    }

    if (rewardModel.hasStateActionRewards()) {

        actionRewards = std::vector<ValueType>();

        for (uint64_t modelState = 0; modelState < pomdp.getNumberOfStates(); ++modelState) {

            for (uint64_t memState = 0; memState < memory.getNumberOfStates(); ++memState) {

                if (reachableStates.get(getUnfoldingState(modelState, memState))) {

                    for (uint64_t origRow = pomdp.getTransitionMatrix().getRowGroupIndices()[modelState];

                         origRow < pomdp.getTransitionMatrix().getRowGroupIndices()[modelState + 1]; ++origRow) {

                        ValueType const& actionReward = rewardModel.getStateActionReward(origRow);

                        actionRewards->insert(actionRewards->end(), memory.getNumberOfOutgoingTransitions(memState), actionReward);

                    }

                }

            }

        }

    }

    STORM_LOG_THROW(!rewardModel.hasTransitionRewards(), storm::exceptions::NotSupportedException, "Transition rewards are currently not supported.");

    return storm::models::sparse::StandardRewardModel<ValueType>(std::move(stateRewards), std::move(actionRewards));

}


template<typename ValueType>

uint64_t PomdpMemoryUnfolder<ValueType>::getUnfoldingState(uint64_t modelState, uint64_t memoryState) const {

    return modelState * memory.getNumberOfStates() + memoryState;

}


template<typename ValueType>

uint64_t PomdpMemoryUnfolder<ValueType>::getModelState(uint64_t unfoldingState) const {

    return unfoldingState / memory.getNumberOfStates();

}


template<typename ValueType>

uint64_t PomdpMemoryUnfolder<ValueType>::getMemoryState(uint64_t unfoldingState) const {

    return unfoldingState % memory.getNumberOfStates();

}


template<typename ValueType>

uint32_t PomdpMemoryUnfolder<ValueType>::getUnfoldingObersvation(uint32_t modelObservation, uint64_t memoryState) const {

    return modelObservation * memory.getNumberOfStates() + memoryState;

}


template<typename ValueType>

uint32_t PomdpMemoryUnfolder<ValueType>::getModelObersvation(uint32_t unfoldingObservation) const {

    return unfoldingObservation / memory.getNumberOfStates();

}


template<typename ValueType>

uint64_t PomdpMemoryUnfolder<ValueType>::getMemoryStateFromObservation(uint32_t unfoldingObservation) const {

    return unfoldingObservation % memory.getNumberOfStates();

}


template class PomdpMemoryUnfolder<double>;

template class PomdpMemoryUnfolder<storm::RationalNumber>;

template class PomdpMemoryUnfolder<storm::RationalFunction>;

}  // namespace transformer

}  // namespace storm

ModelComponents.h

NotSupportedException.h

PomdpMemoryUnfolder.h

RationalFunctionAdapter.h

storm::models::sparse::Pomdp
This class represents a partially observable Markov decision process.
Definition Pomdp.h:13

storm::models::sparse::StandardRewardModel
Definition StandardRewardModel.h:16

storm::models::sparse::StandardRewardModel::hasTransitionRewards
bool hasTransitionRewards() const
Retrieves whether the reward model has transition rewards.
Definition StandardRewardModel.cpp:115

storm::models::sparse::StandardRewardModel::getStateReward
ValueType const & getStateReward(uint_fast64_t state) const
Definition StandardRewardModel.cpp:63

storm::models::sparse::StandardRewardModel::getStateActionReward
ValueType const & getStateActionReward(uint_fast64_t choiceIndex) const
Retrieves the state-action reward for the given choice.
Definition StandardRewardModel.cpp:95

storm::models::sparse::StandardRewardModel::hasStateRewards
bool hasStateRewards() const
Retrieves whether the reward model has state rewards.
Definition StandardRewardModel.cpp:35

storm::models::sparse::StandardRewardModel::hasStateActionRewards
bool hasStateActionRewards() const
Retrieves whether the reward model has state-action rewards.
Definition StandardRewardModel.cpp:78

storm::models::sparse::StateLabeling
This class manages the labeling of the state space with a number of (atomic) labels.
Definition StateLabeling.h:16

storm::models::sparse::StateLabeling::getStates
storm::storage::BitVector const & getStates(std::string const &label) const
Returns the labeling of states associated with the given label.
Definition StateLabeling.cpp:60

storm::models::sparse::StateLabeling::getSubLabeling
StateLabeling getSubLabeling(storm::storage::BitVector const &states) const
Retrieves the sub labeling that represents the same labeling as the current one for all selected stat...
Definition StateLabeling.cpp:40

storm::storage::BitVector
A bit vector that is internally represented as a vector of 64-bit values.
Definition BitVector.h:16

storm::storage::BitVector::get
bool get(uint64_t index) const
Retrieves the truth value of the bit at the given index and performs a bound check.
Definition BitVector.cpp:267

storm::storage::PomdpMemory
Definition PomdpMemory.h:10

storm::storage::SparseMatrix::const_rows::getNumberOfEntries
index_type getNumberOfEntries() const
Retrieves the number of entries in the rows.
Definition SparseMatrix.cpp:491

storm::storage::SparseMatrixBuilder
A class that can be used to build a sparse matrix by adding value by value.
Definition SparseMatrix.h:133

storm::storage::SparseMatrix
A class that holds a possibly non-square matrix in the compressed row storage format.
Definition SparseMatrix.h:328

storm::storage::SparseMatrix::getRowGroup
const_rows getRowGroup(index_type rowGroup) const
Returns an object representing the given row group.
Definition SparseMatrix.cpp:2156

storm::storage::SparseMatrix::getRowGroupIndices
std::vector< index_type > const & getRowGroupIndices() const
Returns the grouping of rows of this matrix.
Definition SparseMatrix.cpp:765

storm::storage::SparseMatrix::getRowGroupSize
index_type getRowGroupSize(index_type group) const
Returns the size of the given row group.
Definition SparseMatrix.cpp:728

storm::transformer::PomdpMemoryUnfolder
Definition PomdpMemoryUnfolder.h:11

storm::transformer::PomdpMemoryUnfolder::PomdpMemoryUnfolder
PomdpMemoryUnfolder(storm::models::sparse::Pomdp< ValueType > const &pomdp, storm::storage::PomdpMemory const &memory, bool addMemoryLabels=false, bool keepStateValuations=false)
Definition PomdpMemoryUnfolder.cpp:14

storm::transformer::PomdpMemoryUnfolder::transform
std::shared_ptr< storm::models::sparse::Pomdp< ValueType > > transform(bool dropUnreachableStates=true) const
Definition PomdpMemoryUnfolder.cpp:21

graph.h

STORM_LOG_THROW
#define STORM_LOG_THROW(cond, exception, message)
Definition macros.h:30

storm::dft::modelchecker::ValueType
SFTBDDChecker::ValueType ValueType
Definition SFTBDDChecker.cpp:12

storm::pomdp::analysis::getStates
storm::storage::BitVector getStates(storm::logic::Formula const &propositionalFormula, bool formulaInverted, PomdpType const &pomdp)
Definition FormulaInformation.cpp:114

storm::transformer::transformRewardModel
RewardModelType transformRewardModel(RewardModelType const &originalRewardModel, storm::storage::BitVector const &subsystem, storm::storage::BitVector const &subsystemActions, bool makeRowGroupingTrivial)
Definition SubsystemBuilder.cpp:43

storm::utility::graph::getReachableStates
storm::storage::BitVector getReachableStates(storm::storage::SparseMatrix< T > const &transitionMatrix, storm::storage::BitVector const &initialStates, storm::storage::BitVector const &constraintStates, storm::storage::BitVector const &targetStates, bool useStepBound, uint_fast64_t maximalSteps, boost::optional< storm::storage::BitVector > const &choiceFilter)
Performs a forward depth-first search through the underlying graph structure to identify the states t...
Definition graph.cpp:41

storm
Definition AutomaticSettings.cpp:13

storm::storage::sparse::ModelComponents
Definition ModelComponents.h:27

storm::storage::sparse::ModelComponents::stateValuations
std::optional< storm::storage::sparse::StateValuations > stateValuations
Definition ModelComponents.h:67

storm::storage::sparse::ModelComponents::rewardModels
std::unordered_map< std::string, RewardModelType > rewardModels
Definition ModelComponents.h:63

storm::storage::sparse::ModelComponents::transitionMatrix
storm::storage::SparseMatrix< ValueType > transitionMatrix
Definition ModelComponents.h:59

storm::storage::sparse::ModelComponents::stateLabeling
storm::models::sparse::StateLabeling stateLabeling
Definition ModelComponents.h:61

storm::storage::sparse::ModelComponents::observabilityClasses
std::optional< std::vector< uint32_t > > observabilityClasses
Definition ModelComponents.h:73