d5/db5/_winning_region_query_interface_8cpp_source.html

#include "storm-pomdp/analysis/WinningRegionQueryInterface.h"

#include "storm/adapters/RationalNumberAdapter.h"

#include "storm/exceptions/UnexpectedException.h"

#include "storm/storage/expressions/Expression.h"


namespace storm {

namespace pomdp {

template<typename ValueType>


WinningRegionQueryInterface<ValueType>::WinningRegionQueryInterface(storm::models::sparse::Pomdp<ValueType> const& pomdp, WinningRegion const& winningRegion)

    : pomdp(pomdp), winningRegion(winningRegion) {

    uint64_t nrObservations = pomdp.getNrObservations();

    for (uint64_t observation = 0; observation < nrObservations; ++observation) {

        statesPerObservation.push_back(std::vector<uint64_t>());

    }

    for (uint64_t state = 0; state < pomdp.getNumberOfStates(); ++state) {

        statesPerObservation[pomdp.getObservation(state)].push_back(state);

    }

}


template<typename ValueType>


bool WinningRegionQueryInterface<ValueType>::isInWinningRegion(storm::storage::BitVector const& beliefSupport) const {

    STORM_LOG_ASSERT(beliefSupport.getNumberOfSetBits() > 0, "One cannot think one is literally nowhere");

    uint64_t observation = pomdp.getObservation(beliefSupport.getNextSetIndex(0));

    // TODO consider optimizations after testing.

    storm::storage::BitVector queryVector(statesPerObservation[observation].size());

    auto stateWithObsIt = statesPerObservation[observation].begin();

    uint64_t offset = 0;

    for (uint64_t possibleState : beliefSupport) {

        STORM_LOG_ASSERT(pomdp.getObservation(possibleState) == observation, "Support must be observation-consistent");

        while (possibleState > *stateWithObsIt) {

            stateWithObsIt++;

            offset++;

        }

        if (possibleState == *stateWithObsIt) {

            queryVector.set(offset);

        }

    }

    return winningRegion.query(observation, queryVector);

}


template<typename ValueType>


bool WinningRegionQueryInterface<ValueType>::staysInWinningRegion(storm::storage::BitVector const& currentBeliefSupport, uint64_t actionIndex) const {

    STORM_LOG_ASSERT(currentBeliefSupport.getNumberOfSetBits() > 0, "One cannot think one is literally nowhere");

    std::map<uint32_t, storm::storage::BitVector> successors;

    STORM_LOG_DEBUG("Stays in winning region? (" << currentBeliefSupport << ", " << actionIndex << ")");

    for (uint64_t oldState : currentBeliefSupport) {

        uint64_t row = pomdp.getTransitionMatrix().getRowGroupIndices()[oldState] + actionIndex;

        for (auto const& successor : pomdp.getTransitionMatrix().getRow(row)) {

            assert(!storm::utility::isZero(successor.getValue()));

            uint32_t obs = pomdp.getObservation(successor.getColumn());

            if (successors.count(obs) == 0) {

                successors[obs] = storm::storage::BitVector(pomdp.getNumberOfStates());

            }

            successors[obs].set(successor.getColumn(), true);

        }

    }


    for (auto const& entry : successors) {

        if (!isInWinningRegion(entry.second)) {

            STORM_LOG_DEBUG("Belief support " << entry.second << " (obs " << entry.first << ") is not winning");

            return false;

        } else {

            STORM_LOG_DEBUG("Belief support " << entry.second << " (obs " << entry.first << ") is winning");

        }

    }

    return true;

}


template<typename ValueType>


void WinningRegionQueryInterface<ValueType>::validate() const {

    for (uint64_t obs = 0; obs < pomdp.getNrObservations(); ++obs) {

        for (auto const& winningBelief : winningRegion.getWinningSetsPerObservation(obs)) {

            storm::storage::BitVector states(pomdp.getNumberOfStates());

            for (uint64_t offset : winningBelief) {

                states.set(statesPerObservation[obs][offset]);

            }

            bool safeActionExists = false;

            for (uint64_t actionIndex = 0; actionIndex < pomdp.getTransitionMatrix().getRowGroupSize(statesPerObservation[obs][0]); ++actionIndex) {

                if (staysInWinningRegion(states, actionIndex)) {

                    safeActionExists = true;

                    break;

                }

            }

            STORM_LOG_THROW(safeActionExists, storm::exceptions::UnexpectedException, "Observation " << obs << " , support " << states);

        }

    }

}


template<typename ValueType>


void WinningRegionQueryInterface<ValueType>::validateIsMaximal(storm::storage::BitVector const& badStates) const {

    for (uint64_t obs = 0; obs < pomdp.getNrObservations(); ++obs) {

        STORM_LOG_DEBUG("Check listed belief supports for observation " << obs << " are maximal");

        for (auto const& winningBelief : winningRegion.getWinningSetsPerObservation(obs)) {

            storm::storage::BitVector remainders = ~winningBelief;

            for (auto const additional : remainders) {

                uint64_t addState = statesPerObservation[obs][additional];

                if (badStates.get(addState)) {

                    continue;

                }


                storm::storage::BitVector states(pomdp.getNumberOfStates());

                for (uint64_t offset : winningBelief) {

                    states.set(statesPerObservation[obs][offset]);

                }

                states.set(statesPerObservation[obs][additional]);

                assert(states.getNumberOfSetBits() == winningBelief.getNumberOfSetBits() + 1);


                bool safeActionExists = false;

                for (uint64_t actionIndex = 0; actionIndex < pomdp.getTransitionMatrix().getRowGroupSize(statesPerObservation[obs][0]); ++actionIndex) {

                    if (staysInWinningRegion(states, actionIndex)) {

                        STORM_LOG_DEBUG("Action " << actionIndex << " from " << states << " is safe. ");

                        safeActionExists = true;

                        break;

                    }

                }


                STORM_LOG_THROW(!safeActionExists, storm::exceptions::UnexpectedException, "Observation " << obs << ", support " << states);

            }

        }

        STORM_LOG_DEBUG("All listed belief supports for observation " << obs << " are maximal. Continue with single states.");


        for (uint64_t offset = 0; offset < statesPerObservation[obs].size(); ++offset) {

            if (winningRegion.isWinning(obs, offset)) {

                continue;

            }

            uint64_t addState = statesPerObservation[obs][offset];

            if (badStates.get(addState)) {

                continue;

            }

            storm::storage::BitVector states(pomdp.getNumberOfStates());

            states.set(addState);

            bool safeActionExists = false;

            for (uint64_t actionIndex = 0; actionIndex < pomdp.getTransitionMatrix().getRowGroupSize(statesPerObservation[obs][0]); ++actionIndex) {

                if (staysInWinningRegion(states, actionIndex)) {

                    safeActionExists = true;

                    break;

                }

            }


            STORM_LOG_THROW(!safeActionExists, storm::exceptions::UnexpectedException, "Observation " << obs << "  , support " << states);

        }

    }

}


template class WinningRegionQueryInterface<double>;

template class WinningRegionQueryInterface<storm::RationalNumber>;

}  // namespace pomdp


}  // namespace storm

Expression.h

RationalNumberAdapter.h

UnexpectedException.h

WinningRegionQueryInterface.h

storm::models::sparse::Model::getNumberOfStates
virtual uint_fast64_t getNumberOfStates() const override
Returns the number of states of the model.
Definition Model.cpp:162

storm::models::sparse::Pomdp
This class represents a partially observable Markov decision process.
Definition Pomdp.h:15

storm::models::sparse::Pomdp::getNrObservations
uint64_t getNrObservations() const
Definition Pomdp.cpp:68

storm::models::sparse::Pomdp::getObservation
uint32_t getObservation(uint64_t state) const
Definition Pomdp.cpp:63

storm::pomdp::WinningRegion
Definition WinningRegion.h:13

storm::pomdp::WinningRegionQueryInterface
Definition WinningRegionQueryInterface.h:8

storm::pomdp::WinningRegionQueryInterface::isInWinningRegion
bool isInWinningRegion(storm::storage::BitVector const &beliefSupport) const
Definition WinningRegionQueryInterface.cpp:21

storm::pomdp::WinningRegionQueryInterface::staysInWinningRegion
bool staysInWinningRegion(storm::storage::BitVector const &beliefSupport, uint64_t actionIndex) const
Definition WinningRegionQueryInterface.cpp:42

storm::pomdp::WinningRegionQueryInterface::validate
void validate() const
Definition WinningRegionQueryInterface.cpp:70

storm::pomdp::WinningRegionQueryInterface::WinningRegionQueryInterface
WinningRegionQueryInterface(storm::models::sparse::Pomdp< ValueType > const &pomdp, WinningRegion const &winningRegion)
Definition WinningRegionQueryInterface.cpp:9

storm::pomdp::WinningRegionQueryInterface::validateIsMaximal
void validateIsMaximal(storm::storage::BitVector const &badStates) const
Definition WinningRegionQueryInterface.cpp:90

storm::storage::BitVector
A bit vector that is internally represented as a vector of 64-bit values.
Definition BitVector.h:18

storm::storage::BitVector::getNextSetIndex
uint_fast64_t getNextSetIndex(uint_fast64_t startingIndex) const
Retrieves the index of the bit that is the next bit set to true in the bit vector.
Definition BitVector.cpp:809

storm::storage::BitVector::set
void set(uint_fast64_t index, bool value=true)
Sets the given truth value at the given index.
Definition BitVector.cpp:243

storm::storage::BitVector::getNumberOfSetBits
uint_fast64_t getNumberOfSetBits() const
Returns the number of bits that are set to true in this bit vector.
Definition BitVector.cpp:711

storm::storage::BitVector::get
bool get(uint_fast64_t index) const
Retrieves the truth value of the bit at the given index and performs a bound check.
Definition BitVector.cpp:268

STORM_LOG_DEBUG
#define STORM_LOG_DEBUG(message)
Definition logging.h:23

STORM_LOG_ASSERT
#define STORM_LOG_ASSERT(cond, message)
Definition macros.h:11

STORM_LOG_THROW
#define STORM_LOG_THROW(cond, exception, message)
Definition macros.h:30

storm::utility::isZero
bool isZero(ValueType const &a)
Definition constants.cpp:41

storm
LabParser.cpp.
Definition cli.cpp:18