d4/d8e/_iterative_policy_search_8cpp_source.html

#include "storm-pomdp/analysis/IterativePolicySearch.h"

#include "storm/io/file.h"


#include "storm-pomdp/analysis/OneShotPolicySearch.h"

#include "storm-pomdp/analysis/QualitativeAnalysis.h"

#include "storm-pomdp/analysis/QualitativeAnalysisOnGraphs.h"


namespace storm::pomdp {


namespace detail {


void printRelevantInfoFromModel(std::shared_ptr<storm::solver::SmtSolver::ModelReference> const& model,

                                std::vector<storm::expressions::Variable> const& reachVars, std::vector<storm::expressions::Variable> const& continuationVars) {

    uint64_t i = 0;

    std::stringstream ss;

    STORM_LOG_TRACE("states which we have now: ");

    for (auto const& rv : reachVars) {

        if (model->getBooleanValue(rv)) {

            ss << " " << i;

        }

        ++i;

    }

    STORM_LOG_TRACE(ss.str());

    i = 0;

    STORM_LOG_TRACE("states from which we continue: ");

    std::stringstream ss2;

    for (auto const& rv : continuationVars) {

        if (model->getBooleanValue(rv)) {

            ss2 << " " << i;

        }

        ++i;

    }

    STORM_LOG_TRACE(ss2.str());

}


}  // namespace detail


template<typename ValueType>


void IterativePolicySearch<ValueType>::Statistics::print() const {

    STORM_PRINT_AND_LOG("#STATS Total time: " << totalTimer << '\n');

    STORM_PRINT_AND_LOG("#STATS SAT Calls: " << satCalls << '\n');

    STORM_PRINT_AND_LOG("#STATS SAT Calls time: " << smtCheckTimer << '\n');

    STORM_PRINT_AND_LOG("#STATS Outer iterations: " << outerIterations << '\n');

    STORM_PRINT_AND_LOG("#STATS Solver initialization time: " << initializeSolverTimer << '\n');

    STORM_PRINT_AND_LOG("#STATS Obtain partial scheduler time: " << evaluateExtensionSolverTime << '\n');

    STORM_PRINT_AND_LOG("#STATS Update solver to extend partial scheduler time: " << encodeExtensionSolverTime << '\n');

    STORM_PRINT_AND_LOG("#STATS Update solver with new scheduler time: " << updateNewStrategySolverTime << '\n');

    STORM_PRINT_AND_LOG("#STATS Winning regions update time: " << winningRegionUpdatesTimer << '\n');

    STORM_PRINT_AND_LOG("#STATS Graph search time: " << graphSearchTime << '\n');

}


template<typename ValueType>


IterativePolicySearch<ValueType>::IterativePolicySearch(storm::models::sparse::Pomdp<ValueType> const& pomdp, storm::storage::BitVector const& targetStates,

                                                        storm::storage::BitVector const& surelyReachSinkStates,

                                                        std::shared_ptr<storm::utility::solver::SmtSolverFactory>& smtSolverFactory,

                                                        MemlessSearchOptions const& options)

    : pomdp(pomdp), surelyReachSinkStates(surelyReachSinkStates), targetStates(targetStates), options(options), smtSolverFactory(smtSolverFactory) {

    this->expressionManager = std::make_shared<storm::expressions::ExpressionManager>();

    smtSolver = smtSolverFactory->create(*expressionManager);

    // Initialize states per observation.

    for (uint64_t obs = 0; obs < pomdp.getNrObservations(); ++obs) {

        statesPerObservation.emplace_back();  // TODO Consider using bitvectors instead.

        reachVarExpressionsPerObservation.emplace_back();

    }

    uint64_t state = 0;

    for (auto obs : pomdp.getObservations()) {

        statesPerObservation.at(obs).push_back(state++);

    }

    // Initialize winning region

    std::vector<uint64_t> nrStatesPerObservation;

    for (auto const& states : statesPerObservation) {

        nrStatesPerObservation.push_back(states.size());

    }

    winningRegion = WinningRegion(nrStatesPerObservation);

    if (options.validateResult || options.validateEveryStep) {

        STORM_LOG_WARN("The validator should only be created when the option is set.");

        validator = std::make_shared<WinningRegionQueryInterface<ValueType>>(pomdp, winningRegion);

    }

}


template<typename ValueType>

bool IterativePolicySearch<ValueType>::initialize(uint64_t k) {

    STORM_LOG_INFO("Start intializing solver...");

    bool delayedSwitching = false;  // Notice that delayed switching is currently not compatible with some of the other optimizations and it is unclear which of

                                    // these optimizations causes the problem.

    bool lookaheadConstraintsRequired;

    if (options.forceLookahead) {

        lookaheadConstraintsRequired = true;

    } else {

        lookaheadConstraintsRequired = qualitative::isLookaheadRequired(pomdp, targetStates, surelyReachSinkStates);

    }

    if (options.pathVariableType == MemlessSearchPathVariables::RealRanking) {

        k = 10;  // magic constant, consider moving.

    }


    if (actionSelectionVars.empty()) {

        for (uint64_t obs = 0; obs < pomdp.getNrObservations(); ++obs) {

            actionSelectionVars.push_back(std::vector<storm::expressions::Variable>());

            actionSelectionVarExpressions.push_back(std::vector<storm::expressions::Expression>());

        }

        for (uint64_t stateId = 0; stateId < pomdp.getNumberOfStates(); ++stateId) {

            reachVars.push_back(expressionManager->declareBooleanVariable("C-" + std::to_string(stateId)));

            reachVarExpressions.push_back(reachVars.back().getExpression());

            reachVarExpressionsPerObservation[pomdp.getObservation(stateId)].push_back(reachVarExpressions.back());

            continuationVars.push_back(expressionManager->declareBooleanVariable("D-" + std::to_string(stateId)));

            continuationVarExpressions.push_back(continuationVars.back().getExpression());

        }

        // Create the action selection variables.

        uint64_t obs = 0;

        for (auto const& statesForObservation : statesPerObservation) {

            for (uint64_t a = 0; a < pomdp.getNumberOfChoices(statesForObservation.front()); ++a) {

                std::string varName = "A-" + std::to_string(obs) + "-" + std::to_string(a);

                actionSelectionVars.at(obs).push_back(expressionManager->declareBooleanVariable(varName));

                actionSelectionVarExpressions.at(obs).push_back(actionSelectionVars.at(obs).back().getExpression());

            }

            schedulerVariables.push_back(expressionManager->declareBitVectorVariable("scheduler-obs-" + std::to_string(obs), statesPerObservation.size()));

            schedulerVariableExpressions.push_back(schedulerVariables.back());

            switchVars.push_back(expressionManager->declareBooleanVariable("S-" + std::to_string(obs)));

            switchVarExpressions.push_back(switchVars.back().getExpression());

            observationUpdatedVariables.push_back(expressionManager->declareBooleanVariable("U-" + std::to_string(obs)));

            observationUpdatedExpressions.push_back(observationUpdatedVariables.back().getExpression());

            followVars.push_back(expressionManager->declareBooleanVariable("F-" + std::to_string(obs)));

            followVarExpressions.push_back(followVars.back().getExpression());


            ++obs;

        }


        for (uint64_t stateId = 0; stateId < pomdp.getNumberOfStates(); ++stateId) {

            pathVars.push_back(std::vector<storm::expressions::Variable>());

            pathVarExpressions.push_back(std::vector<storm::expressions::Expression>());

        }

    }


    uint64_t initK = 0;

    if (maxK != std::numeric_limits<uint64_t>::max()) {

        initK = maxK;

    }

    if (initK < k) {

        for (uint64_t stateId = 0; stateId < pomdp.getNumberOfStates(); ++stateId) {

            if (lookaheadConstraintsRequired) {

                if (options.pathVariableType == MemlessSearchPathVariables::BooleanRanking) {

                    for (uint64_t i = initK; i < k; ++i) {

                        pathVars[stateId].push_back(expressionManager->declareBooleanVariable("P-" + std::to_string(stateId) + "-" + std::to_string(i)));

                        pathVarExpressions[stateId].push_back(pathVars[stateId].back().getExpression());

                    }

                } else if (options.pathVariableType == MemlessSearchPathVariables::IntegerRanking) {

                    pathVars[stateId].push_back(expressionManager->declareIntegerVariable("P-" + std::to_string(stateId)));

                    pathVarExpressions[stateId].push_back(pathVars[stateId].back().getExpression());

                } else {

                    assert(options.pathVariableType == MemlessSearchPathVariables::RealRanking);

                    pathVars[stateId].push_back(expressionManager->declareRationalVariable("P-" + std::to_string(stateId)));

                    pathVarExpressions[stateId].push_back(pathVars[stateId].back().getExpression());

                }

            }

        }

    }


    assert(!lookaheadConstraintsRequired || pathVarExpressions.size() == pomdp.getNumberOfStates());

    assert(reachVars.size() == pomdp.getNumberOfStates());

    assert(reachVarExpressions.size() == pomdp.getNumberOfStates());


    uint64_t obs = 0;


    for (auto const& statesForObservation : statesPerObservation) {

        if (pomdp.getNumberOfChoices(statesForObservation.front()) == 1) {

            ++obs;

            continue;

        }

        if (options.onlyDeterministicStrategies || statesForObservation.size() == 1) {

            for (uint64_t a = 0; a < pomdp.getNumberOfChoices(statesForObservation.front()) - 1; ++a) {

                for (uint64_t b = a + 1; b < pomdp.getNumberOfChoices(statesForObservation.front()); ++b) {

                    smtSolver->add(!(actionSelectionVarExpressions[obs][a]) || !(actionSelectionVarExpressions[obs][b]));

                }

            }

        }

        ++obs;

    }


    obs = 0;

    for (auto const& actionVars : actionSelectionVarExpressions) {

        std::vector<storm::expressions::Expression> actExprs = actionVars;

        actExprs.push_back(followVarExpressions[obs]);

        smtSolver->add(storm::expressions::disjunction(actExprs));

        for (auto const& av : actionVars) {

            smtSolver->add(!followVarExpressions[obs] || !av);

        }

        ++obs;

    }


    // Update at least one observation.

    // PAPER COMMENT: 2

    smtSolver->add(storm::expressions::disjunction(observationUpdatedExpressions));


    // PAPER COMMENT: 3

    if (lookaheadConstraintsRequired) {

        if (options.pathVariableType == MemlessSearchPathVariables::BooleanRanking) {

            for (uint64_t state = 0; state < pomdp.getNumberOfStates(); ++state) {

                if (targetStates.get(state)) {

                    smtSolver->add(pathVarExpressions[state][0]);

                } else {

                    smtSolver->add(!pathVarExpressions[state][0] || followVarExpressions[pomdp.getObservation(state)]);

                }

            }

        } else {

            for (uint64_t state = 0; state < pomdp.getNumberOfStates(); ++state) {

                smtSolver->add(pathVarExpressions[state][0] <= expressionManager->integer(k));

                smtSolver->add(pathVarExpressions[state][0] >= expressionManager->integer(0));

            }

        }

    }


    uint64_t rowindex = 0;

    for (uint64_t state = 0; state < pomdp.getNumberOfStates(); ++state) {

        if (targetStates.get(state) || surelyReachSinkStates.get(state)) {

            rowindex += pomdp.getNumberOfChoices(state);

            continue;

        }

        for (uint64_t action = 0; action < pomdp.getNumberOfChoices(state); ++action) {

            std::vector<storm::expressions::Expression> subexprreachSwitch;

            std::vector<storm::expressions::Expression> subexprreachNoSwitch;


            subexprreachSwitch.push_back(!reachVarExpressions[state]);

            subexprreachSwitch.push_back(!actionSelectionVarExpressions[pomdp.getObservation(state)][action]);

            subexprreachSwitch.push_back(!switchVarExpressions[pomdp.getObservation(state)]);

            subexprreachSwitch.push_back(followVarExpressions[pomdp.getObservation(state)]);


            subexprreachNoSwitch.push_back(!reachVarExpressions[state]);

            subexprreachNoSwitch.push_back(!actionSelectionVarExpressions[pomdp.getObservation(state)][action]);

            subexprreachNoSwitch.push_back(switchVarExpressions[pomdp.getObservation(state)]);

            subexprreachNoSwitch.push_back(followVarExpressions[pomdp.getObservation(state)]);


            for (auto const& entries : pomdp.getTransitionMatrix().getRow(rowindex)) {

                if (!delayedSwitching || pomdp.getObservation(entries.getColumn()) != pomdp.getObservation(state)) {

                    subexprreachSwitch.push_back(continuationVarExpressions.at(entries.getColumn()));

                } else {

                    // TODO: This could be the spot where delayed switching is broken.

                    subexprreachSwitch.push_back(reachVarExpressions.at(entries.getColumn()));

                    subexprreachSwitch.push_back(continuationVarExpressions.at(entries.getColumn()));

                }

                smtSolver->add(storm::expressions::disjunction(subexprreachSwitch));

                subexprreachSwitch.pop_back();

                subexprreachNoSwitch.push_back(reachVarExpressions.at(entries.getColumn()));

                smtSolver->add(storm::expressions::disjunction(subexprreachNoSwitch));

                subexprreachNoSwitch.pop_back();

            }

            rowindex++;

        }

    }


    rowindex = 0;

    for (uint64_t state = 0; state < pomdp.getNumberOfStates(); ++state) {

        if (surelyReachSinkStates.get(state)) {

            smtSolver->add(!reachVarExpressions[state]);

            smtSolver->add(!continuationVarExpressions[state]);

            if (lookaheadConstraintsRequired) {

                if (options.pathVariableType == MemlessSearchPathVariables::BooleanRanking) {

                    for (uint64_t j = 1; j < k; ++j) {

                        smtSolver->add(!pathVarExpressions[state][j]);

                    }

                } else {

                    smtSolver->add(pathVarExpressions[state][0] == expressionManager->integer(k));

                }

            }

            rowindex += pomdp.getNumberOfChoices(state);

        } else if (!targetStates.get(state)) {

            if (lookaheadConstraintsRequired) {

                if (options.pathVariableType == MemlessSearchPathVariables::BooleanRanking) {

                    smtSolver->add(storm::expressions::implies(reachVarExpressions.at(state), pathVarExpressions.at(state).back()));

                    std::vector<std::vector<std::vector<storm::expressions::Expression>>> pathsubsubexprs;

                    for (uint64_t j = 1; j < k; ++j) {

                        pathsubsubexprs.push_back(std::vector<std::vector<storm::expressions::Expression>>());

                        for (uint64_t action = 0; action < pomdp.getNumberOfChoices(state); ++action) {

                            pathsubsubexprs.back().push_back(std::vector<storm::expressions::Expression>());

                        }

                    }


                    for (uint64_t action = 0; action < pomdp.getNumberOfChoices(state); ++action) {

                        std::vector<storm::expressions::Expression> subexprreach;

                        for (auto const& entries : pomdp.getTransitionMatrix().getRow(rowindex)) {

                            for (uint64_t j = 1; j < k; ++j) {

                                pathsubsubexprs[j - 1][action].push_back(pathVarExpressions[entries.getColumn()][j - 1]);

                            }

                        }

                        rowindex++;

                    }


                    for (uint64_t j = 1; j < k; ++j) {

                        std::vector<storm::expressions::Expression> pathsubexprs;

                        for (uint64_t action = 0; action < pomdp.getNumberOfChoices(state); ++action) {

                            pathsubexprs.push_back(actionSelectionVarExpressions.at(pomdp.getObservation(state)).at(action) &&

                                                   storm::expressions::disjunction(pathsubsubexprs[j - 1][action]));

                        }

                        if (!delayedSwitching) {

                            pathsubexprs.push_back(switchVarExpressions.at(pomdp.getObservation(state)));

                            pathsubexprs.push_back(followVarExpressions[pomdp.getObservation(state)]);

                        }

                        smtSolver->add(storm::expressions::iff(pathVarExpressions[state][j], storm::expressions::disjunction(pathsubexprs)));

                    }

                } else {

                    std::vector<storm::expressions::Expression> actPathDisjunction;

                    for (uint64_t action = 0; action < pomdp.getNumberOfChoices(state); ++action) {

                        std::vector<storm::expressions::Expression> pathDisjunction;

                        for (auto const& entries : pomdp.getTransitionMatrix().getRow(rowindex)) {

                            pathDisjunction.push_back(pathVarExpressions[entries.getColumn()][0] < pathVarExpressions[state][0]);

                        }

                        actPathDisjunction.push_back(storm::expressions::disjunction(pathDisjunction) &&

                                                     actionSelectionVarExpressions.at(pomdp.getObservation(state)).at(action));

                        rowindex++;

                    }

                    if (!delayedSwitching) {

                        actPathDisjunction.push_back(switchVarExpressions.at(pomdp.getObservation(state)));

                        actPathDisjunction.push_back(followVarExpressions[pomdp.getObservation(state)]);

                    }

                    actPathDisjunction.push_back(!reachVarExpressions[state]);

                    smtSolver->add(storm::expressions::disjunction(actPathDisjunction));

                }

            }

        } else {

            if (lookaheadConstraintsRequired) {

                if (options.pathVariableType == MemlessSearchPathVariables::BooleanRanking) {

                    for (uint64_t j = 1; j < k; ++j) {

                        smtSolver->add(pathVarExpressions[state][j]);

                    }

                } else {

                    smtSolver->add(pathVarExpressions[state][0] == expressionManager->integer(0));

                }

            }

            smtSolver->add(reachVars[state]);

            rowindex += pomdp.getNumberOfChoices(state);

        }

    }


    obs = 0;

    for (auto const& statesForObservation : statesPerObservation) {

        for (auto const& state : statesForObservation) {

            if (!targetStates.get(state)) {

                smtSolver->add(!continuationVars[state] || schedulerVariableExpressions[obs] > 0);

                smtSolver->add(!reachVarExpressions[state] || !followVarExpressions[obs] || schedulerVariableExpressions[obs] > 0);

            }

        }

        ++obs;

    }


    for (uint64_t observation = 0; observation < pomdp.getNrObservations(); ++observation) {

        smtSolver->add(

            storm::expressions::implies(switchVarExpressions[observation], storm::expressions::disjunction(reachVarExpressionsPerObservation[observation])));

    }

    return lookaheadConstraintsRequired;

}


template<typename ValueType>


uint64_t IterativePolicySearch<ValueType>::getOffsetFromObservation(uint64_t state, uint64_t observation) const {

    if (!useFindOffset) {

        STORM_LOG_WARN("This code is slow and should only be used for debugging.");

        useFindOffset = true;

    }

    uint64_t offset = 0;

    for (uint64_t s : statesPerObservation[observation]) {

        if (s == state) {

            return offset;

        }

        ++offset;

    }

    assert(false);  // State should have occured.

    return 0;

}


template<typename ValueType>


bool IterativePolicySearch<ValueType>::analyze(uint64_t k, storm::storage::BitVector const& oneOfTheseStates,

                                               storm::storage::BitVector const& allOfTheseStates) {

    STORM_LOG_DEBUG("Surely reach sink states: " << surelyReachSinkStates);

    STORM_LOG_DEBUG("Target states " << targetStates);

    STORM_LOG_DEBUG("Questionmark states " << (~surelyReachSinkStates & ~targetStates));

    stats.initializeSolverTimer.start();

    // TODO: When do we need to reinitialize? When the solver has been reset.

    bool lookaheadConstraintsRequired = initialize(k);

    if (lookaheadConstraintsRequired) {

        maxK = k;

    }


    stats.winningRegionUpdatesTimer.start();

    storm::storage::BitVector updated(pomdp.getNrObservations());

    storm::storage::BitVector potentialWinner(pomdp.getNrObservations());

    storm::storage::BitVector observationsWithPartialWinners(pomdp.getNrObservations());

    for (uint64_t observation = 0; observation < pomdp.getNrObservations(); ++observation) {

        if (winningRegion.observationIsWinning(observation)) {

            continue;

        }

        bool observationIsWinning = true;

        for (uint64_t state : statesPerObservation[observation]) {

            if (!targetStates.get(state)) {

                observationIsWinning = false;

                observationsWithPartialWinners.set(observation);

            } else {

                potentialWinner.set(observation);

            }

        }

        if (observationIsWinning) {

            STORM_LOG_TRACE("Observation " << observation << " is winning.");

            stats.incrementGraphBasedWinningObservations();

            winningRegion.setObservationIsWinning(observation);

            updated.set(observation);

        }

    }

    STORM_LOG_DEBUG("Graph based winning obs: " << stats.getGraphBasedwinningObservations());

    observationsWithPartialWinners &= potentialWinner;

    for (auto const observation : observationsWithPartialWinners) {

        uint64_t nrStatesForObs = statesPerObservation[observation].size();

        storm::storage::BitVector update(nrStatesForObs);

        for (uint64_t i = 0; i < nrStatesForObs; ++i) {

            uint64_t state = statesPerObservation[observation][i];

            if (targetStates.get(state)) {

                update.set(i);

            }

        }

        assert(!update.empty());

        STORM_LOG_TRACE("Extend winning region for observation " << observation << " with target states/offsets" << update);

        winningRegion.addTargetStates(observation, update);

        assert(winningRegion.query(observation, update));  // "Cannot continue: No scheduler known for state " << i << " (observation " << obs << ").");


        updated.set(observation);

    }


#ifndef NDEBUG

    for (auto const& state : targetStates) {

        STORM_LOG_ASSERT(winningRegion.isWinning(pomdp.getObservation(state), getOffsetFromObservation(state, pomdp.getObservation(state))),

                         "Target state " << state << " , observation " << pomdp.getObservation(state) << " is not reflected as winning.");

    }

#endif


    stats.winningRegionUpdatesTimer.stop();


    uint64_t maximalNrActions = 0;

    for (uint64_t state = 0; state < pomdp.getNumberOfStates(); ++state) {

        maximalNrActions = std::max(pomdp.getTransitionMatrix().getRowGroupSize(state), maximalNrActions);

    }

    std::vector<storm::expressions::Expression> atLeastOneOfStates;

    for (uint64_t state : oneOfTheseStates) {

        STORM_LOG_ASSERT(reachVarExpressions.size() > state, "state id " << state << " exceeds number of states (" << reachVarExpressions.size() << ")");

        atLeastOneOfStates.push_back(reachVarExpressions[state]);

    }

    if (!atLeastOneOfStates.empty()) {

        smtSolver->add(storm::expressions::disjunction(atLeastOneOfStates));

    }


    std::set<storm::expressions::Expression> allOfTheseAssumption;

    std::vector<storm::expressions::Expression> updateForObservationExpressions;


    for (uint64_t state : allOfTheseStates) {

        assert(reachVarExpressions.size() > state);

        allOfTheseAssumption.insert(reachVarExpressions[state]);

    }


    if (winningRegion.empty()) {

        // Keep it simple here to help bughunting if necessary.

        for (uint64_t ob = 0; ob < pomdp.getNrObservations(); ++ob) {

            updateForObservationExpressions.push_back(storm::expressions::disjunction(reachVarExpressionsPerObservation[ob]));

            schedulerForObs.push_back(0);

        }

    } else {

        uint64_t obs = 0;

        for (auto const& statesForObservation : statesPerObservation) {

            schedulerForObs.push_back(0);

            for (auto const& winningSet : winningRegion.getWinningSetsPerObservation(obs)) {

                assert(!winningSet.empty());

                assert(obs < schedulerForObs.size());

                ++(schedulerForObs[obs]);

                auto constant = expressionManager->integer(schedulerForObs[obs]);

                for (auto const& stateOffset : ~winningSet) {

                    uint64_t state = statesForObservation[stateOffset];

                    STORM_LOG_TRACE("State " << state << " with observation " << obs << " does not allow scheduler " << constant);

                    smtSolver->add(!(continuationVarExpressions[state] && (schedulerVariableExpressions[obs] == constant)));

                    smtSolver->add(

                        !(reachVarExpressions[state] && followVarExpressions[pomdp.getObservation(state)] && (schedulerVariableExpressions[obs] == constant)));

                }

            }

            if (winningRegion.getWinningSetsPerObservation(obs).empty()) {

                updateForObservationExpressions.push_back(storm::expressions::disjunction(reachVarExpressionsPerObservation[obs]));

                // Here is some opportunity for further constraints,

                // but one has to be careful that the constraints added here are never removed (the push happens after adding these constraints)

            } else {

                updateForObservationExpressions.push_back(winningRegion.extensionExpression(obs, reachVarExpressionsPerObservation[obs]));

            }

            ++obs;

        }

    }


    smtSolver->push();

    for (uint64_t obs = 0; obs < pomdp.getNrObservations(); ++obs) {

        auto constant = expressionManager->integer(schedulerForObs[obs]);

        smtSolver->add(schedulerVariableExpressions[obs] <= constant);

        smtSolver->add(storm::expressions::iff(observationUpdatedExpressions[obs], updateForObservationExpressions[obs]));

    }


    assert(pomdp.getNrObservations() == schedulerForObs.size());


    InternalObservationScheduler scheduler;

    scheduler.switchObservations = storm::storage::BitVector(pomdp.getNrObservations());

    storm::storage::BitVector newObservations(pomdp.getNrObservations());

    storm::storage::BitVector newObservationsAfterSwitch(pomdp.getNrObservations());

    storm::storage::BitVector observations(pomdp.getNrObservations());

    storm::storage::BitVector observationsAfterSwitch(pomdp.getNrObservations());

    storm::storage::BitVector observationUpdated(pomdp.getNrObservations());

    storm::storage::BitVector uncoveredStates(pomdp.getNumberOfStates());

    storm::storage::BitVector coveredStates(pomdp.getNumberOfStates());

    storm::storage::BitVector coveredStatesAfterSwitch(pomdp.getNumberOfStates());


    stats.initializeSolverTimer.stop();

    STORM_LOG_INFO("Start iterative solver...");


    uint64_t iterations = 0;


    bool foundWhatWeLookFor = false;

    while (true) {

        stats.incrementOuterIterations();

        // TODO consider what we really want to store about the schedulers.

        scheduler.reset(pomdp.getNrObservations(), maximalNrActions);

        observations.clear();

        observationsAfterSwitch.clear();

        coveredStates = targetStates;

        coveredStatesAfterSwitch.clear();

        observationUpdated.clear();

        bool newSchedulerDiscovered = false;

        if (!allOfTheseAssumption.empty()) {

            ++iterations;

            bool foundResult = this->smtCheck(iterations, allOfTheseAssumption);

            if (foundResult) {

                // Consider storing the scheduler

                foundWhatWeLookFor = true;

            }

        }

        uint64_t localIterations = 0;

        while (true) {

            ++iterations;

            ++localIterations;


            bool foundScheduler = foundWhatWeLookFor;

            if (!foundScheduler) {

                foundScheduler = this->smtCheck(iterations);

            }

            if (!foundScheduler) {

                break;

            }

            newSchedulerDiscovered = true;

            stats.evaluateExtensionSolverTime.start();

            auto const& model = smtSolver->getModel();


            newObservationsAfterSwitch.clear();

            newObservations.clear();


            uint64_t obs = 0;

            for (auto const& ov : observationUpdatedVariables) {

                if (!observationUpdated.get(obs) && model->getBooleanValue(ov)) {

                    STORM_LOG_TRACE("New observation updated: " << obs);

                    observationUpdated.set(obs);

                }

                obs++;

            }


            uncoveredStates = ~coveredStates;

            for (uint64_t i : uncoveredStates) {

                auto const& rv = reachVars[i];

                auto const& rvExpr = reachVarExpressions[i];

                if (observationUpdated.get(pomdp.getObservation(i)) && model->getBooleanValue(rv)) {

                    STORM_LOG_TRACE("New state: " << i);

                    smtSolver->add(rvExpr);

                    assert(!surelyReachSinkStates.get(i));

                    newObservations.set(pomdp.getObservation(i));

                    coveredStates.set(i);

                    if (lookaheadConstraintsRequired) {

                        if (options.pathVariableType == MemlessSearchPathVariables::IntegerRanking) {

                            smtSolver->add(pathVarExpressions[i][0] == expressionManager->integer(model->getIntegerValue(pathVars[i][0])));

                        } else if (options.pathVariableType == MemlessSearchPathVariables::RealRanking) {

                            smtSolver->add(pathVarExpressions[i][0] == expressionManager->rational(model->getRationalValue(pathVars[i][0])));

                        }

                    }

                }

            }


            storm::storage::BitVector uncoveredStatesAfterSwitch(~coveredStatesAfterSwitch);

            for (uint64_t i : uncoveredStatesAfterSwitch) {

                auto const& cv = continuationVars[i];

                if (model->getBooleanValue(cv)) {

                    uint64_t obs = pomdp.getObservation(i);

                    STORM_LOG_ASSERT(winningRegion.isWinning(obs, getOffsetFromObservation(i, obs)),

                                     "Cannot continue: No scheduler known for state " << i << " (observation " << obs << ").");

                    auto const& cvExpr = continuationVarExpressions[i];

                    smtSolver->add(cvExpr);

                    if (!observationsAfterSwitch.get(obs)) {

                        newObservationsAfterSwitch.set(obs);

                    }

                }

            }

            stats.evaluateExtensionSolverTime.stop();


            if (options.computeTraceOutput()) {

                detail::printRelevantInfoFromModel(model, reachVars, continuationVars);

            }

            stats.encodeExtensionSolverTime.start();

            for (auto obs : newObservations) {

                auto const& actionSelectionVarsForObs = actionSelectionVars[obs];

                observations.set(obs);

                for (uint64_t act = 0; act < actionSelectionVarsForObs.size(); ++act) {

                    if (model->getBooleanValue(actionSelectionVarsForObs[act])) {

                        scheduler.actions[obs].set(act);

                        smtSolver->add(actionSelectionVarExpressions[obs][act]);

                    } else {

                        smtSolver->add(!actionSelectionVarExpressions[obs][act]);

                    }

                }

                if (model->getBooleanValue(switchVars[obs])) {

                    scheduler.switchObservations.set(obs);

                    smtSolver->add(switchVarExpressions[obs]);

                } else {

                    smtSolver->add(!switchVarExpressions[obs]);

                }

                if (model->getBooleanValue(followVars[obs])) {

                    smtSolver->add(followVarExpressions[obs]);

                } else {

                    smtSolver->add(!followVarExpressions[obs]);

                }

            }

            for (auto obs : newObservationsAfterSwitch) {

                observationsAfterSwitch.set(obs);

                scheduler.schedulerRef[obs] = model->getIntegerValue(schedulerVariables[obs]);

                smtSolver->add(schedulerVariableExpressions[obs] == expressionManager->integer(scheduler.schedulerRef[obs]));

            }


            if (options.computeTraceOutput()) {

                // generates debug output, but here we only want it for trace level.

                // For consistency, all output on debug level.

                STORM_LOG_DEBUG("the scheduler so far: ");

                scheduler.printForObservations(observations, observationsAfterSwitch);

            }


            if (foundWhatWeLookFor ||

                (options.localIterationMaximum > 0 && (localIterations % (options.localIterationMaximum + 1) == options.localIterationMaximum))) {

                stats.encodeExtensionSolverTime.stop();

                break;

            }


            std::vector<storm::expressions::Expression> remainingExpressions;

            for (auto index : ~coveredStates) {

                if (observationUpdated.get(pomdp.getObservation(index))) {

                    remainingExpressions.push_back(reachVarExpressions[index]);

                }

            }

            for (auto index : ~observationUpdated) {

                remainingExpressions.push_back(observationUpdatedExpressions[index]);

            }


            if (remainingExpressions.empty()) {

                stats.encodeExtensionSolverTime.stop();

                break;

            }

            smtSolver->add(storm::expressions::disjunction(remainingExpressions));

            stats.encodeExtensionSolverTime.stop();

            // smtSolver->setTimeout(options.extensionCallTimeout);

        }

        if (!newSchedulerDiscovered) {

            break;

        }

        // smtSolver->unsetTimeout();

        smtSolver->pop();


        if (options.computeDebugOutput()) {

            std::stringstream strstr;

            coveredStatesToStream(strstr, ~coveredStates);

            STORM_LOG_DEBUG(strstr.str());

            // generates info output, but here we only want it for debug level.

            // For consistency, all output on info level.

            STORM_LOG_DEBUG("the scheduler: ");

            scheduler.printForObservations(observations, observationsAfterSwitch);

        }


        stats.winningRegionUpdatesTimer.start();

        storm::storage::BitVector updated(observations.size());

        uint64_t newTargetObservations = 0;

        for (uint64_t observation = 0; observation < pomdp.getNrObservations(); ++observation) {

            STORM_LOG_TRACE("consider observation " << observation);

            storm::storage::BitVector update(statesPerObservation[observation].size());

            uint64_t i = 0;

            for (uint64_t state : statesPerObservation[observation]) {

                if (coveredStates.get(state)) {

                    assert(!surelyReachSinkStates.get(state));

                    update.set(i);

                }

                ++i;

            }

            if (!update.empty()) {

                STORM_LOG_TRACE("Update Winning Region: Observation " << observation << " with update " << update);

                bool updateResult = winningRegion.update(observation, update);

                STORM_LOG_TRACE("Region changed:" << updateResult);

                if (updateResult) {

                    if (winningRegion.observationIsWinning(observation)) {

                        ++newTargetObservations;

                        for (uint64_t state : statesPerObservation[observation]) {

                            targetStates.set(state);

                            assert(!surelyReachSinkStates.get(state));

                        }

                    }

                    updated.set(observation);

                    updateForObservationExpressions[observation] =

                        winningRegion.extensionExpression(observation, reachVarExpressionsPerObservation[observation]);

                }

            }

        }

        stats.winningRegionUpdatesTimer.stop();

        if (foundWhatWeLookFor) {

            return true;

        }

        if (newTargetObservations > 0) {

            stats.graphSearchTime.start();

            storm::analysis::QualitativeAnalysisOnGraphs<ValueType> graphanalysis(pomdp);

            uint64_t targetStatesBefore = targetStates.getNumberOfSetBits();

            STORM_LOG_DEBUG("Target states before graph based analysis " << targetStates.getNumberOfSetBits());

            targetStates = graphanalysis.analyseProb1Max(~surelyReachSinkStates, targetStates);

            uint64_t targetStatesAfter = targetStates.getNumberOfSetBits();

            STORM_LOG_DEBUG("Target states after graph based analysis " << targetStates.getNumberOfSetBits());

            stats.graphSearchTime.stop();

            if (targetStatesAfter - targetStatesBefore > 0) {

                stats.winningRegionUpdatesTimer.start();

                storm::storage::BitVector potentialWinner(pomdp.getNrObservations());

                storm::storage::BitVector observationsWithPartialWinners(pomdp.getNrObservations());

                for (uint64_t observation = 0; observation < pomdp.getNrObservations(); ++observation) {

                    if (winningRegion.observationIsWinning(observation)) {

                        continue;

                    }

                    bool observationIsWinning = true;

                    for (uint64_t state : statesPerObservation[observation]) {

                        if (!targetStates.get(state)) {

                            observationIsWinning = false;

                            observationsWithPartialWinners.set(observation);

                        } else {

                            potentialWinner.set(observation);

                        }

                    }

                    if (observationIsWinning) {

                        stats.incrementGraphBasedWinningObservations();

                        winningRegion.setObservationIsWinning(observation);

                        updated.set(observation);

                    }

                }

                STORM_LOG_DEBUG("Graph-based winning obs: " << stats.getGraphBasedwinningObservations());

                observationsWithPartialWinners &= potentialWinner;

                for (auto const observation : observationsWithPartialWinners) {

                    uint64_t nrStatesForObs = statesPerObservation[observation].size();

                    storm::storage::BitVector update(nrStatesForObs);

                    for (uint64_t i = 0; i < nrStatesForObs; ++i) {

                        uint64_t state = statesPerObservation[observation][i];

                        if (targetStates.get(state)) {

                            update.set(i);

                        }

                    }

                    assert(!update.empty());

                    STORM_LOG_TRACE("Extend winning region for observation " << observation << " with target states/offsets" << update);

                    winningRegion.addTargetStates(observation, update);

                    assert(winningRegion.query(observation, update));  //

                    updated.set(observation);

                }

                stats.winningRegionUpdatesTimer.stop();


                if (observationsWithPartialWinners.getNumberOfSetBits() > 0) {

                    reset();

                    return analyze(k, ~targetStates & ~surelyReachSinkStates, allOfTheseStates);

                }

            }

        }

        STORM_LOG_ASSERT(!updated.empty(), "The strategy should be new in at least one place");

        if (options.computeDebugOutput()) {

            winningRegion.print();

        }

        if (options.validateEveryStep) {

            STORM_LOG_WARN("Validating every step, for debug purposes only!");

            validator->validate();

        }

        if (stats.getIterations() % options.restartAfterNIterations == options.restartAfterNIterations - 1) {

            reset();

            return analyze(k, ~targetStates & ~surelyReachSinkStates, allOfTheseStates);

        }

        stats.updateNewStrategySolverTime.start();

        for (uint64_t observation : updated) {

            updateForObservationExpressions[observation] = winningRegion.extensionExpression(observation, reachVarExpressionsPerObservation[observation]);

        }


        uint64_t obs = 0;

        for (auto const& statesForObservation : statesPerObservation) {

            if (observations.get(obs) && updated.get(obs)) {

                STORM_LOG_DEBUG("We have a new policy ( " << finalSchedulers.size() << " ) for states with observation " << obs << ".");

                assert(schedulerForObs.size() > obs);

                (schedulerForObs[obs])++;

                STORM_LOG_DEBUG("We now have " << schedulerForObs[obs] << " policies for states with observation " << obs);

                if (winningRegion.observationIsWinning(obs)) {

                    for (auto const& state : statesForObservation) {

                        smtSolver->add(reachVarExpressions[state]);

                    }

                    auto constant = expressionManager->integer(schedulerForObs[obs]);

                    smtSolver->add(schedulerVariableExpressions[obs] == constant);

                } else {

                    auto constant = expressionManager->integer(schedulerForObs[obs]);

                    for (auto const& state : statesForObservation) {

                        if (!coveredStates.get(state)) {

                            smtSolver->add(!(continuationVarExpressions[state] && (schedulerVariableExpressions[obs] == constant)));

                            smtSolver->add(!(reachVarExpressions[state] && followVarExpressions[pomdp.getObservation(state)] &&

                                             (schedulerVariableExpressions[obs] == constant)));

                        }

                    }

                }

            }

            ++obs;

        }

        finalSchedulers.push_back(scheduler);


        smtSolver->push();


        for (uint64_t obs = 0; obs < pomdp.getNrObservations(); ++obs) {

            if (winningRegion.observationIsWinning(obs)) {

                auto constant = expressionManager->integer(schedulerForObs[obs]);

                // Scheduler variable is already fixed.

                // Observation will not be updated.

                smtSolver->add(!observationUpdatedExpressions[obs]);

            } else {

                auto constant = expressionManager->integer(schedulerForObs[obs]);

                smtSolver->add(schedulerVariableExpressions[obs] <= constant);

                smtSolver->add(storm::expressions::iff(observationUpdatedExpressions[obs], updateForObservationExpressions[obs]));

            }

        }

        stats.updateNewStrategySolverTime.stop();


        STORM_LOG_INFO("... after iteration " << stats.getIterations() << " so far " << stats.getChecks() << " checks.");

    }

    if (options.validateResult) {

        STORM_LOG_WARN("Validating result is a winning region, only for debugging purposes.");

        validator->validate();

        STORM_LOG_WARN("Validating result is a fixed point, only for debugging purposes.");

        validator->validateIsMaximal(surelyReachSinkStates);

    }


    if (!allOfTheseStates.empty()) {

        for (uint64_t observation = 0; observation < pomdp.getNrObservations(); ++observation) {

            storm::storage::BitVector check(statesPerObservation[observation].size());

            uint64_t i = 0;

            for (uint64_t state : statesPerObservation[observation]) {

                if (allOfTheseStates.get(state)) {

                    check.set(i);

                }

                ++i;

            }

            if (!winningRegion.query(observation, check)) {

                return false;

            }

        }

    }

    return true;

}


template<typename ValueType>

void IterativePolicySearch<ValueType>::coveredStatesToStream(std::ostream& os, storm::storage::BitVector const& remaining) const {

    bool first = true;

    for (uint64_t state = 0; state < pomdp.getNumberOfStates(); ++state) {

        if (!remaining.get(state)) {

            if (first) {

                first = false;

            } else {

                os << ", ";

            }

            std::cout << state;

            if (pomdp.hasStateValuations()) {

                os << ":" << pomdp.getStateValuations().getStateInfo(state);

            }

        }

    }

    os << '\n';

}


template<typename ValueType>

void IterativePolicySearch<ValueType>::printScheduler(std::vector<InternalObservationScheduler> const&) {}


template<typename ValueType>

void IterativePolicySearch<ValueType>::finalizeStatistics() {}


template<typename ValueType>


typename IterativePolicySearch<ValueType>::Statistics const& IterativePolicySearch<ValueType>::getStatistics() const {

    return stats;

}


template<typename ValueType>

bool IterativePolicySearch<ValueType>::smtCheck(uint64_t iteration, std::set<storm::expressions::Expression> const& assumptions) {

    if (options.isExportSATSet()) {

        STORM_LOG_DEBUG("Export SMT Solver Call (" << iteration << ")");

        std::string filepath = options.getExportSATCallsPath() + "call_" + std::to_string(iteration) + ".smt2";

        std::ofstream filestream;

        storm::io::openFile(filepath, filestream);

        filestream << smtSolver->getSmtLibString() << '\n';

        storm::io::closeFile(filestream);

    }


    STORM_LOG_DEBUG("Call to SMT Solver (" << iteration << ")");

    storm::solver::SmtSolver::CheckResult result;

    stats.smtCheckTimer.start();

    if (assumptions.empty()) {

        result = smtSolver->check();

    } else {

        result = smtSolver->checkWithAssumptions(assumptions);

    }

    stats.smtCheckTimer.stop();

    stats.incrementSmtChecks();


    if (result == storm::solver::SmtSolver::CheckResult::Unknown) {

        STORM_LOG_DEBUG("Unknown");

        return false;

    } else if (result == storm::solver::SmtSolver::CheckResult::Unsat) {

        STORM_LOG_DEBUG("Unsatisfiable!");

        return false;

    }


    STORM_LOG_TRACE("Satisfying assignment: ");

    STORM_LOG_TRACE(smtSolver->getModelAsValuation().toString(true));

    return true;

}


template class IterativePolicySearch<double>;

template class IterativePolicySearch<storm::RationalNumber>;

}  // namespace storm::pomdp

IterativePolicySearch.h

OneShotPolicySearch.h

QualitativeAnalysis.h

QualitativeAnalysisOnGraphs.h

storm::analysis::QualitativeAnalysisOnGraphs
Definition QualitativeAnalysisOnGraphs.h:10

storm::analysis::QualitativeAnalysisOnGraphs::analyseProb1Max
storm::storage::BitVector analyseProb1Max(storm::storage::BitVector const &okay, storm::storage::BitVector const &target) const
Definition QualitativeAnalysisOnGraphs.cpp:95

storm::models::sparse::Pomdp
This class represents a partially observable Markov decision process.
Definition Pomdp.h:13

storm::models::sparse::Pomdp::getNrObservations
uint64_t getNrObservations() const
Definition Pomdp.cpp:70

storm::models::sparse::Pomdp::getObservations
std::vector< uint32_t > const & getObservations() const
Definition Pomdp.cpp:91

storm::pomdp::IterativePolicySearch::Statistics
Definition IterativePolicySearch.h:116

storm::pomdp::IterativePolicySearch::Statistics::updateNewStrategySolverTime
storm::utility::Stopwatch updateNewStrategySolverTime
Definition IterativePolicySearch.h:126

storm::pomdp::IterativePolicySearch::Statistics::initializeSolverTimer
storm::utility::Stopwatch initializeSolverTimer
Definition IterativePolicySearch.h:123

storm::pomdp::IterativePolicySearch::Statistics::smtCheckTimer
storm::utility::Stopwatch smtCheckTimer
Definition IterativePolicySearch.h:122

storm::pomdp::IterativePolicySearch::Statistics::print
void print() const
Definition IterativePolicySearch.cpp:36

storm::pomdp::IterativePolicySearch::Statistics::evaluateExtensionSolverTime
storm::utility::Stopwatch evaluateExtensionSolverTime
Definition IterativePolicySearch.h:124

storm::pomdp::IterativePolicySearch::Statistics::graphSearchTime
storm::utility::Stopwatch graphSearchTime
Definition IterativePolicySearch.h:127

storm::pomdp::IterativePolicySearch::Statistics::encodeExtensionSolverTime
storm::utility::Stopwatch encodeExtensionSolverTime
Definition IterativePolicySearch.h:125

storm::pomdp::IterativePolicySearch::Statistics::winningRegionUpdatesTimer
storm::utility::Stopwatch winningRegionUpdatesTimer
Definition IterativePolicySearch.h:129

storm::pomdp::IterativePolicySearch::Statistics::totalTimer
storm::utility::Stopwatch totalTimer
Definition IterativePolicySearch.h:121

storm::pomdp::IterativePolicySearch
Definition IterativePolicySearch.h:112

storm::pomdp::IterativePolicySearch::getOffsetFromObservation
uint64_t getOffsetFromObservation(uint64_t state, uint64_t observation) const
Definition IterativePolicySearch.cpp:349

storm::pomdp::IterativePolicySearch::getStatistics
Statistics const & getStatistics() const
Definition IterativePolicySearch.cpp:880

storm::pomdp::IterativePolicySearch::finalizeStatistics
void finalizeStatistics()
Definition IterativePolicySearch.cpp:877

storm::pomdp::IterativePolicySearch::IterativePolicySearch
IterativePolicySearch(storm::models::sparse::Pomdp< ValueType > const &pomdp, storm::storage::BitVector const &targetStates, storm::storage::BitVector const &surelyReachSinkStates, std::shared_ptr< storm::utility::solver::SmtSolverFactory > &smtSolverFactory, MemlessSearchOptions const &options)
Definition IterativePolicySearch.cpp:50

storm::pomdp::IterativePolicySearch::analyze
bool analyze(uint64_t k, storm::storage::BitVector const &oneOfTheseStates, storm::storage::BitVector const &allOfTheseStates=storm::storage::BitVector())
Definition IterativePolicySearch.cpp:366

storm::pomdp::MemlessSearchOptions
Definition IterativePolicySearch.h:29

storm::pomdp::MemlessSearchOptions::validateEveryStep
bool validateEveryStep
Definition IterativePolicySearch.h:61

storm::pomdp::MemlessSearchOptions::validateResult
bool validateResult
Definition IterativePolicySearch.h:62

storm::pomdp::WinningRegion
Definition WinningRegion.h:13

storm::solver::SmtSolver::CheckResult
CheckResult
possible check results
Definition SmtSolver.h:25

storm::solver::SmtSolver::CheckResult::Unknown
@ Unknown

storm::solver::SmtSolver::CheckResult::Unsat
@ Unsat

storm::storage::BitVector
A bit vector that is internally represented as a vector of 64-bit values.
Definition BitVector.h:16

storm::storage::BitVector::empty
bool empty() const
Retrieves whether no bits are set to true in this bit vector.
Definition BitVector.cpp:654

storm::storage::BitVector::clear
void clear()
Removes all set bits from the bit vector.
Definition BitVector.cpp:680

storm::storage::BitVector::getNumberOfSetBits
uint64_t getNumberOfSetBits() const
Returns the number of bits that are set to true in this bit vector.
Definition BitVector.cpp:689

storm::storage::BitVector::set
void set(uint64_t index, bool value=true)
Sets the given truth value at the given index.
Definition BitVector.cpp:242

storm::storage::BitVector::size
size_t size() const
Retrieves the number of bits this bit vector can store.
Definition BitVector.cpp:731

storm::storage::BitVector::get
bool get(uint64_t index) const
Retrieves the truth value of the bit at the given index and performs a bound check.
Definition BitVector.cpp:267

file.h

STORM_LOG_INFO
#define STORM_LOG_INFO(message)
Definition logging.h:24

STORM_LOG_WARN
#define STORM_LOG_WARN(message)
Definition logging.h:25

STORM_LOG_DEBUG
#define STORM_LOG_DEBUG(message)
Definition logging.h:18

STORM_LOG_TRACE
#define STORM_LOG_TRACE(message)
Definition logging.h:12

STORM_LOG_ASSERT
#define STORM_LOG_ASSERT(cond, message)
Definition macros.h:11

STORM_PRINT_AND_LOG
#define STORM_PRINT_AND_LOG(message)
Definition macros.h:68

storm::expressions::iff
Expression iff(Expression const &first, Expression const &second)
Definition Expression.cpp:440

storm::expressions::disjunction
Expression disjunction(std::vector< storm::expressions::Expression > const &expressions)
Definition Expression.cpp:528

storm::expressions::implies
Expression implies(Expression const &first, Expression const &second)
Definition Expression.cpp:433

storm::io::closeFile
void closeFile(std::ofstream &stream)
Close the given file after writing.
Definition file.h:47

storm::io::openFile
void openFile(std::string const &filepath, std::ofstream &filestream, bool append=false, bool silent=false)
Open the given file for writing.
Definition file.h:18

storm::pomdp::detail::printRelevantInfoFromModel
void printRelevantInfoFromModel(std::shared_ptr< storm::solver::SmtSolver::ModelReference > const &model, std::vector< storm::expressions::Variable > const &reachVars, std::vector< storm::expressions::Variable > const &continuationVars)
Definition IterativePolicySearch.cpp:10

storm::pomdp::qualitative::isLookaheadRequired
bool isLookaheadRequired(storm::models::sparse::Pomdp< ValueType > const &pomdp, storm::storage::BitVector const &targetStates, storm::storage::BitVector const &surelyReachSinkStates)
Definition QualitativeAnalysis.h:10

storm::pomdp
Definition BeliefExplorationSettings.h:11

storm::pomdp::MemlessSearchPathVariables::RealRanking
@ RealRanking

storm::pomdp::MemlessSearchPathVariables::IntegerRanking
@ IntegerRanking

storm::pomdp::MemlessSearchPathVariables::BooleanRanking
@ BooleanRanking

storm::storage::i
int i
Definition BitVector.cpp:1219

storm::pomdp::InternalObservationScheduler
Definition IterativePolicySearch.h:73

storm::pomdp::InternalObservationScheduler::actions
std::vector< storm::storage::BitVector > actions
Definition IterativePolicySearch.h:74

storm::pomdp::InternalObservationScheduler::printForObservations
void printForObservations(storm::storage::BitVector const &observations, storm::storage::BitVector const &observationsAfterSwitch) const
Definition IterativePolicySearch.h:88

storm::pomdp::InternalObservationScheduler::schedulerRef
std::vector< uint64_t > schedulerRef
Definition IterativePolicySearch.h:75

storm::pomdp::InternalObservationScheduler::reset
void reset(uint64_t nrObservations, uint64_t nrActions)
Definition IterativePolicySearch.h:78

storm::pomdp::InternalObservationScheduler::switchObservations
storm::storage::BitVector switchObservations
Definition IterativePolicySearch.h:76