Als «markov-process» getaggte Fragen

13

Warum gibt es immer mindestens eine Richtlinie, die besser oder gleich allen anderen Richtlinien ist?

Reinforcement Learning: Eine Einführung. Zweite Auflage, in Bearbeitung . Richard S. Sutton und Andrew G. Barto (c) 2012, S. 67-68. Das Lösen einer Bestärkungslernaufgabe bedeutet ungefähr, eine Politik zu finden, die auf lange Sicht eine Menge Belohnung bringt. Für endliche MDPs können wir eine...

markov-process reinforcement-learning

13

Numerische Löser für stochastische Differentialgleichungen in R: Gibt es welche?

Ich suche ein allgemeines, sauberes und schnelles (dh unter Verwendung von C ++ - Routinen) R-Paket zum Simulieren von Pfaden aus einer nicht homogenen nichtlinearen Diffusion wie (1) unter Verwendung des Euler-Maruyama-Schemas, des Milstein-Schemas (oder eines anderen). Dies ist dazu bestimmt, in...

r simulation stochastic-processes markov-process

12

Wie sehen Sie, dass eine Markov-Kette nicht reduzierbar ist?

Ich habe einige Probleme, die Markov-Ketteneigenschaft nicht reduzierbar zu verstehen . Irreduzibel soll bedeuten, dass der stochastische Prozess "von jedem Zustand in jeden Zustand übergehen kann". Aber was definiert, ob es von Zustand zu Zustand j gehen kann oder nicht?ichiijjj Die...

stochastic-processes markov-process

12

Schätzung der Markov-Kettenwahrscheinlichkeiten

Wie würde man die MC-Übergangsmatrix in Anbetracht der Zeitreihen üblicherweise schätzen? Gibt es dafür eine

markov-process

11

Test auf Markov-Eigenschaft in einer Zeitreihe

Bei einer (beobachteten) Zeitreihe mit gibt es einen statistischen Test zum Testen der Nullhypothese, dass P (X_t | X_ {t-1}, X_ { t-2}, ..., X_1) = P (X_t | X_ {t-1}) (dh die

time-series hypothesis-testing markov-process

11

Konfidenzintervalle für Zeitreihendifferenzen

Ich habe ein stochastisches Modell, das verwendet wird, um Zeitreihen eines Prozesses zu simulieren. Ich interessiere mich für den Effekt der Änderung eines Parameters auf einen bestimmten Wert und möchte den Unterschied zwischen der Zeitreihe (z. B. Modell A und Modell B) und einer Art...

time-series predictive-models markov-process

11

Ergibt eine MCMC, die eine detaillierte Bilanz erfüllt, eine stationäre Verteilung?

Ich denke, ich verstehe die Gleichung der detaillierten Gleichgewichtsbedingung, die besagt, dass für die Übergangswahrscheinlichkeit und die stationäre Verteilung π eine Markov-Kette ein detailliertes Gleichgewicht erfüllt, wenn q ( x | y ) π ( y ) = q ( y | x ) π ( x ) ,qqqππ\piq( x | y) π( y) =...

probability mcmc markov-process

11

Mathematische Modellierung neuronaler Netze als grafische Modelle

Ich habe Mühe, die mathematische Verbindung zwischen einem neuronalen Netzwerk und einem grafischen Modell herzustellen. In grafischen Modellen ist die Idee einfach: Die Wahrscheinlichkeitsverteilung wird gemäß den Cliquen in der Grafik faktorisiert, wobei die Potentiale normalerweise aus der...

neural-networks markov-process graphical-model deep-learning deep-belief-networks

11

Wie sollte man sich dem Projekt Euler-Problem 213 („Flohzirkus“) nähern?

Ich möchte Project Euler 213 lösen , weiß aber nicht, wo ich anfangen soll, da ich ein Laie auf dem Gebiet der Statistik bin. Beachten Sie, dass eine genaue Antwort erforderlich ist, damit die Monte-Carlo-Methode nicht funktioniert. Können Sie mir einige statistische Themen empfehlen, die ich...

self-study monte-carlo markov-process

10

Erstellen Sie einen Pfadwahrscheinlichkeitsbaum für Reisen durch eine Website

Ich mache derzeit eine Analyse auf einer Website, für die ich ein Entscheidungsbaumdiagramm erstellen muss, das den wahrscheinlichen Weg zeigt, den Menschen bei jeder Ankunft auf der Website einschlagen. Ich habe es mit einem zu tun, data.frameder die Wege aller Kunden zur Site zeigt, beginnend von...

r probability data-visualization markov-process

10

Die erwartete Anzahl von Münzwürfen wird N in Folge erhalten, wenn M in Folge gegeben wird

Interviewstreet hatte im Januar ihren zweiten CodeSprint, der die folgende Frage enthielt. Die programmatische Antwort wird veröffentlicht, enthält jedoch keine statistische Erklärung. (Sie können das ursprüngliche Problem und die veröffentlichte Lösung anzeigen, indem Sie sich mit Google Creds auf...

probability stochastic-processes markov-process

10

Warum haben Anova () und drop1 () unterschiedliche Antworten für GLMMs geliefert?

Ich habe ein GLMM der Form: lmer(present? ~ factor1 + factor2 + continuous + factor1*continuous + (1 | factor3), family=binomial) Wenn ich benutze drop1(model, test="Chi"), erhalte ich andere Ergebnisse als wenn ich Anova(model, type="III")aus dem Autopaket oder benutze summary(model). Diese...

r anova glmm r mixed-model bootstrap sample-size cross-validation roc auc sampling stratification random-allocation logistic stata interpretation proportion r regression multiple-regression linear-model lm r cross-validation cart rpart logistic generalized-linear-model econometrics experiment-design causality instrumental-variables random-allocation predictive-models data-mining estimation contingency-tables epidemiology standard-deviation mean ancova psychology statistical-significance cross-validation synthetic-data poisson-distribution negative-binomial bioinformatics sequence-analysis distributions binomial classification k-means distance unsupervised-learning euclidean correlation chi-squared spearman-rho forecasting excel exponential-smoothing binomial sample-size r change-point wilcoxon-signed-rank ranks clustering matlab covariance covariance-matrix normal-distribution simulation random-generation bivariate standardization confounding z-statistic forecasting arima minitab poisson-distribution negative-binomial poisson-regression overdispersion probability self-study markov-process estimation maximum-likelihood classification pca group-differences chi-squared survival missing-data contingency-tables anova proportion

10

Versteckte Markov-Modelle und Erwartungsmaximierungsalgorithmus

Kann jemand klären, wie versteckte Markov-Modelle mit der Maximierung der Erwartungen zusammenhängen? Ich habe viele Links durchgesehen, konnte aber keine klare Sicht finden. Vielen

markov-process expectation-maximization hidden-markov-model

10

Bewertung von Clustern von Markov-Ketten erster Ordnung

Ich habe meinen Datensatz mit mehreren tausend Markov-Ketten erster Ordnung in etwa 10 Cluster zusammengefasst. Gibt es eine empfohlene Methode, wie ich diese Cluster bewerten und herausfinden kann, was die Elemente in den Clustern gemeinsam haben und wie sie sich von anderen Clustern...

data-visualization clustering markov-process

10

Markov-Modelle mit bedingten Übergangswahrscheinlichkeiten

Lassen Sie mich zunächst einmal anerkennen, dass ich mich in Statistik und Mathematik nicht so gut auskenne, wie ich es gerne wäre. Einige könnten sagen, dass sie gerade genug Wissen haben, um gefährlich zu sein. : DI entschuldige mich, wenn ich die Terminologie nicht richtig verwende. Ich...

markov-process conditional-probability

10

Anzahl der Markov-Ketten-Monte-Carlo-Proben

Es gibt eine Menge Literatur über die Konvergenzdiagnostik der Markov-Kette Monte Carlo (MCMC), einschließlich der beliebtesten Gelman-Rubin-Diagnostik. Alle diese bewerten jedoch die Konvergenz der Markov-Kette und befassen sich damit mit der Frage des Einbrennens. Wie soll ich nach dem Burn-In...

sample-size mcmc monte-carlo markov-process

10

R lineare Regression kategoriale Variable "versteckter" Wert

Dies ist nur ein Beispiel, auf das ich mehrmals gestoßen bin, daher habe ich keine Beispieldaten. Ausführen eines linearen Regressionsmodells in R: a.lm = lm(Y ~ x1 + x2) x1ist eine stetige Variable. x2ist kategorisch und hat drei Werte, z. B. "Niedrig", "Mittel" und "Hoch". Die von R gegebene...

r regression categorical-data regression-coefficients categorical-encoding machine-learning random-forest anova spss r self-study bootstrap monte-carlo r multiple-regression partitioning neural-networks normalization machine-learning svm kernel-trick self-study survival cox-model repeated-measures survey likert correlation variance sampling meta-analysis anova independence sample assumptions bayesian covariance r regression time-series mathematical-statistics graphical-model machine-learning linear-model kernel-trick linear-algebra self-study moments function correlation spss probability confidence-interval sampling mean population r generalized-linear-model prediction offset data-visualization clustering sas cart binning sas logistic causality regression self-study standard-error r distributions r regression time-series multiple-regression python chi-squared independence sample clustering data-mining rapidminer probability stochastic-processes clustering binary-data dimensionality-reduction svd correspondence-analysis data-visualization excel c# hypothesis-testing econometrics survey rating composite regression least-squares mcmc markov-process kullback-leibler convergence predictive-models r regression anova confidence-interval survival cox-model hazard normal-distribution autoregressive mixed-model r mixed-model sas hypothesis-testing mediation interaction

10

Zentraler Grenzwertsatz für Markov-Ketten

\newcommand{\E}{\mathbb{E}}\newcommand{\P}{\mathbb{P}} Der zentrale Grenzwertsatz (CLT) besagt, dass für unabhängig und identisch verteilt (iid) mit und , die Summe konvergiert zu einer Normalverteilung als

markov-process central-limit-theorem

9

Berechnung der Log-Wahrscheinlichkeit für gegebene MLE (Markov-Ketten)

Ich arbeite derzeit mit Markov-Ketten und berechnete die Maximum-Likelihood-Schätzung unter Verwendung von Übergangswahrscheinlichkeiten, wie von mehreren Quellen vorgeschlagen (dh Anzahl der Übergänge von a nach b geteilt durch die Anzahl der Gesamtübergänge von a zu anderen Knoten). Ich möchte...

maximum-likelihood markov-process likelihood

9

Verstärkungslernen in instationärer Umgebung

Frage 1: Gibt es gemeinsame oder akzeptierte Methoden für den Umgang mit instationären Umgebungen beim Reinforcement-Lernen im Allgemeinen? F2: In meiner Gridworld ändert sich die Belohnungsfunktion, wenn ein Staat besucht wird. In jeder Episode werden die Belohnungen auf den Ausgangszustand...

markov-process reinforcement-learning stationarity q-learning