Statistiken und Big Data

8
Codieren von kategorialen Merkmalen mit hoher Kardinalität (viele Kategorien), wenn sich die Merkmale in Bezug auf die Kardinalität stark unterscheiden

Ich habe Fragen zur Codierung kategorialer Features durchgesehen, konnte jedoch keine finden, die mein Problem diskutieren. Entschuldigung, wenn ich es verpasst habe. Nehmen wir an, wir haben einen Datensatz mit binären und nominalen Variablen von jeweils ungefähr gleicher Bedeutung. Die...

8
Anomalieerkennung in Zeitreihen

Ich bin ein Anfänger mit maschinellem Lernen (ich habe Ngs Kurs beendet), ich benutze Scikit-Learn in Python. Ich möchte den besten Weg finden, um Anomalien in unserem System zu erkennen. Wir haben laufende Ereignisse, die nach einem Zeitplan auftreten (alle paar Minuten / Stunden), und ich möchte...

8
Wie kann ich

Angenommen, ist eine Zufallsprobe von einer kontinuierlichen Verteilungsfunktion . Sei unabhängig von den . Wie kann ich ?Y.1, … , Y.n + 1Y1,…,Yn+1Y_1,\dots,Y_{n+1}F.FFX.∼ U n i fo r m {1,…,n}X.∼U.nichfÖrm{1,…,n}}X\sim\mathrm{Uniform}\{1,\dots,n\}Y.ichY.ichY_iE.[ ∑X.i = 1ich{ Y.ich≤ Y.n +...