Data Science

14
RandomForestClassifier OOB-Bewertungsmethode

Wird die zufällige Gesamtstrukturimplementierung in scikit-learn unter Verwendung der mittleren Genauigkeit als Bewertungsmethode zum Schätzen des Generalisierungsfehlers mit Out-of-Bag-Stichproben verwendet? Dies wird in der Dokumentation nicht erwähnt, aber die score () -Methode gibt die mittlere...

14
Wann täuschen p-Werte?

Auf welche Datenbedingungen sollten wir achten, wenn p-Werte möglicherweise nicht die beste Methode zur Bestimmung der statistischen Signifikanz sind? Gibt es bestimmte Problemtypen, die in diese Kategorie

14
RNN mit mehreren Zeitreihen

Ich versuche, ein neuronales Netzwerk mit Zeitreihen als Eingabe zu erstellen, um es basierend auf dem Typ jeder Reihe zu trainieren. Ich habe gelesen, dass man mit RNNs die Eingabe in Gruppen aufteilen und jeden Punkt der Zeitreihe in einzelne Neuronen aufteilen und schließlich das Netzwerk...

14
Ähnlichkeit zwischen zwei Wörtern

Ich suche eine Python-Bibliothek, mit der ich die Ähnlichkeit zwischen zwei Wörtern oder Sätzen erkennen kann. Ich werde eine Audio-zu-Text-Konvertierung durchführen, die zu einem englischen Wörterbuch oder einem anderen Wort als einem Wörterbuch führt (dies kann ein Name für eine Person oder eine...

14
Rückvermehrung in CNN

Ich habe folgende CNN: Ich beginne mit einem Eingabebild der Größe 5x5 Dann wende ich die Faltung mit 2x2 Kernel und stride = 1 an, wodurch eine Feature-Map der Größe 4x4 erzeugt wird. Dann wende ich 2x2 Max-Pooling mit Stride = 2 an, wodurch die Feature-Map auf 2x2 verkleinert wird. Dann wende ich...

14
Maschinelles Lernen Bibliotheken für Ruby

Gibt es maschinelle Lernbibliotheken für Ruby, die relativ vollständig (einschließlich einer Vielzahl von Algorithmen für überwachtes und unbeaufsichtigtes Lernen), robust getestet und gut dokumentiert sind? Ich mag Pythons Scikit-Learn wegen seiner unglaublichen Dokumentation, aber ein Kunde würde...

14
Was ist der Vorteil einer Batch-Größe von 2?

Warum ist es manchmal von Vorteil, die Batch-Größe bei der Schulung von Modellen für maschinelles Lernen auf einer Potenz von 2 zu halten? Ich dachte, es wäre am besten, eine Größe zu verwenden, die am besten zu Ihrem GPU-Speicher / RAM passt. Diese Antwort besagt, dass für einige Pakete eine...

14
Open Source Data Science Projekte sollen dazu beitragen

Beiträge in Open-Source-Projekten sind in der Regel eine gute Möglichkeit, um sich mit Einsteigern vertraut zu machen und einen neuen Bereich für erfahrene Datenwissenschaftler und Analysten zu erschließen. Welche Projekte tragen Sie bei? Bitte geben Sie eine Einführung + Link auf...

14
Können Bäume mit Gefälle für jede Funktion geeignet sein?

Für neuronale Netze haben wir den universellen Approximationssatz, der besagt, dass neuronale Netze jede stetige Funktion auf einer kompakten Teilmenge von R n approximieren könnenRnRnR^n . Gibt es ein ähnliches Ergebnis für Bäume mit Farbverlauf? Es scheint vernünftig, da Sie weitere Zweige...

14
Wie funktioniert SelectKBest?

Ich schaue mir dieses Tutorial an: https://www.dataquest.io/mission/75/improving-your-submission In Abschnitt 8, in dem die besten Funktionen gefunden werden, wird der folgende Code angezeigt. import numpy as np from sklearn.feature_selection import SelectKBest, f_classif predictors = ["Pclass",...