Data Science

17
Clustering basierend auf Ähnlichkeitswerten

Es sei angenommen , dass wir eine Reihe von Elementen haben E und eine Ähnlichkeit ( nicht Abstand ) Funktion sim (ei, ej) zwischen zwei Elementen ei, ej ∈ E . Wie können wir die Elemente von E mit sim (effizient) clustern ? k - bedeutet zum Beispiel, dass ein gegebenes k erforderlich ist, für das...

17
Was bedeutet die Notation mAP @ [. 5: .95]?

Eine gängige Methode zur Feststellung, ob ein Objektvorschlag richtig war, ist die Ermittlung von Schnittpunkten über Union (IoU, IU). Dies nimmt die Menge der vorgeschlagenen Objektpixel und die Menge der wahren Objektpixel B und berechnet:EINEINABBB icho U( A , B ) = A ∩ BA ∪...

17
Optische Erkennung von Katzen mittels Anomalieerkennung

Ich habe ein Hobbyprojekt, für das ich mich einsetzen möchte, um meine bisher begrenzten Erfahrungen mit maschinellem Lernen zu verbessern. Ich habe den Coursera MOOC zu diesem Thema absolviert und abgeschlossen. Meine Frage bezieht sich auf die Machbarkeit des Projekts. Die Aufgabe ist folgende:...

17
NLP - warum ist "nicht" ein Stoppwort?

Ich versuche, Stoppwörter zu entfernen, bevor ich eine Themenmodellierung durchführe. Mir ist aufgefallen, dass einige Negationswörter (weder noch nie, keine usw.) normalerweise als Stoppwörter angesehen werden. Zum Beispiel enthalten NLTK, spacy und sklearn "not" in ihren Stoppwortlisten. Wenn wir...

17
Womit generieren Sie ein Dashboard in R?

Ich muss regelmäßige (tägliche, monatliche) Webanalyse-Dashboard-Berichte erstellen. Sie sind statisch und erfordern keine Interaktion. Stellen Sie sich daher eine PDF-Datei als Zielausgabe vor. In den Berichten werden Tabellen und Diagramme gemischt (hauptsächlich mit ggplot2 erstellte Sparkline-...

17
Algorithmen für das Textclustering

Ich habe ein Problem damit, eine große Menge von Sätzen nach ihrer Bedeutung in Gruppen zusammenzufassen. Dies ähnelt einem Problem, wenn Sie viele Sätze haben und diese nach ihrer Bedeutung gruppieren möchten. Welche Algorithmen werden dazu vorgeschlagen? Ich kenne die Anzahl der Cluster im Voraus...