Data Science

7
Umgang mit verschiedenen Textdaten

Ich arbeite derzeit mit einem Datensatz mit einer Vielzahl von Dokumentlängen - von einem einzelnen Wort bis zu einer ganzen Textseite. Darüber hinaus variieren die grammatikalische Struktur und die Verwendung von Interpunktion von Dokument zu Dokument erheblich. Ziel ist es, diese Dokumente in...

7
Identifizieren von "Clustern" oder "Gruppen" in einer Matrix

Ich habe eine Matrix, die mit diskreten Elementen gefüllt ist, und ich muss sie (mit R) in intakte Gruppen gruppieren. Nehmen Sie zum Beispiel diese Matrix: [A B B C A] [A A B A A] [A B B C C] [A A A A A] Es würde zwei separate Cluster für A, zwei separate Cluster für C und einen Cluster für B...

7
Wo soll man in neuronalen Netzen anfangen?

Zunächst einmal weiß ich, dass die Frage möglicherweise nicht für die Website geeignet ist, aber ich würde es wirklich begrüßen, wenn Sie mir nur einige Hinweise geben würden. Ich bin ein 16-jähriger Programmierer, habe Erfahrung mit vielen verschiedenen Programmiersprachen. Vor einiger Zeit habe...

7
Bitte klären Sie mich mit Platt's SMO-Algorithmus (für SVM) auf.

Aus A_Roadmap_to_SVM_SMO.pdf , S. 12. (Quelle: postimg.org ) Angenommen, ich verwende einen linearen Kernel. Wie kann ich sowohl das erste als auch das zweite innere Produkt erhalten? Meine Vermutung, inneres Produkt von Datenpunkt mit Datenpunkt j bezeichnet Klasse A für das erste innere Produkt...

7
Unvorhersehbarkeit oder Unsicherheit in einer Zeitreihe finden

Ich bin daran interessiert, eine Statistik zu finden, die die Unvorhersehbarkeit einer Zeitreihe erfasst. Nehmen Sie der Einfachheit halber an, dass jeder Wert in der Zeitreihe entweder 1 oder 0 ist. So sind beispielsweise die folgenden zwei Zeitreihen vollständig vorhersehbar. TS1: 1 1 1 1 1 1 1 1...