Welcher Algorithmus für maschinelles Lernen kann verwendet werden, um Muster in einem Datensatz der Cache-Leistung einer CPU zu identifizieren?

9

Ich benötige einen Algorithmus für maschinelles Lernen, um Muster in einem Datensatz (in einer CSV-Datei gespeichert) zu identifizieren, der Details zur Cache-Leistung einer CPU enthält. Genauer gesagt, enthält der Datensatz Spalten wie Readhits, Readmissoder Writehits.

Die vom Algorithmus identifizierten Muster sollten auf folgende Weise hilfreich sein.

dem Benutzer helfen, die Leistung der Arbeitslast beim nächsten Mal zu steigern,
Hilfe bei der Identifizierung von Problemen anhand der Funktionen oder
Helfen Sie dem Benutzer, zukünftige Datenwerte oder zukünftige Ereignisse vorherzusagen, die basierend auf den Mustern auftreten können.

Welche ML-Algorithmen kann ich verwenden?

machine-learning algorithm unsupervised-learning pattern-recognition aAAAAAAa
quelle

0

Eingeschränkte Boltzmann-Maschinen (RBMs) können Muster in einer CSV-Datei identifizieren, ohne dass der Benutzer Bedingungen angibt. Sie eignen sich gut zum Generieren "verteilter und abgestufter Darstellungen" eines "komplexen Satzes von Merkmalen, die echte hochdimensionale Daten zusammensetzen, um eine hohe Leistung bei maschinellen Lernaufgaben zu erzielen". ¹

Da das CSV-Format speziell für die Darstellung von Instanzen in Zeilen und eines statischen Satzes von Attributen in Spalten entwickelt wurde, ist die Einrichtung des Trainings unkompliziert. Wenn das Ziel darin besteht, zeitliche Muster zu identifizieren, kann eine Fensterstrategie erforderlich sein.

K-RBMs sind eine Fusion von k-Mittelwert-Ansätzen mit RBMs. Die Wahl des Ansatzes hat viel damit zu tun, welche Arten von Mustern gesucht werden. Der Begriff Muster kann auf einfache Trends bei Zahlen im Zeitverlauf, allgemeine Muster in Textspalten oder komplexe Muster aus mehreren Spalten angewendet werden.

Verweise

[1] Entstehung kompositorischer Darstellungen in eingeschränkten Boltzmann-Maschinen , J. Tubiana, R. Monasson, 2017)

[2] Lernen mehrerer nichtlinearer Teilräume mit K-RBMs , Siddhartha Chandra, Shailesh Kumar und CV Jawahar

Douglas Daseeco
quelle

0

Ich persönlich würde mich für k-means Clustering entscheiden. Es ist für solche Probleme ausgelegt.

William Scott
quelle

0

Ich benötige einen Algorithmus für maschinelles Lernen, um Muster in einer CSV-Datei zu identifizieren

Sie möchten unbeaufsichtigt lernen . Die Wikipedia-Definition desselben lautet:

Unüberwachtes maschinelles Lernen ist die Aufgabe des maschinellen Lernens, aus "unbeschrifteten" Daten eine Funktion zur Beschreibung der verborgenen Struktur abzuleiten (eine Klassifizierung oder Kategorisierung ist in den Beobachtungen nicht enthalten).

Ich werde Sie empfehlen durch die Liste der nicht überwachten Lernalgorithmen gehen hier und die man verwenden , die Ihren Bedarf passen würde.

Wenn Sie anfangen, würde ich empfehlen, mit dem Erlernen des K-Means-Clustering-Algorithmus zu beginnen .

Dawny33
quelle

0

Zunächst müssen Sie jeden Teil der CSV-Datei klassifizieren und anhand der aktuellen Situation kennzeichnen, z. B. A) optimale Situation B) kritisch.

Dann gruppieren Sie Ihre Daten mit einem unbeaufsichtigten Lernalgorithmus wie SOM oder k-means und klassifizieren dann einfach die Klassen, die Sie erhalten.

simonepi
quelle

0

Sie suchen im Grunde nach unbeaufsichtigtem Lernen (UL). Es gibt viele UL-Techniken, aber ich bin mir nicht sicher, ob Sie eine finden werden, die genau das tut, was Sie wollen, ohne Benutzereingaben. Wenn Sie jedoch die Literatur zu diesen Ansätzen überfliegen, finden Sie möglicherweise etwas Nützliches.

Eine Option ist DBSCAN , ein sehr beliebter Clustering-Algorithmus, bei dem der Benutzer keine anfängliche Zielanzahl von Clustern eingeben muss (was für die meisten Clustering-Algorithmen erforderlich ist). Aber selbst dann müssen Sie noch die Algorithmuswerte für epsilon(eine Entfernung, die bei der Berechnung der Cluster verwendet wird) und minPts(die Mindestanzahl von Punkten, die erforderlich sind, um eine "dichte" Region zu bilden) angeben.

Sie können sich auch selbstorganisierende Karten ansehen , einen Ansatz für unbeaufsichtigtes Lernen für neuronale Netze.

Einige andere Suchbegriffe, die Sie möglicherweise in eine nützliche Richtung führen, sind "Data Mining" und "Knowledge Discovery in Databases" (KDD).

Geisteskriminalität
quelle

Welcher Algorithmus für maschinelles Lernen kann verwendet werden, um Muster in einem Datensatz der Cache-Leistung einer CPU zu identifizieren?

Antworten: