Shannons Entropie für ein Bild

7

Shannons Entropie [Plog (1 / p)] für ein Bild ist eine probabilistische Methode zum Vergleichen von zwei Pixeln oder einer Gruppe von Pixeln. Angenommen, ein Bild mit einer Matrix von 3 × 3 hat Pixelintensitätswerte

1 1 2
2 3 3
4 4 5

und ein anderes Bild mit einer 3 × 3-Matrix weist eine Gruppe von Pixeln mit Intensitätswerten auf

5 5 6
6 7 7
8 8 9

Dann wäre Shannons Entropie für die Bilder dieselbe. In diesem Fall würden die Entropiewerte darauf hinweisen, dass die Bilder gleich sind, obwohl sie tatsächlich unterschiedlich sind. Eine Bildanpassung mit dieser Technik hilft also nicht. Auf der Grundlage einer überwachten Klassifizierung, bei der Ich klassifiziere ein Bild basierend auf trainierten Datenbanken der Shannon-Entropie. Wir verwenden das Konzept der Entropie, um Ähnlichkeit zwischen zwei Bildern zu finden. Gibt es eine Methode oder ein Forschungspapier, in dem diese Entropie für die Bildanpassung für den obigen Fall verwendet oder modifiziert werden kann?

Soumajyoti
quelle
6
Woher kam die Idee, dass wenn die Shannon-Entropie für zwei Dinge gleich wäre, sie gleich sein müssten? Dies ist überhaupt nicht der Punkt der Shannon-Entropie. Ein Punkt der Shannon-Entropie besteht darin, herauszufinden, wie stark Sie Daten komprimieren können.
Peter Shor
Auf der Grundlage einer überwachten Klassifizierung, bei der ich ein Bild anhand trainierter Datenbanken zur Shannon-Entropie klassifiziere, verwenden wir das Konzept der Entropie, um Ähnlichkeiten zwischen zwei Bildern zu finden. Es wurden bereits Forschungsarbeiten veröffentlicht, in denen solche Techniken zur Klassifizierung von Satellitenbildern verwendet wurden Ich mache auch ein Forschungsprojekt zum gleichen Konzept. Peter kann sein, dass Ihr Wissen darüber nicht gut genug ist. Sie sollten mehr darüber lesen, bevor Sie einen Kommentar abgeben.
Soumajyoti
5
Wenn Sie einige Referenzen angegeben hätten, könnten Sie vielleicht erwarten, dass jemand vor dem Kommentieren mehr liest. So wie es war, sehe ich nicht, wie Sie erwarten könnten, dass jemand losgeht und die Fakten recherchiert, die Sie aus Ihrer Frage herausgelassen haben.
Peter Shor
2
@ Soumajyoti Vielleicht probieren diese Forscher viele Funktionen aus und überprüfen ihre Eignung als Fingerabdrücke. Ähnlich wie bei MD5 oder anderen Hashes sind diese Funktionen nicht injektiv und müssen es auch nicht sein: Sie können sehr unterschiedliche Bilder schnell voneinander unterscheiden und müssen nur selten teurere Dinge tun.
Raphael
1
Die Shannon-Entropie kann auch den "Versatz" eines Bildes in Dokumenten erkennen. Ich bin nicht sicher, ob es zum Vergleichen von Bildern verwendet werden kann.
mttdbrd

Antworten:

5

Shannons Entropie fungiert hier als Hashing- oder Fingerabdruckfunktion. Sie sind nicht injektiv, was bedeutet, dass wir darauf achten müssen, nicht zu viel in Wertebeziehungen zu interpretieren.

Wenn , dann sind die Bilder und sicherlich nicht gleich.H(I1)H(I2)I1I2

Wenn jedoch (oder sogar ) ist, wissen wir nichts. Die Bilder mögen ähnlich sein, aber die Werte können aufgrund der Nichtinjektivität auch nahe beieinander liegen.H(I1)=H(I2)H(I1)H(I2)

Wir möchten etwas Glätte haben, das heißt, zwei Bilder sind unterschiedlicher, wennist größer. Ob dies der Fall ist, ist sicherlich ein Qualitätskriterium für solche Fingerabdruckfunktionen. In Ihrem Beispiel scheint Entropie in diesem Sinne kein guter Fingerabdruck zu sein.|H(I1)H(I2)|

Es wäre verwirrend, wenn irgendeine Art von Entropie wäre. Jedes Rechteck einer Farbe enthält keine Informationen (Entropie Null), zwei Rechtecke unterschiedlicher Farbe sind jedoch so unterschiedlich wie zwei Bilder.

Raphael
quelle
2

Ich finde das eine tolle Idee. Sie können es jedoch nicht mehr für die Bildanpassung verwenden, als Sie hoffen können, dass ein Bild mit "weißem Rauschen" mit einem anderen übereinstimmt. Aber es ist eine großartige Idee, ähnliche Kategorien von Bildern zu finden.

Yuval Filmus
quelle
Es wäre großartig, mehr Details darüber zu erfahren, warum weißes Rauschen mit einem anderen übereinstimmt. Bitte legen Sie einige Beweise vor.
Léo Léopold Hertz 9
2

Ein verwandter Ansatz wäre, ein Histogramm der Pixelintensitäten für jedes der beiden Bilder zu berechnen und dann diese beiden Histogramme zu vergleichen. Typischerweise würden wir anstelle der Pixelintensitäten ein Histogramm eines Farbmaßes (z. B. des Farbtons) berechnen. Dies ist eine grobe Maßnahme, die manchmal dennoch hilfreich sein kann: z. B. um ein Bild eines Raums von einem Bild eines anderen zu unterscheiden (z. B. wenn ihre Wände in verschiedenen Farben gestrichen sind oder eine unterschiedliche Farbverteilung aufweisen).

Es gibt viele Möglichkeiten, zwei Histogramme zu vergleichen. Sie können sich jedes Histogramm als Verteilung für eine Zufallsvariable vorstellen und dann die beiden Verteilungen mit einer Reihe von Methoden vergleichen. Zum Beispiel könnten Sie sie mit KL-Divergenz vergleichen. Ein anderer Ansatz besteht darin, ein Standardabstandsmaß für Vektorräume zu verwenden, z. B. das Maß (Summe der quadratischen Differenzen). Oft möchten Sie zuerst die Werte ablegen, bevor Sie das Histogramm berechnen.L2

Siehe auch

DW
quelle
Können Sie bitte einige Beweisdaten zum Histogrammansatz mit einigen Beispieldaten vorlegen? Ich bin wirklich interessiert an Ihrer Verwendung der L2-Norm, die meiner Meinung nach in den meisten Fällen nicht ausreicht.
Léo Léopold Hertz 준영