Die Bedingungsnummer einer Korrelationsmatrix ist für sich genommen nicht von großem Interesse. Es kommt zur Geltung, wenn diese Matrix die Koeffizienten eines Satzes linearer Gleichungen angibt, wie dies bei multipler linearer Regression unter Verwendung standardisierter Regressoren der Fall ist.
Belsley, Kuh und Welsh, die als erste auf die Relevanz der Bedingungsnummer in diesem Zusammenhang hingewiesen und diese systematisch ausgenutzt haben, haben eine nette Erklärung, die ich allgemein zitieren werde. Sie beginnen mit einer Definition von
die mit bezeichnete Spektralnorm und definiert als||A||
||A||≡sup||z||=1||Az||.
Geometrisch ist dies der maximale Betrag, um den die Einheitskugel neu skaliert: die maximale "Dehnung", wenn Sie so wollen. Sie weisen auf die offensichtlichen Zusammenhänge hin, diedaher ist der größte Singularwert von undist der Kehrwert des kleinsten Singularwerts von (wenn invertierbar ist). (Ich stelle mir das gerne als das maximale "Zusammendrücken" von .) Sie behaupten dann, dassist eigentlich eine Norm und fügt die (leicht zu beweisenden) Fakten hinzuA||A||A||A−1||AAA||A||
||Az||≤||A||⋅||z||(4)
||AB||≤||A||⋅||B||(5) für alle angemessenen und .AB
Diese Bemerkungen werden dann angewendet:
Wir werden nun sehen, dass die Spektralnorm direkt für eine Analyse der Konditionierung eines linearen Gleichungssystems und nicht singulär mit der Lösung relevant ist . Wir können fragen, um wie viel sich der Lösungsvektor ändern würde wenn es kleine Änderungen oder Störungen in den Elementen von oder gäbe , die mit und . Für den Fall, dass fest ist, sich aber um ändert , haben wir oderAz=c,A n×nz=A−1cz(δz)cAδcδAAcδcδz=A−1δc
||δz||≤||A−1||⋅||δc||.
Wenn wir die Eigenschaft oben für das Gleichungssystem verwenden, haben wirund durch Multiplizieren dieser beiden letzten Ausdrücke erhalten wir(4)||c||≤||A||⋅||z||;
||δz||||z||≤||A||⋅||A−1||⋅||δc||||c||.
Das heißt, die Größeliefert eine Grenze für die relative Änderung der Länge des Lösungsvektors , die sich aus einer gegebenen relativen Änderung der Länge von . Ein ähnliches Ergebnis gilt für Störungen in den Elementen der Matrix . Hier kann gezeigt werden, dass||A||⋅||A−1||zcA
||δz||||z+δz||≤||A||⋅||A−1||⋅||δA||||A||.
(Der wichtigste Schritt in dieser Demonstration, der als Übung verbleibt, besteht darin, und Normen auf beide Seiten anzuwenden.)δz=−A−1(δA)(z+δz)
Aufgrund seiner Nützlichkeit in diesem Zusammenhang ist die Größeist definiert als die Bedingungsnummer der nicht singulären Matrix ....||A||⋅||A−1||A
(Basierend auf den früheren Charakterisierungen können wir uns die Bedingungsnummer als eine Art "Seitenverhältnis" von vorstellen : Je mehr es einen Vektor strecken kann, desto mehr kann es jeden Vektor quetschen. Es würde direkt mit dem Maximum zusammenhängen Exzentrizität, die ein großer Kreis auf der Einheitskugel erreicht, nachdem er von .)AA
Die Bedingungszahl begrenzt, um wie viel sich die Lösung eines Gleichungssystems relativ ändern kann, wenn ihre Komponenten und geändert werden.zAz=cAc
Diese Ungleichungen sind jedoch nicht eng: Für jedes gegebene hängt das Ausmaß, in dem die Grenzen einigermaßen genaue Darstellungen der tatsächlichen Änderungen sind, von und den Änderungen und . Bedingungsnummern sind Aussagen über die schlimmsten Fälle. Somit kann eine Matrix mit der Bedingungsnummer als mal besser angesehen werden als eine mit der Bedingungsnummer , aber das bedeutet nicht unbedingt, dass sie genau so viel besser ist (wenn sie keine Fehler ausbreitet) als die andere. AAδAδc970/970
Referenz
Belsley, Kuh & Welsch, Regressionsdiagnostik. Wiley, 1980: Abschnitt 3.2.