Was ist französische Datenanalyse?

9

Einige statistische Methoden - ich erinnere mich nicht, ob es sich um eine Hauptkomponentenanalyse oder ähnliches handelt - werden manchmal als "französische Datenanalyse" bezeichnet. Was ist es genau ? Und einige Leute sagen, dass dieser Name ironisch ist, ist es wahr und warum?

Stéphane Laurent
quelle
1
Gute Frage! Ich habe erst gestern bemerkt, dass Analyze des données ein "guter Artikel" in der französischen Wikipedia ist und dass sich sein Inhalt stark von dem Artikel zur Datenanalyse in der englischen Wikipedia unterscheidet .
Onestop
4
Vielleicht ist dieses Papier interessant: Multivariate Datenanalyse: Der französische Weg
Tim
2
Dieses Papier scheint die Frage zu beantworten - und es ist der erste Treffer bei Google. Vielleicht war es doch keine so gute Frage ...
Onestop
2
Es müssen Zungen beteiligt sein
Aksakal

Antworten:

16

Datenanalysen im französischen Stil werden normalerweise als Arbeiten identifiziert, die auf Korrespondenzanalysen und anderen spektral orientierten Arbeiten basieren, sind jedoch tatsächlich tiefer verwurzelt. Tims Hinweis auf das Holmes-Stück ist hier besonders hilfreich.

Ein etwas breites Bild wäre zu sagen, dass der französische Stil eher einen axiomatischen, geometrischen und mathematischen Ansatz für Datenmatrizen als einen statistischen Modellierungsansatz verfolgt. Der Begriff muss ein wenig ironisch sein, denn obwohl CA von Benzecri, LeBart usw. (Französisch) populär gemacht wurde, hat es Vorläufer in Hirschfeld (Deutsch) und Nachfolger in de Leeuw / Gifi (Niederländisch) und Popularisierer in Greenacre (Südafrika). Greenacre bemerkte auch eine wichtige Verbindung zur verallgemeinerten SVD und generierte für mich das einzige leicht lesbare Buch zu diesem Thema. Diskussionen können ätzend werden - siehe de Leeuws Rezension von Murtagh .

Ein nützliches Beispiel für die Vergleichsfolgen des Stils ist die Analyse von Kreuztabellen. Mit einer einfachen Kreuztabelle könnte man den 'französischen' Stil der einfachen Korrespondenzanalyse vergleichen, der auf der spektralen Zerlegung einer geeignet transformierten Tabelle basiert, mit der Assoziationsmodellierung (z. B. von Goodman, Clogg oder Haberman) basierend auf strukturierten Interaktionstermen in einem zugrunde liegenden logarithmischen linearen Modell . Tatsächlich erzeugen diese beiden Ansätze sehr ähnliche Parametrisierungen (und Parameter!), Aber der Fokus ist sehr unterschiedlich. Agresti (1990) hat eine ausgezeichnete Diskussion.

Konjugatprior
quelle
1
Dass Sie das Gifi- Team (auch bekannt als Leiden univ. Nom de plume ) und Greenacres Arbeit erwähnt haben, ist wirklich gut! Ich lese gerade das Buch noch einmal durch, in dem die Autoren Ihren letzten Absatz ausführlich diskutieren. Mein großes +1.
Chl
3

Vielleicht "Korrespondenzanalyse"? : http://en.wikipedia.org/wiki/Correspondence_analysis, weil es hauptsächlich von einem französischen Forscher Jean-Paul Benzecri entwickelt wurde?

Florian
quelle
1
Einer sagte mir, dass diese "französische multivariate Datenanalyse" ironischerweise als "französische Datenanalyse" bezeichnet wurde, da sie zum Zeitpunkt der Erstellung dieser Methoden nicht praktikabel waren (zu rechenintensiv).
Stéphane Laurent
2
Florian> Entwickelt von Benzecri und stark von Bourdieu verwendet.
2
@ StéphaneLaurent: Obwohl die Axiomatisierung auf typisch französische Weise über den Zaun ging, war Analyze des Données praktisch und wurde angewendet. Wenn Sie einen "Cahiers de l'Analyse des Données" bekommen können , können Sie dies überprüfen!
Xi'an