Welche Eigenschaften machen eine Figur zu „Profi-Qualität“?

35

Ich habe Leute sagen hören, dass von ORIGIN produzierte Handlungen eher poliert und "professionell" aussehen, während von Mathematica produzierte Handlungen dies nicht tun. Die meisten Ploterstellungsprogramme sind jedoch recht konfigurierbar, und es liegt auf der Hand, dass ich mit den richtigen Einstellungen für Dinge wie Position und Beschriftung der Häkchen, Auswahl von Schriftarten und Farben, Ausrichtung der Beschriftungen usw. in der Lage sein sollte, mit Mathematica eine Figur zu erstellen / matplotlib / Gnuplot / etc. das sieht genauso gut aus wie die, die von ORIGIN stammen. Aber was bedeutet es in diesem Zusammenhang für eine Figur, "professionell" zu sein?

Mit anderen Worten, wenn es mein Ziel ist, die bestmöglichen Zahlen für die Aufnahme in eine wissenschaftliche Arbeit zu schaffen, welche Designentscheidungen werden im Allgemeinen für dieses Ziel empfohlen? Natürlich muss man die geeignete Art der Darstellung auswählen , z. B. Balkendiagramm vs. Streudiagramm und lineare vs. logarithmische Skala, aber das sind Entscheidungen, über die wir immer nachdenken, unabhängig davon, welches Darstellungsprogramm wir verwenden. Ich bin mehr an den Dingen interessiert, über die wir normalerweise nicht nachdenken, die normalerweise gemäß den Vorgaben einiger Plotprogramme festgelegt werden, die aber geändert werden können, um das Aussehen des Plots zu verbessern.

David Z
quelle
2
Dies könnte hier vom Thema abweichen ... Ich poste es, um die Grenzen der akzeptablen Fragen zur Datenvisualisierung zu untersuchen (vgl. Meta.scicomp.stackexchange.com/questions/55/… )
David Z
5
In Anbetracht der schlechten Qualität vieler Diagramme, die es in wissenschaftliche Publikationen schaffen, könnte es sein, dass die Definition der Community verbessert werden muss!
David Ketcheson
2
@DavidZaslavsky - Ich denke , das könnte tatsächlich der am besten geeignete Ort für diese Frage sein , wie es ist spezifisch für die Präsentation von wissenschaftlichen Daten, der Teil der Computerwissenschaft ist. Ich habe oft Beschwerden von Wissenschaftlern gesehen, dass die von unserer Software erstellten Grafiken nicht dem „Veröffentlichungsstandard“ entsprechen und nachgebessert werden müssen. Es wäre also schön, wenn andere Menschen Erfahrungen mit diesem Problem machen würden. Wie immer sollten bei subjektiven Fragen die Antworten den sechs Richtlinien folgen .
Mark Booth
Natürlich @Mark. Ich habe versucht, dies so objektiv wie möglich zu gestalten, da es sich nicht um eine technische Frage handelt.
David Z
Danke David, mein Kommentar war eher auf die Beantwortung von Fragen ausgerichtet, da wir zu dieser Zeit eher zu kurzen Antworten tendierten. Die sechs Leitlinien bevorzugen lange vor kurze, Erfahrung vor Meinung, Kontext vor Vermutung, Unparteilichkeit vor Vorurteilen, Ernst vor leichtfertig und schlagen vor, die Antworten mit Fakten und Hinweisen usw. zu untermauern Frage.
Mark Booth

Antworten:

14

IMO, was eine Figur zu "professioneller Qualität" macht, wird durch die Journal- / Publisher-Regeln definiert. Das bedeutet eigentlich "Veröffentlichungsqualität", die relativ ist, je nachdem, wo Sie veröffentlichen. Einige universelle Regeln scheinen aufzufallen - unabhängig von der verwendeten Plot-Software:

1) Eine Abbildung sollte so wenig Elemente wie möglich enthalten, um die Informationen / Ideen / Argumente zu vermitteln. Eine Figur sollte innerhalb weniger Sekunden leicht zu lesen / verstehen sein - wenn Sie länger brauchen, um zu verstehen, was auf der Figur vor sich geht, sind es möglicherweise zu viele Informationen. Dies ist manchmal schwer zu überprüfen, da Sie mit Ihren eigenen Zeichnungen / Daten vertraut sind - egal wie überlastet sie sind - und es nur wenigen Kollegen zeigen, um zu sehen, ob sie sie leicht lesen können. (Nicht zu verwechseln mit dem Verstehen der physikalischen Bedeutung hinter der Figur - dies dauert normalerweise einige Zeit).

2) Wenn Sie Farben verwenden müssen, ist es am besten, sich auf wenige zu beschränken, idealerweise auf der gegenüberliegenden Seite des Farbkreises. ZB blau und rot ist besser als blau und grün. Eine Figur mag viele Schattierungen haben - aber es ist am besten, wenige Hauptfarben zu haben. Ich benutze oft Blau (niedrige Werte) und Rot (hohe Werte) mit einem weißen Übergang dazwischen. Denken Sie immer an farbenblinde Leser.

3) Teilstriche, Konturetiketten usw. sollten ohne Lupe gut lesbar sein - also eine ähnliche Schriftgröße wie der Text im Tagebuch. Sie können überprüfen, ob alles lesbar ist, indem Sie eine Hardcopy mit Ziffernbreiten von 3 und 6 Zoll ausdrucken (dies sind in wissenschaftlichen Fachzeitschriften übliche Zifferngrößen).

4) Stellen Sie schließlich sicher, dass jedes einzelne Element der Figur seinen Zweck hat. Wenn es etwas gibt, das keine nützlichen Informationen enthält, werfen Sie es weg. Dies trägt zur Lesbarkeit der Abbildung bei.

An dem Punkt, an dem Sie mit dem Anpassen aller kleinen Elemente, aus denen eine Figur besteht, vertraut sind - Häkchen, Beschriftungen usw. -, spielt es keine Rolle, welches Werkzeug Sie verwenden, solange Sie in der Lage sind, ein sauberes EPS zu erstellen.

milancurcic
quelle
Können Sie die Gründe für (1) erläutern? Einige Sekunden sind keine lange Zeit. Ist dies auf die pragmatische Begründung zurückzuführen, dass die Menschen wirklich sehr beschäftigt sind, sodass sie sich keine Gedanken machen, wenn das Verstehen der Figur länger als ein paar Sekunden dauert?
Faheem Mitha
@FaheemMitha Nein, was ich wirklich gemeint habe ist, dass Sie den Lesern einen Gefallen tun, wenn Sie die Figur klar und einfach halten. Halten Sie sich nicht an ein paar Sekunden als solides Kriterium - so werden meine eigenen Zahlen bewertet. Die Anzahl der Informationen, die Sie zu einer Figur hinzufügen können, ist begrenzt. Wenn Sie zu viele Informationen eingeben, kann dies dazu führen, dass der Inhalt für den Leser schwer verständlich wird. Ihre Leser werden sich die Mühe machen, auch sehr beschäftigte Zahlen zu lesen, wenn sie an Ihrer Arbeit interessiert sind - aber eine weniger beschäftigte Zahl kann die Informationen besser vermitteln.
milancurcic
Ich bin mir nicht sicher, ob es völlig sinnvoll ist, eine Antwort auf eine so nebulöse Frage zu akzeptieren, aber diese Antwort scheint die vagen Ideen, an die ich gedacht hatte, als ich sie fragte, am besten zu kodifizieren. Sie erhalten also das Häkchen :-)
David Z
18

Es gibt ein paar Elemente, nach denen ich suche, wenn ich entweder in meiner eigenen Arbeit etwas von "Veröffentlichungsqualität" betrachte oder was ich in Betracht ziehe, wenn ich andere betrachte. Sie sind:

  1. Hohe Auflösung und vorzugsweise vektorbasiert. Dieser sollte mittlerweile ziemlich offensichtlich sein, aber Sie wären überrascht.
  2. Ein Mangel an Unordnung. Ich sollte in der Lage sein, zu sehen, was in Ihrer Figur passiert, und es schnell zu sehen. Es gibt nur wenige Dinge, die ich mehr hasse als jemanden, der versucht, die Richtlinie "High Ink: Paper Ratio" zu verwenden, um zu versuchen, ein gesamtes Manuskript in einer einzigen Figur zu stopfen.
  3. Druckt gut. Dies ist das, was für mich eigentlich am wichtigsten ist, und wenn ich Papiere überprüfe, teste ich es immer. "Drucken die Zahlen?" Mehr als einmal habe ich Figuren getroffen, deren Punkte beim Drucken in Graustufen völlig verschwommen sind, was sie für meine Zwecke wertlos macht (ich lese nicht auf Bildschirmen).
  4. Der Nachweis, dass der Ersteller mit den Grafikeinstellungen vertraut ist. Keine Auswahl von Achsen mit ungeraden Kugeln, Markierungen an der richtigen Stelle usw.
  5. In Kombination mit # 2 ein Mangel an "Schnörkel", der rein grafischer Natur ist. Schatten, unnötige 3-D-Bilder usw., die wirklich nichts anderes tun, als die Zeit der Leser zu verschwenden.

Die meisten davon sind ehrlich gesagt eher kreisspezifisch als programmspezifisch. Ich habe schreckliche Darstellungen in R und hervorragende Darstellungen in Excel gesehen.

Fomite
quelle
Vektorgrafiken sind in der Tat wünschenswert. Aber gibt es weit verbreitete Zeichenprogramme, die es nicht gibt?
Faheem Mitha
2
Zeichenprogramme? Nicht, dass ich mir vorstellen könnte. Programme, die Plots erstellen - statistische Pakete und ähnliches? Viele von ihnen verfügen entweder über Nicht-Vektor-Ausgabeformate oder sind standardmäßig eingestellt.
Fomite
14

Wenn wir über Datenzahlen sprechen, gehe ich zu den Quellen: Edward Tuftes Die visuelle Darstellung von qualitativen Informationen und schönen Beweisen .

Mr. Tufte geht natürlich auf einige Details ein, aber das Prinzip, das für mich auffällt, ist nicht, Tinte für Rahmen und Dekoration auszugeben, sondern so viel Tinte wie möglich für Informationen zu verwenden.

Geändert nach Marks Antrag:

Einige wichtige Punkte aus der visuellen Darstellung qualitativer Informationen sind:

  • Zeigen Sie die Daten auf eine Weise an, die das, was sie zu sagen haben, nicht verzerrt oder verschleiert
  • Ordnen Sie die Anzeigen so an, dass Vergleiche zwischen verschiedenen Daten auf verschiedenen Ebenen möglich sind
  • Integrieren Sie die grafischen Aspekte in die statistischen und verbalen Beschreibungen
  • Maximieren Sie das Verhältnis von Daten zu Tinte, indem Sie Elemente entfernen, die keinem Zweck dienen (oder von anderen Elementen überflüssig gemacht werden), und verwenden Sie die vorhandenen Elemente, um zusätzliche Informationen zu übermitteln (z. B. Achsen, die Varianten eines Boxplots sind).
  • Mit kleinen Vielfachen können Datensätze mit höheren Dimensionen angeordnet werden, um einen Vergleich entlang dieser zusätzlichen Dimensionen zu ermöglichen

Beautiful Evidence ist ein umfangreicheres Buch. Ich werde nur die Kapitelüberschriften reproduzieren:

  • Kartierte Bilder: Bilder als Beweis und Erklärung
  • Sparklines: Intensive, einfache Grafiken in Wortgröße
  • Links und Kausalpfeile: Mehrdeutigkeit in Aktion
  • Wörter, Zahlen, Bilder - zusammen
  • Die Grundprinzipien des analytischen Designs
  • Korruption in Beweisen Präsentationen: Effekte ohne Ursachen, Cherry Picking, Overreaching, Chartjunk und die Wut zu schließen
  • Der kognitive Stil von PowerPoint: Korrupte Inhalte herausfiltern
  • Skulpturale Sockel: Bedeutung, Praxis, Depedestalisierung
  • Landschaftsskulpturen

Eine der interessanten Beobachtungen in Beautiful Evidence ist, dass wir im Allgemeinen Ausgabegeräte mit hoher Dichte (ein 300-DPI-Drucker ist heutzutage ein Gerät mit niedriger Dichte) für Drucksachen verwenden, aber häufig unsere Zahlen für Sieb- oder Zeilendrucker zeichnen, was ein enormes Potenzial verschwendet zur Übermittlung von Informationen.

dmckee
quelle
Seite 13 von Die visuelle Anzeige quantitativer Informationen beginnt mit einem schönen Aufzählungspunkt, einer Zusammenfassung der "professionellen Grafiken" oder mit dem Titel "Graphical Excellence".
Brian Diggs
@ Brian Diggs - Könnten Sie oder dmckee diese Antwort mit einer Zusammenfassung der wichtigsten Punkte aktualisieren? Viele von uns sind vielleicht interessiert genug, um die Zusammenfassung zu kennen, ohne interessiert genug zu sein, um die Bücher tatsächlich zu kaufen.
Mark Booth
@Mark: Ich werde es am nächsten Tag oder so bekommen ... meine Kopie ist im Büro und im Moment bin ich es nicht.
dmckee
8

Die besten Zahlen, die ich persönlich machen konnte, habe ich mit dem TeX-Paket PGF / TikZ gemacht . Wenn Sie LaTex verwenden, wie es viele in den Hard Sciences tun, haben Sie wahrscheinlich schon davon gehört.

Es scheint auch führend bei LaTex-Grafikpaketen zu sein. Ein beträchtlicher Teil der Fragen auf der TeX StackExchange-Site bezieht sich auf PGF / TikZ. Ich bin mir nicht sicher, warum die Ergebnisse so gut sind, aber ein Vorteil von PGF / TikZ gegenüber anderen Paketen bei der Verwendung von LaTeX ist, dass es sich einfach besser in den Text einfügt. Zum einen stimmen die Schriftarten in der Abbildung mit denen im Text überein.

Faheem Mitha
quelle
Natürlich ist es auch meine Lieblingsmethode, Figuren zu machen ;-) Aber ich bin mehr daran interessiert, warum TikZ-Handlungen als gut gelten.
David Z
1
@ DavidZaslavsky: Ich weiß nicht. Bis ist ein Genie? :-)
Faheem Mitha
@DavidZaslavsky: Im Ernst, diese Frage ist für tex.sx ein Knaller und wurde dort wahrscheinlich bereits angesprochen.
Faheem Mitha
1
@EpiGrad: Ich habe nur gemeint, dass es für tex.sx nützlicher ist, speziell nach TikZ zu fragen, wenn David dies so meint. Natürlich wäre die umfassendere Frage für tex.sx nicht zum Thema.
Faheem Mitha
1
pgfplots ist ziemlich erstaunlich. Standardmäßig sieht es so aus, wie Sie es möchten, z. Es ist aber auch einfach einzustellen. Mein Lieblingstrick besteht darin, die Achsen von einem Matlab-Pseudofarbendiagramm zu entfernen, es zuzuschneiden und dann in TikZ Achsen darum zu wickeln. Auf diese Weise erhalten Sie ein Rasterbild für die Pseudofarbe (dies ist einer der wenigen Fälle, in denen eine Rastergrafik vorzuziehen ist) und die LaTeX-Güte für Achsen und Beschriftungen sowie den Farbbalken. Dies ist eine meiner Antworten mit pgfplots
Qubyte
6

Es ist fast einfacher zu charakterisieren, was einen schlechten Graphen ausmacht, als was einen guten Graphen ausmacht.

Einige Merkmale von schlechten Graphen:

  • Zu große oder zu kleine Schriftarten und Symbole
  • Übermäßig dünne oder dicke Linien für Kurven und andere Diagrammeigenschaften
  • Es werden zu viele verschiedene Variablen gleichzeitig angezeigt oder variiert
  • Unangemessene Achsauswahl (log versus linear, Bereich usw.)
  • Anzeigen von Trends zwischen Datenpunkten mit durchgezogenen Kurven, die auf möglicherweise nicht vorhandene Verläufe oder Verhaltensweisen hinweisen
  • Keine Angabe zum Ausmaß der Unsicherheiten oder Fehler
  • Schlecht beschriftete oder beschriftete Grafiken (einschließlich Einheiten!)

Obwohl die meisten Softwarepakete in der Lage sind, gute Grafiken zu erstellen, hat fast kein Programm, mit dem ich jemals gearbeitet habe, standardmäßig einen Zustand erreicht, der gute Grafiken erzeugt. Sie müssen immer angepasst werden: entweder Schriftgrößen oder Anzeigebereiche oder Achsen- oder Symbolauswahl usw. Derzeit bevorzuge ich die Verwendung von matplotlib. Andere Mitglieder meiner Gruppe sind zu SciDavis migriert.

aeismail
quelle
Ich bin mir nicht sicher, was ich unter "Keine Fehleranzeige" verstehe. könntest Du das erläutern? Ansonsten gute Liste.
Faheem Mitha
Bearbeitet zur Verdeutlichung: "Es wird kein Hinweis auf die Größe von Unsicherheiten oder Fehlern gegeben." Wenn die Fehler jedoch zu klein sind, um angezeigt zu werden, kann dies in der Überschrift angegeben werden.
Aeismail
5

Ich hatte vernünftigen Erfolg mit dem Mathematica-Paket LevelScheme . Das Ausführungsmodell unterscheidet sich geringfügig von der herkömmlichen Mathematica-Programmierung, sodass mit der Verwendung eine Lernkurve verbunden ist. Es ist jedoch in der Lage, die Erstellung von Plots genau zu steuern, was in Mathematica schwierig ist. Außerdem gibt es als Nebenpaket ein Paket zum Generieren von benutzerdefinierten Teilstrichen.

(Sobald die Version mit Mathematica v.8-Unterstützung verfügbar ist, wird sie in SciDraw umbenannt.)

rcollyer
quelle