Ich habe mich aus technischer Sicht gefragt, aus welchen Gründen eine zu genaue Modellierung nachteilig sein kann.
Aus wissenschaftlicher Sicht scheint es fast immer ein Vorteil zu sein, abgesehen davon, wann Sie weniger Rechenzeit benötigen.
Warum sollten Sie aus technischer Sicht neben Zeit (oder Rechenleistung) das vermeiden?
modeling
systems-engineering
Der Gast
quelle
quelle
Antworten:
Vorsicht vor Überanpassung . Ein genaueres Modell der von einem System gesammelten Daten ist möglicherweise kein besserer Prädiktor für das zukünftige Verhalten eines Systems.
Das obige Bild zeigt zwei Modelle einiger Daten.
Die lineare Linie ist in Bezug auf die Trainingsdaten (die Punkte in der Grafik) ziemlich genau, und (wie zu erwarten) ist sie in Bezug auf die Testdaten (wo die Punkte wahrscheinlich für x <5 und x> -5 sind) ziemlich genau ).
Im Gegensatz dazu ist das Polynom für die Trainingsdaten zu 100% genau, aber (es sei denn, Sie haben Grund zu der Annahme, dass das Polynom 9. Grades aus physikalischen Gründen sinnvoll ist), würden Sie davon ausgehen, dass dies ein äußerst schlechter Prädiktor für x> 5 und ist x <-5.
Das lineare Modell ist 'weniger genau', basierend auf einem Vergleich von Fehlern mit den von uns gesammelten Daten. Aber es ist allgemeiner.
Darüber hinaus müssen sich die Ingenieure weniger Gedanken über ihr Modell machen und mehr darüber, was die Leute mit dem Modell machen werden.
Wenn ich dir sage, dass wir an einem heißen Tag spazieren gehen und es voraussichtlich 426 Minuten dauern wird. Sie werden wahrscheinlich weniger Wasser mitbringen, als wenn ich Ihnen sage, dass die Wanderung 7 Stunden dauern wird, und noch weniger, als wenn ich sage, dass die Wanderung 4 bis 8 Stunden dauern wird. Dies liegt daran, dass Sie eher auf mein implizites Vertrauen in meine Prognose als auf den Mittelpunkt meiner angegebenen Zeiten reagieren.
Wenn Sie Leuten ein genaues Modell geben, verringern die Leute ihre Fehlerquote. Dies führt zu größeren Risiken.
Nehmen Sie den Spaziergang an einem heißen Tag, wenn ich weiß, dass der Spaziergang in 95% der Fälle 4-8 Stunden dauern wird, mit einigen Unsicherheiten in Bezug auf Navigation und Schrittgeschwindigkeit. Wenn Sie unsere Schrittgeschwindigkeit genau kennen, wird die Unsicherheit der 4: 8-Zahl verringert, aber die Wahrscheinlichkeit, dass wir so lange brauchen, dass Wasser zum Problem wird, wird dadurch nicht wesentlich beeinträchtigt, da dies fast ausschließlich von der unsicheren Navigation abhängt die unsichere Gehgeschwindigkeit.
quelle
Der offensichtlichste Nachteil sind die Kosten, alle Ingenieurprojekte haben ein begrenztes Budget und es ist eindeutig eine schlechte Sache, mehr Geld auszugeben als nötig, ganz zu schweigen von Zeitverschwendung.
Es kann auch subtilere Probleme geben. Bei Dingen wie der FE-Analyse handelt es sich immer um Näherungswerte, und manchmal kann das Hinzufügen unnötiger Details zu Artefakten führen und die Fehlersuche bei einem Modell erschweren. Beispielsweise können Diskontinuitäten auftreten, die zu Stresserhöhungen führen
Es gibt auch die Überlegung, dass selbst wenn Sie über die Rechenleistung verfügen, um einen großen Teil der Datenlieferanten und -kunden bequem zu handhaben, das Übertragen großer Dateien möglicherweise nicht und in vielen Fällen immer noch ein gewisser Engpass ist.
Wenn Sie über mehr Parameter verfügen, als Sie benötigen, müssen Sie möglicherweise zusätzliche Arbeit für die Verwaltung und das Debuggen von Dateien leisten.
Auch wenn Sie jetzt über reichlich Zeit und Ressourcen verfügen, kann es gut sein, dass jemand in der Zukunft dieses Modell ohne den gleichen Luxus verwenden muss, insbesondere, wenn es Teil eines Produkts ist, das Sie an Kunden verkaufen.
quelle
Dafür gibt es einige Gründe.
Aus einer rein pragmatischen Perspektive ist dies auf zeitliche Einschränkungen zurückzuführen. Die erforderliche Zeit zum Lösen eines Modells nimmt zu sehr viel schneller als der Genauigkeitsgrad, und welcher Wert auch immer gewählt wird, ist jedenfalls subjektiv.
Aus diesem Grund macht es keinen Sinn, zu genau zu sein. Aber in der Tat kann es vorteilhaft sein, nicht einmal zu genau zu sein. Die Gründe dafür sind jedoch meist psychologischer Natur. Hauptsächlich möchten Sie nicht, dass Ihr Modell zu genau ist, und Sie möchten Ihre Ergebnisse nicht mit sieben Dezimalstellen ausgeben, weil Sie kein falsches Gefühl von Vertrauen hervorrufen möchten.
Das menschliche Gehirn ist fest davon überzeugt, dass 1.2393532697 ein genauerer Wert als 1.2 ist. Das ist aber eigentlich nicht der Fall. Aufgrund all der Unsicherheiten in der Praxis, die Ihr Modell möglicherweise nicht berücksichtigen kann (insbesondere angesichts der aktuellen Hardware-Einschränkungen), ist 1.2 mit ziemlicher Sicherheit genauso gültig wie 1.2393532697. Machen Sie sich also nicht selbst oder dem, der Ihr Modell sieht, etwas vor. Geben Sie einfach 1.2 aus, was transparent anzeigt, dass Sie nach dieser zweiten Ziffer nicht wirklich wissen, was los ist.
quelle
Für ein äußerst genaues Modell ist möglicherweise eine unzulässige Menge an Eingabedaten erforderlich. Es könnte möglich sein, ein hervorragendes Modell von Wettersystemen zu erstellen, indem beispielsweise die Position und Geschwindigkeit jedes Gasmoleküls in der Atmosphäre als Eingabe verwendet wird. In der Praxis wäre ein solches Modell nicht sinnvoll, da es keine realistische Möglichkeit gibt, die richtigen Eingaben zu generieren. In diesem Fall wäre ein weniger genaues Modell vorzuziehen, das nur begrenzte Eingabedaten erfordert.
quelle
"Zu genau" ist nicht monoton. Es kann tatsächlich eine Illusion der Wiedergabetreue erzeugen, die Sie glauben macht, es lohnt sich, mehr Geld in die Simulation zu pumpen. Dies ist sehr wichtig, wenn Sie Daten aus Modellen mit gemischter Wiedergabetreue präsentieren, bei denen einige Teile sehr detailliert und andere Teile sehr grob sind.
Ein Beispiel aus der Praxis, bei dem ich Höhen über dem Gelände abgetastet hatte. Das Team hatte beschlossen, das Gelände in 1024 Stücken abzutasten, um die Wiedergabetreue zu maximieren. Unser Kunde wollte eine ReallyGood ™ Antwort.
Jetzt störten mich die Laufzeit-Hits, die dieser spezielle Algorithmus verursachte, und ich wollte verstehen, für wie viel Wiedergabetreue ich tatsächlich bezahlte. Ich hatte keine Geländedaten gesehen und fragte sie, wie sie sie geladen hätten. Die Antwort war "Oh, wir haben kein Gelände. Es ist nur flach."
Es hörte sich so an, als hätte ich ein fantastisches High-Fidelity-Modell, das 1024 Punkte gesammelt hat. Was ich tatsächlich hatte, war ein Low-Fidelity-Modell, das nicht besser war als 1 Punkt 1024-mal abzutasten, sondern eine ganze Tonne langsamer lief und sich als High-Fidelity-Modell tarnte!
In der realen Ingenieurwelt haben Führungskräfte nicht immer die Möglichkeit, die gesamte Architektur eines Modells zu erlernen. Tatsächlich würde ich sagen, dass sie nie die Zeit haben. Unsere Führung traf Entscheidungen unter der Annahme, dass wir ein hervorragendes 1024-Punkte-Modell hatten. Niemand war schuld, es ist nur das, was passiert, wenn Sie die Wiedergabetreue an einem Teil des Modells zu hoch und an dem anderen Teil zu niedrig einstellen. Es ist die Natur des Tieres mit gemischter Treue.
quelle
In Wirklichkeit gibt es die Daten, die wir haben, und es gibt die Daten, die wir nicht haben. Fast immer ist die Datenmenge, über die wir nicht verfügen, viel größer, als wir es aus praktischen oder wirtschaftlichen Gründen erhoffen könnten.
Wenn wir versuchen, die Daten widerwärtig gut auf die wenigen verfügbaren Stichproben abzustimmen, besteht die Gefahr, dass unser Modell wirklich schlechte Schätzungen in Bereichen vornimmt, in denen wir ehrlich gesagt keine Ahnung haben (aufgrund von Datenmangel). Dann gibt uns unser Modell ein falsches Sicherheitsgefühl.
quelle
Aus Sicht des Maschinenbaus liegt der Hauptgrund darin, dass Sie sich nur dann für den zusätzlichen Aufwand einsetzen, wenn sich die Ergebnisse erheblich unterscheiden.
Wenn der Genauigkeitsgrad in Ihrem Modell um Größenordnungen höher ist als der Genauigkeitsgrad, den Sie bei der Ausführung Ihres Entwurfs liefern können, verschwenden Sie Ihren Aufwand. Wenn der in Ihrem Modell beschriebene Genauigkeitsgrad höher ist als erforderlich, hat dies Auswirkungen auf den Kunden. Du verschwendest Geld. Wenn Sie z. B. eine höhere Präzision angeben, als die Konstruktion tatsächlich erfordert (z. B. +/- 0,00001 mm in der Länge eines Entlüftungsrohrs), verschwenden Sie Geld für Ihre Kunden, da eine Entlüftungsöffnung von 350 mm in die Atmosphäre ungefähr die gleiche Arbeit leistet wie eine Entlüftungsöffnung von 350.0005 mm zu Atmosphäre, aber letztere ist deutlich teurer in der Herstellung.
An der Universität haben wir alle gelernt, die physikalische Welt mithilfe der Newtonschen Physik zu modellieren, obwohl es allgemein bekannt ist, dass die post-Newtonsche Physik ein genaueres Modell des physikalischen Verhaltens darstellt. Trotzdem kenne ich kein Maschinenbauprogramm, das Newtonsche Modelle standardmäßig als zu ungenau ansieht. Wenn wir das genauere Modell verwenden und eine Antwort finden, die 0,1% näher an der theoretischen Wahrheit liegt, hat dies in den allermeisten Fällen keinen Einfluss auf unser endgültiges Design. Wenn unsere Streckgrenze um 0,1% abweicht, ergibt sich ein unwesentlicher Unterschied im erforderlichen Querschnitt, der uns dazu veranlasst, nach beiden Methoden genau die gleiche Größe des I-Strahls zu wählen. In diesem Fall bringen die Mehrkosten keinen zusätzlichen Nutzen.
Nun gibt es Situationen, in denen Präzision erforderlich ist, um ein funktionsfähiges Design zu erstellen, beispielsweise die Modellierung einiger Satelliten, die relativistische Physik erfordern. Unter diesen Umständen müssen wir ein Modell finden, das die erforderliche Genauigkeit liefert, und wir müssen das Modell entwerfen. Wenn wir die Abmessungen auf +/- 0,0001% berechnen müssen, ist es völlig umständlich, wenn unsere Teileabmessungen +/- 0,1% betragen. In realen Anwendungen sind Teileabmessungen mit dem letztgenannten Genauigkeitsgrad viel häufiger als die erstgenannten.
quelle
Kosten: Die Kosten für Zeit oder die Kosten für Rechenleistung und die Kosten für Genauigkeit - wenn andere Variablen eine Toleranz von 5% haben, zum Beispiel, warum Ergebnisse mit 1% berechnet werden ...
quelle
In den vorherigen Antworten wurden Eingabe und Kosten erwähnt. Wenn Sie Genauigkeit wollen, z. Bei der Optimierung von Produktionsparametern sind wahrscheinlich mehr Messungen erforderlich. Zunächst müssen Sie analysieren, inwieweit Sie die Kosten im Vergleich zu der Anzahl der Arbeitsstunden senken können. Dies führt zu einer Erhöhung der Messfrequenz oder der Kosten für ein automatisiertes System, das die manuelle Datenerfassung ersetzt. Zweites Beispiel: Wenn Sie sehr genaue Ergebnisse erhalten, in die Sie Zeit und andere Ressourcen investiert haben, um diese zu erhalten, verfügen Sie über angemessene Ausrüstung für Qualitätskontrolle, industrielle Messungen usw. oder sogar Technologie. Wenn Ihre Ergebnisse vergeblich sind, ist die Zeit, die Sie dafür aufgewendet haben, falsch.
quelle
Benötigen Sie ein Satellitenbild mit Zentimeterauflösung, um Wälder anhand ihrer Farbe zu identifizieren? Sicher nicht. Ich wäre nachteilig, da Sie sich für einen nicht-grünen 10-Quadratzentimeter-Fleck entscheiden müssten. Dasselbe gilt für die Modellierung: Die Detailauflösung sollte zur Auflösung Ihrer Zielobjekte passen. Wenn nicht, verlieren Sie Zeit beim Downsizing.
quelle
Die meisten realen Antworten werden durch Ihre künstliche Einschränkung ausgeschlossen, dass Rechenleistung und Rechenzeiten nicht berücksichtigt werden. Ein Modell, dessen Auswertung Stunden oder Tage in Anspruch nimmt, ermöglicht keine schnellen Entwurfsiterationen und verlangsamt die Arbeit auf menschlicher Ebene, erhöht die Kosten und führt möglicherweise zu minderwertigen Ergebnissen. Das clevere Vereinfachen von Modellen ohne zu viel Genauigkeit kann ein sehr nützlicher Ansatz sein. Dann kann das Brute-Force-Modell verwendet werden, um die endgültige Iteration zu validieren.
Es ist möglich, dass übermäßig komplexe Modelle fundamentale Fehler im Modell maskieren oder dass die Arbeit, die erforderlich ist, um Informationen zu sammeln, um das Modell praktisch maximal zu nutzen, den potenziellen Nutzen überwiegt. Wenn Sie beispielsweise die Eigenschaften eines Materials genauer kennen müssen, als der Lieferant sie steuern kann, können Sie entweder die Fehlerbereiche akzeptieren oder jede Materialcharge testen, um das Modell zu optimieren.
quelle