Bei der Bewertung der Qualität einer Software, die Sie verwenden möchten (unabhängig davon, ob es sich um eine von Ihnen geschriebene Software oder um ein in Dosen gepacktes Paket handelt), ist es häufig eine gute Idee, zu überprüfen, wie gut sie mit Standarddatensätzen oder -problemen funktioniert. Wo kann man diese Tests zur Überprüfung von Rechenroutinen erhalten?
(Eine Website / ein Buch pro Antwort, bitte.)
Antworten:
Wenn Sie an einer Analyse von spärlichen Matrizen interessiert sind, würde ich auch die spärliche Matrixsammlung der Universität von Florida und den Matrixmarkt von Davis berücksichtigen .
quelle
Die Methode der hergestellten Lösungen ist ein Standard zum Testen von PDEs und anderen Lösungsmitteln. Die meisten symbolischen Algebrasysteme verfügen über Funktionen zum Generieren von Code. Dies ist nützlich, um hergestellte Lösungen zu erstellen. SymPy und Maple haben dazu unter anderem die Funktion ccode.
quelle
Ein Test-Set für IVPs (Initial Value Problems für ODE-Löser) wird derzeit von Personen der Universität Bari (Italien) gepflegt, die es von CWI Amsterdam übernommen haben.
quelle
Zum Testen von Graph Partitioning-Algorithmen gibt es das Graph Partitioning Archive von Walshaw .
quelle
Beim rechnergestützten Elektromagnetismus gibt es eine Reihe bekannter (oder wegen einiger Schwierigkeiten berüchtigter) Testprobleme: das Testen elektromagnetischer Analysemethoden (TEAM) .
Einige von ihnen benötigen wirklich hochmoderne numerische Techniken, um die korrekten Simulationsergebnisse mit den experimentellen Daten in Einklang zu bringen. Zum Beispiel das Leiter-Spulen-Problem .
Ein weiterer Satz von Testproblemen für Maxwell-Gleichungen wird von Dauge: Benchmark-Berechnungen für Maxwell-Gleichungen zur Approximation hoch singulärer Lösungen zusammengestellt . Der im berühmten (oder berüchtigten) Fichera-Würfel:
quelle
Wenn Sie an Benchmarking-Algorithmen für molekulare Strukturen interessiert sind, enthält die Pubchem-Datenbank eine große Sammlung überwiegend organischer Moleküle. Dies kann nützlich sein, um Vorhersagen molekularer Eigenschaften zu vergleichen, die mit verschiedenen Modellen / Programmen erhalten wurden. Die Site bietet mehrere Möglichkeiten zum Herunterladen großer Mengen von Molekülen, die einige vordefinierte Kriterien erfüllen (z. B. chemische Zusammensetzung).
quelle
Arnold Neumaier unterhält eine Reihe von Testproblemen für die uneingeschränkte und eingeschränkte Optimierung (nichtlineare Programmierung). In dieser Sammlung sind die Standardtestprobleme für die uneingeschränkte Optimierung aufgrund von Moré, Garbow und Hillstrom enthalten.
quelle
Die CUTEr -Website aktualisiert den auf der Arnold Neumaier-Website erwähnten CUTE- Testsatz mit einigen zusätzlichen Problemen für die Optimierung und für lineare Löser. Darüber hinaus werden Softwaretools zum Testen und Aktualisieren von linearen Algebra- und Optimierungslösern bereitgestellt.
quelle
Athenas Tests, wenn Sie hyperbolische Erhaltungsgesetze lösen.
quelle
Wir verwenden Wetterdatensätze in unserer Gebäudeenergiesimulationssoftware. Für die USA bestehen die Datensätze aus Wetterbeobachtungen, die (normalerweise an Flughäfen) in den letzten 20 Jahren stündlich durchgeführt wurden.
Datensätze zum Download zur Verfügung .
Handbuch zur Beschreibung des Dateiformats .
quelle
Zum Testen statistischer Algorithmen gibt es ein Handbuch für kleine Datensätze von DJ Hand, F. Daly, K. McConway, D. Lunn und E. Ostrowski. Einige dieser Datensätze können hier heruntergeladen werden .
quelle
Zum Testen von multivariaten statistischen Analysen und Algorithmen für maschinelles Lernen gibt es das UCI-Dataset-Repository unter http://www.ics.uci.edu/~mlearn/.
quelle
Die Website von Hans Mittelman ist eine hervorragende Quelle für die Navigation durch die aktuellen Softwareoptionen bei der numerischen Optimierung. Er enthält seine eigenen Benchmarks sowie Links zu anderen Benchmarks für Testprobleme bei der Optimierung .
quelle
Alan Genz schlug im Artikel Testen mehrdimensionaler Integrationsroutinen eine Testsuite von Funktionen vor . Ich kann keine Online-Version dieses Papiers finden, aber Verweise darauf finden sich in den Papieren über die CUBA-Bibliothek .
quelle
Hier finden Sie eine Sammlung von Referenz-Optimierungsproblemen mit PDE-Einschränkungen, die Roland Herzog von der TU-Chemnitz gepflegt hat .
quelle
Gute Software muss getestet worden sein und sollte angeben, wie die Autoren getestet haben, und entweder die Testdatensätze selbst bereitstellen (z. B. in Form von Regressionstests) oder zumindest Links zu den Daten bereitstellen, mit denen sie getestet wurden.
quelle
Wenn Sie nach großen Grafiken oder Netzwerkdaten zum Testen suchen. Das Stanford Network Analysis Project (SNAP) verfügt über viele große Diagrammdatensätze in der Regel in Form einer anonymisierten Adjazenzliste. Einige ihrer Optionen umfassen:
Daten
Eigenschaften von Daten
Grundwahrheitsstatistiken für die Datensätze:
Werkzeuge
quelle
Daten sind einfach; Die API, um es zu bekommen, kann schwierig sein. Ich empfehle Quandl . Diese Site verfügt über mehr als 10 Millionen öffentlich verfügbare Datensätze, auf die über eine einfache, REST-vollständige API zugegriffen werden kann. Alle Daten werden entweder in CSV oder JSON zurückgegeben. Wenn die Programmierung nicht zu Ihren Stärken gehört, können Sie die Daten auf einfache Weise in Excel übertragen. R-, Python- und Ruby-Programmierer sind mit nativen Bibliotheken genau richtig.
quelle