Wie weit kann man mit Excel gehen? [geschlossen]

8

In meinem Unternehmen kümmern wir uns um alle Analysen über Excel. Dies umfasst hauptsächlich Planungs-, Produktionsplanungs- und Buchhaltungsvorgänge. Wir versuchen derzeit, ein wenig Vorhersagemodellierung hinzuzufügen, und Excel reicht bis zu einem gewissen Punkt aus, unterstützt jedoch keine komplexen Modelle.

Aus meiner Sicht sind die Hauptvorteile von Excel die Benutzerfreundlichkeit und die Benutzerfreundlichkeit, mit der Sie Personen finden und schulen können, um sich daran zu gewöhnen. Auf der anderen Seite können anspruchsvollere Umgebungen (z. B. R, Python) eine größere Vielfalt von Analyseaufgaben bewältigen, erfordern jedoch besser ausgebildete Personen.

Ich habe diese Frage auch gelesen , ob Excel für Data Science ausreicht, und obwohl es für meinen Zweck etwas außerhalb des Anwendungsbereichs liegt, ist die Schlussfolgerung, dass Tools wie R und Python viel besser sind als Excel.

Meine Frage lautet (im Kontext der Datenanalyse): "Wie weit können wir mit Excel kommen, ohne auf ein komplexeres Tool umsteigen zu müssen?" oder "Ab wann müssen wir von Excel nach -let's say- R migrieren?"

Vielen Dank!

Jcart
quelle
Mein Kommentar für das, was es wert ist: Excel ist in Ordnung für relativ kleine Datensätze bekannter Größe. Es ist schrecklich für große Datensätze und für Datensätze unterschiedlicher Länge.
Adrian Keister
1
Mögliches Duplikat von Verwenden Datenwissenschaftler Excel?
Tuomastik

Antworten:

2

TL; DR

Wenn Sie unbegrenzte Zeit haben und eine 64-Bit-Version von Excel verwenden, können Sie mit Excel so weit kommen wie mit jedem anderen Datenanalysetool.

Zeit

Ich erwähne die Zeit als meinen ersten Faktor, da in Excel nur grundlegende Funktionen integriert sind, wie z. B. Summieren, Generieren von Zufallszahlen, Nachschlagen usw. Diese entsprechen einer Art Standardbibliothek , über die Python und R ebenfalls verfügen. Mit diesen Grundfunktionen können Sie mit genügend Zeit so ziemlich jedes Analysetool aufbauen. Erwarten Sie keine gute Laufzeitleistung. In Python und R gibt es jedoch viele, viele Pakete, die bereits erstellt wurden, die eine gute Leistung erbringen und von vielen Personen getestet wurden und denen daher vertraut wird.

Erinnerung

Mein zweiter Punkt zu 64-Bit-Excel ist, dass dadurch viel mehr Speicher von einer einzelnen Excel-Instanz verwendet werden kann. Dadurch können viel mehr Zellen gefüllt werden. Die Verwendung von 32-Bit-Excel beschränkt Sie auf Projekte mit etwa 2 GB. Das ist eine ganze Menge Daten, aber es ist eine harte Grenze.

Dann Schritte in 64-Bit-Excel, was im Grunde keine Speicherbeschränkungen mehr bedeutet - nur diejenigen, die von Ihrer Hardware stammen, und das bedeutet, dass Python und R ebenfalls in ihren Spuren gestoppt werden.

Um einige Zahlen bereitzustellen, können wir einfach die Anzahl der Bits berechnen, die in jeder Version gespeichert werden können. Hier in Pythons interaktiver Eingabeaufforderung:

In [1]: (2**32) / 10**9          # 10^9 means the result is 4.3 Gb
Out[1]: 4.294967296

In [9]: (2**64) / 10**18         # 10^15 means the result is 18.4 Eb
Out[9]: 18.446744073709553

Ebbedeutet exa-Bytes . Dies bedeutet 18,4 Millionen Millionen Gigabyte.

Ich stelle fest, dass die Berechnung 4 GB für 32-Bit anzeigt, während ich oben 2 GB sagte. Ich habe gelesen, dass die 32-Bit-Version eine Art hartes Limit hat. Ich weiß nicht oder kümmere mich nicht darum, warum das so ist ... Ich benutze Python und R ;-)

Auf jeden Fall hoffe ich, dass dies ausreicht, um Sie davon zu überzeugen, dass das Gedächtnis kein Thema ist, wenn Sie eine mutige Person sind, die bereit ist, Ihre ganze Zeit damit zu verbringen, Werkzeuge von Grund auf aufzubauen!

Zusammenfassung

Wenn Sie eine komplizierte Geschäftslogik haben, bei der die eigentliche Analyse mathematisch einfach ist, bleiben Sie bei Excel. Geschäftsleute werden Sie dafür lieben.

Wenn Sie mehr als eine lineare Regression durchführen möchten, verwenden Sie Python oder R.

Vorsichtsmaßnahmen

Soweit ich weiß, können Sie mit Excel keine Remote- oder verteilten Aufgaben ausführen, während dies mit Python und (meiner Meinung nach etwas weniger) R relativ einfach ist. An diesem Punkt würde ich Excel aufgeben. Sie müssten wahrscheinlich Ihre eigenen Tools in C # oder C ++ mithilfe des .NET-Frameworks implementieren.

n1k31t4
quelle