Flugpreise - Welche Analyse sollte verwendet werden, um wettbewerbsfähiges Preissetzungsverhalten und Preiskorrelationen zu ermitteln?

12

Ich möchte das Preissetzungsverhalten von Fluggesellschaften untersuchen - insbesondere, wie Fluggesellschaften auf die Preise der Wettbewerber reagieren.

Da ich sagen würde, dass mein Wissen über komplexere Analysen sehr begrenzt ist, habe ich fast alle grundlegenden Methoden angewendet, um eine Gesamtansicht der Daten zu erhalten. Dies schließt einfache Diagramme ein, die bereits helfen, ähnliche Muster zu identifizieren. Ich verwende auch SAS Enterprise 9.4.

Ich suche jedoch einen mehr auf Zahlen basierenden Ansatz.

Datensatz

Der von mir verwendete (selbst) gesammelte Datensatz enthält ca. 54.000 Tarife. Alle Tarife wurden täglich (jede Nacht um 00:00 Uhr) innerhalb eines Zeitfensters von 60 Tagen abgeholt.Sammelmethode

Jeder Flugpreis innerhalb dieses Zeitfensters wird also mal je nach Verfügbarkeit des Flugpreises und Abflugdatum des Fluges verrechnet, wenn das Abholdatum des Flugpreises verstrichen ist. (Sie können keinen Flugpreis für einen Flug abholen, wenn das Abflugdatum des Fluges in der Vergangenheit liegt.)n

Das unformatierte sieht im Grunde so aus: (gefälschte Daten)

+--------------------+-----------+--------------------+--------------------------+---------------+
| requestDate        | price| tripStartDeparture | tripDestinationDeparture | flightCarrier |
+--------------------+-----------+--------------------+--------------------------+---------------+
| 14APR2015:00:00:00 | 725.32    | 16APR2015:10:50:02 | 23APR2015:21:55:04       | XA            |
+--------------------+-----------+--------------------+--------------------------+---------------+
| 14APR2015:00:00:00 | 966.32    | 16APR2015:13:20:02 | 23APR2015:19:00:04       | XY            |
+--------------------+-----------+--------------------+--------------------------+---------------+
| 14APR2015:00:00:00 | 915.32    | 16APR2015:13:20:02 | 23APR2015:21:55:04       | XH            |
+--------------------+-----------+--------------------+--------------------------+---------------+

"DaysBeforeDeparture" wird über where berechnetich=s-c

  • Ich & Intervall (Tage vor Abreise)
  • s & Datum des Flugpreises (Abflug)
  • Datum, an dem der Fahrpreis abgeholt wurde

Hier ist ein Beispiel eines gruppierten Datensatzes von I (DaysBeforeDep.) (Gefälschte Daten!):

+-----------------+------------------+------------------+------------------+------------------+
| DaysBefDeparture | AVG_of_sale | MIN_of_sale | MAX_of_sale | operatingCarrier |
+-----------------+------------------+------------------+------------------+------------------+
| 0               | 880.68           | 477.99           | 2,245.23         | DL           |
+-----------------+------------------+------------------+------------------+------------------+
| 0               | 904.89           | 477.99           | 2,534.55         | DL           |
+-----------------+------------------+------------------+------------------+------------------+
| 0               | 1,044.39         | 920.99           | 2,119.09         | LH               |
+-----------------+------------------+------------------+------------------+------------------+

Was mir bisher eingefallen ist

Anhand der Liniendiagramme kann ich bereits abschätzen, dass mehrere Linien einen hohen Korrelationsfaktor haben werden. Daher habe ich versucht, die Korrelationsanalyse zuerst für die gruppierten Daten zu verwenden. Aber ist das der richtige Weg? Grundsätzlich versuche ich jetzt eher Korrelationen zu den Durchschnitten als zu den Einzelpreisen herzustellen? Gibt es eine andere Art und Weise?

Ich bin mir nicht sicher, welches Regressionsmodell hier passt, da sich die Preise in keiner linearen Form bewegen und nicht linear erscheinen. Würde ich ein Modell für jede Preisentwicklung einer Fluggesellschaft brauchen?

PS: Dies ist eine lange Textwand. Wenn ich etwas klären muss, lass es mich wissen. Ich bin neu in diesem U-Boot.

Hat jemand eine Ahnung? :-)

s1x
quelle

Antworten:

9

Warnung eines ehemaligen Analysten der Fluggesellschaft Revenue Management: Mit diesem Ansatz bellen Sie möglicherweise den falschen Baum an. Entschuldigung für die folgende Textwand, aber diese Daten sind sehr viel komplexer und verrauscht, als es auf den ersten Blick erscheinen mag. Wir wollten daher eine kurze Beschreibung ihrer Generierung geben. vorgewarnt ist gewappnet.

Airline-Tarife haben zwei Komponenten: Alle tatsächlichen Tarife (einschließlich der Tarifbestimmungen und Ihrer Angaben), die eine Fluggesellschaft für eine bestimmte Strecke zur Verfügung hat. Die meisten davon werden vom Airline Tariff Publishing Company veröffentlicht (einige davon sind für spezielle Zwecke bestimmt) nicht, aber dies sind eher die Ausnahme als die Regel) und die tatsächliche Bestandsverwaltung, die die Fluggesellschaft täglich durchführt.

Die Tarife können viermal täglich in festgelegten Intervallen bei ATPCO eingereicht werden. In diesem Fall besteht der Tarif in der Regel aus einer Mischung aus Hinzufügungen, Löschungen und Änderungen bestehender Tarife. Wenn eine Fluggesellschaft eine Preisaktion einleitet (vorausgesetzt, ihre Konkurrenten versuchen nicht, ihre eigenen Schritte zu unternehmen), müssen sie in der Regel bis zur nächsten Aktualisierung warten, um zu sehen, ob ihre Konkurrenten folgen / reagieren. Das Gegenteil ist der Fall, wenn ein Wettbewerber eine Preisaktion einleitet, da die Fluggesellschaft bis zur nächsten Aktualisierung warten muss, bevor sie reagieren kann.

Nun, das ist alles in Bezug auf die Tarife gut und schön, aber das Problem ist, dass die Tarife, da sie alle in ATPCO veröffentlicht werden, die zweitbeste Sache für die öffentliche Information sind ... alle Ihre Konkurrenten können sehen, was Sie haben Sie sind in Ihrem Arsenal, daher sind Versuche der Verschleierung keine Seltenheit, z. B. das Veröffentlichen von Tarifen, denen niemals ein Inventar zugewiesen wird, und das Auflisten aller Tarife als Abreisetag usw.

In vielerlei Hinsicht hängt die geheime Sauce von der tatsächlichen Bestandsaufteilung ab, dh von der Anzahl der Sitzplätze auf jedem Flug, die Sie für einen bestimmten Tarif verkaufen möchten, und diese Informationen sind nicht öffentlich verfügbar. Sie können einige Einblicke erhalten, indem Sie die Web-Informationen durchsuchen, aber die möglichen Kombinationen von Abfahrtszeit / -datum und Tarifregeln sind sehr zahlreich und eskalieren möglicherweise schnell, wenn Sie nicht in der Lage sind, den Überblick zu behalten.

Normalerweise ist eine Fluggesellschaft nur bereit, eine Handvoll Sitze für einen sehr niedrigen Preis zu verkaufen, und die Leute, die sich die Plätze sichern, müssen weit im Voraus buchen, damit die Tarifregeln sie nicht aussperren oder andere Reisende sie einfach schlagen. Die Fluggesellschaft wird bereit sein, ein paar Plätze mehr für einen höheren Preis zu verkaufen, und so weiter und so fort. Sie werden sehr gerne alle Sitzplätze für den höchsten Preis verkaufen, den sie veröffentlicht haben, aber dies ist normalerweise nicht möglich.

Was Sie sehen, wenn die Preise mit zunehmender Annäherung an den Abreisetag steigen, ist einfach der natürliche Vorgang, dass die billigen Sitzplätze weiter ausgebucht werden, während der verbleibende Bestand allmählich teurer wird. Natürlich gibt es hier einige Einschränkungen. Der RM-Prozess wird aktiv verwaltet und menschliches Eingreifen ist weit verbreitet, da das RM-Team im Allgemeinen bestrebt ist, seine Umsatzziele zu erreichen und den Umsatz bei jedem Flug zu maximieren. Daher können Flüge, die sich schnell füllen, durch das Schließen niedriger Tarife "verschärft" werden. Flüge, die nur langsam gebucht werden, können durch Zuweisung von mehr Sitzplätzen zu niedrigeren Tarifen "gelockert" werden.

Es gibt ein ständiges Zusammenspiel und einen ständigen Wettbewerb zwischen den Fluggesellschaften in diesem Bereich, aber es ist nicht sehr wahrscheinlich, dass Sie die tatsächliche Dynamik nur durch Abwracken der Tarife erfassen. Verstehen Sie mich nicht falsch, wir hatten solche Tools zur Verfügung, und trotz ihrer Einschränkungen waren sie sehr wertvoll, aber sie waren nur eine Datenquelle, die in den Entscheidungsprozess einfloss. Sie benötigen Zugriff auf Hunderte, wenn nicht Tausende von operativen Entscheidungen, die von RM-Teams täglich getroffen werden, sowie aktuelle Informationen, wie sie zu diesem Zeitpunkt angezeigt werden. Wenn Sie keinen Airline-Partner finden, mit dem Sie zusammenarbeiten können, um diese Daten abzurufen, müssen Sie möglicherweise alternative Datenquellen in Betracht ziehen.

Ich würde empfehlen, den Zugriff auf O & D-Tarifdaten aus dem Official Airline Guide (oder einem ihrer Konkurrenten) zu prüfen und dies für Ihre Analyse zu verwenden. Es basiert auf Stichproben (etwa 10% aller verkauften Tickets) und wird auf einem höheren Niveau aggregiert, als es ideal wäre. Daher ist eine sorgfältige Routenauswahl unerlässlich (ich würde etwas mit vielen Fluggesellschaften empfehlen, die mehrmals täglich nonstop fliegen) große Flugzeuge), aber Sie können sich möglicherweise ein besseres Bild davon machen, was tatsächlich verkauft wurde (Durchschnittspreis) und wie viel davon verkauft wurde (Auslastungsfaktor), im Vergleich zu dem, was zu einem bestimmten Zeitpunkt zum Verkauf angeboten wird. Mit diesen Informationen sind Sie möglicherweise besser in der Lage, zumindest die Ergebnisse der Preisstrategie der Fluggesellschaften zu untersuchen und daraus Rückschlüsse zu ziehen.

habu
quelle
Vielen Dank für Ihre ausführliche Erklärung. Ich stimme Ihnen zu, dass eine solche Analyse, die nur auf Preisen basiert, sehr begrenzt ist. Dies beinhaltet auch insbesondere Tarifbestimmungen (erstattbare Tickets, Mindestaufenthalt usw.). Einige dieser Einschränkungen können durch das Sammeln immer gleicher Tarife überwunden werden, um die Vergleichbarkeit zu gewährleisten. Eine wichtige Information - wie Sie bereits erwähnt haben - ist jedoch, dass die Anzahl der verfügbaren Sitzplätze (kann! = Sitzplätze in einem Flugzeug sein) und die tatsächlich verkaufte Anzahl an Tickets fehlt.
s1x
Der Zugriff auf solche Daten ist sehr begrenzt und veraltet (z. B. Datenbank 1B von US DOT). Einige Untersuchungen wie Clark R. und Vincent N. (2012) Capacity-Kontingent Preise [...] Link enthält solche Daten und bieten viel bessere Einblicke. Ich bin mir der Einschränkungen bewusst (hoffentlich ;-)) und wie Sie bereits erwähnt haben, gibt es viel mehr Informationen, die die Preise beeinflussen. Wenn Sie jedoch einen bestimmten Markt beobachten, können Sie ein Gefühl dafür bekommen , was passiert. Sie können feststellen, ob es ein compeitives Verhalten und unterschiedliche Preisstrategien gibt. Sie werden jedoch niemals die Ursache finden können.
s1x
1
@ s1x - Ich stimme zu und ich wünschte, ich hätte eine solide Alternative zu bieten, aber wie Sie selbst erfahren haben, sind detaillierte Umsatzdaten das am besten gehütete Geheimnis bei jeder Fluggesellschaft. Ich wollte nur sicherstellen, dass Sie sich dessen bewusst sind und wissen, was bei der Datengenerierung anfällt. Darüber hinaus gefällt mir, was Sie versuchen, und ich denke, die andere Antwort ist ein Schritt in die richtige Richtung, technisch gesehen. Wenn ich vorschlagen darf, können Sie sich auch die Verwendung der Kreuzkorrelation zwischen Ihren verschiedenen TS während der Datenexploration ansehen, da dies häufig hilfreich ist, um Muster zwischen verknüpften TS zu erkennen.
Habu
4

Neben der deskriptiven und visuellen explorativen Datenanalyse (EDA) würde ich versuchen, die Zeitreihenanalyse als umfassendere und komplexere Analyse zu verwenden. Insbesondere würde ich eine Zeitreihen-Regressionsanalyse durchführen . Die Zeitreihenanalyse ist ein riesiger Forschungs- und Praxisbereich. Wenn Sie mit den Grundlagen nicht vertraut sind, empfehle ich, mit dem oben verlinkten Wikipedia-Artikel zu beginnen, schrittweise nach genaueren Themen zu suchen und die entsprechenden Artikel, Artikel und Bücher zu lesen.

Da die Zeitreihenanalyse ein sehr beliebter Ansatz ist, wird sie von den meisten kommerziellen Open-Source- und Closed-Source- Datenforschungs- und Statistikumgebungen (Software) wie R , Python , SAS , SPSS und vielen anderen unterstützt. Wenn Sie dafür R verwenden möchten , überprüfen Sie meine Antworten zur allgemeinen Zeitreihenanalyse sowie zur Klassifizierung und Clusterbildung von Zeitreihen . Ich hoffe das ist hilfreich.

Aleksandr Blekh
quelle
Vielen Dank für Ihre Antwort @Aleksandr Blekh - sehr geschätzt. Ich werde gleich darauf eingehen. Vielleicht eine blöde Frage, aber bitte korrigieren Sie mich hier, wenn ich mich irre: eine Korrelationsanalyse, bei der eine Fluggesellschaft als Variable für die Korrelation verwendet wird. Die Ergebnisse waren bisher überzeugend, da einige Fluggesellschaften espc. Diejenigen, die Codeshare-Vereinbarungen hatten, hatten ähnliche Preise. Würden so hohe Korrelationen zB: ColumnUA(LH) 0.90435 <.0001 ColumnSQ 0.32544 <.0001 ColumnAF(DL) 0.55336 <.0001 Ich gehe davon aus, dass solche Ergebnisse ähnliche Preismuster anzeigen . Was würde ich mit einer Regressionsanalyse herausfinden?
s1x
@ s1x: Gern geschehen (zögern Sie nicht, Ihre Meinung zu ändern / zu akzeptieren, wenn Sie die Antwort zu schätzen wissen und wenn Sie dafür genügend Ansehen haben). Nun zu Ihrer Frage. Wie ich bereits sagte, ist die TS-Analyse komplexer und umfassender. Insbesondere die TS-Regression ist für die sogenannte Autoregression und andere TS-Komplexitäten verantwortlich. Daher mein Vorschlag, die TS-Regressionsanalyse anstelle der einfacheren herkömmlichen zu verwenden. Sie sollten auch immer mit EDA beginnen, unabhängig davon, welche Datenanalyse Sie durchführen möchten (tatsächlich ändert EDA häufig Ihre Pläne).
Aleksandr Blekh