DL: 08.08.16: Weltweite Systemprobleme an Check-in-Schaltern

ANZEIGE

technikelse

Erfahrenes Mitglied
18.05.2016
2.092
7
Wiesbaden
Da war Southwest wohl wieder mal Trendsetter :eek:

War? Da geht noch was, denn die haben gerade erst angefangen ihre internationalen Strecken von SAAS (Sabre) auf Altéa (Amadeus) umzuziehen. Demnächst (zwischen November und April) wenn die inneramerikanschen Strecken umgestellt werden, wird es sicher noch ganz schön rumpeln.
 

MikeGolf

Erfahrenes Mitglied
15.02.2016
267
70
Erstaunlich, dass der Blackout die komplette Delta-Flotte lahmgelegt hat. Ich habe vor einem Jahr einen Totalausfall des Computersystems bei Air France erlebt, als ich gerade von RBA nach CDG fliegen wollte. Passagierliste, Bordkarten etc. wurden dann von Hand ausgefüllt, was zum Verlust der reservierten Plätze und ca. 1 Stunde Verspätung führte. Immerhin hob die Maschine aber ab. Lag das am Improvisationstalent der marokkanischen Bodencrew oder ist die Computerisierung bei Delta schon weiter fortgeschritten?
 

frabkk

Erfahrenes Mitglied
12.11.2013
2.408
453
CGN
Im November 14 gab es mal bei US Airways (vor dem Marger mit AA) einen weltweiten Systemausfall und dann wurden in FRA auch die Bordkarten mit der Hand ausgefüllt. Flug ging nur leicht verspätet raus. Finde es auch sehr befremdlich, wenn der gesamte Flugverkehr auf Computerabhängigkeit basiert. Einen Plan B sollte man als weltweit operierendes Unternehmen schon immer haben.
 
  • Like
Reaktionen: rotanes

alex42

Erfahrenes Mitglied
02.04.2012
3.997
114
MUC
Ohne die Details zu kennen, aber das muss ja nicht unbedingt nur an der Airline liegen: Ich könnte mir durchaus vorstellen, dass die TSA für Abflüge ex-USA eine maschinenlesbare Bordkarte fordert, in der Passagierdaten gespeichert sind und die automatisch gegen no-fly-lists etc. abgeglichen werden kann.
 

technikelse

Erfahrenes Mitglied
18.05.2016
2.092
7
Wiesbaden
Finde es auch sehr befremdlich, wenn der gesamte Flugverkehr auf Computerabhängigkeit basiert. Einen Plan B sollte man als weltweit operierendes Unternehmen schon immer haben.

Wie soll der Plan B aussehen, wenn eine Airline weltweit vernetzt ist und Check-in Prozesse mit Anschlussflügen durchgeführt werden müssen? Strichlisten oder PDF Bordkarten können sie wohl kaum per email verschicken. Computerabhängigkeit gibt es überall im Luftverkehr: im Cockpit, in der Flugsicherung, bei der Buchung, beim Check-in und und und. Es gilt diese Systeme so ausfallsicher wie möglich zu machen. Aber leider gibt es in der Airlinewelt und speziell in den USA noch reichlich veraltete Systeme. Durch Zusammenschlüsse von mehreren Airlines mit Uraltsystemen hat sich dieses Problem teilweise sogar noch verstärkt. Eine Erneuerung von Systemen kostet sehr viel Geld und Zeit und ist mit vielen Unwägbarkeiten verbunden. Das ist ein Riesenproblem für Airlines. Innovative Technologieunternehmen wie Amazon oder Netflix testen ihre Systeme selbst permanent gegen Ausfälle, in dem sie diese selbst provozieren. Schwachstellen werden so rechtzeitig ermittelt und beseitigt bevor sie zum Problem werden. Aber davon ist die US-Airlineindustrie noch meilenweit entfernt.
 
  • Like
Reaktionen: nimra98

tehbasti

Erfahrenes Mitglied
01.04.2016
862
18
LUX / DSM
Es gibt doch 100% regulatorische Vorgaben bzgl. Disaster Recovery Plans für Airlines.. Da wird im Zweifelsfall einfach ein Failover auf ein anderes Rechenzentrum gemacht und nach kurzer Zeit die Applikation/System wieder hochgefahren. Und Ausfallsicherheit für IT-Systeme gibt es schon ewig (Stichwort Tandem Computers), von daher ist es egal wie alt die Systeme sind.
 

technikelse

Erfahrenes Mitglied
18.05.2016
2.092
7
Wiesbaden
Es gibt doch 100% regulatorische Vorgaben bzgl. Disaster Recovery Plans für Airlines.. Da wird im Zweifelsfall einfach ein Failover auf ein anderes Rechenzentrum gemacht und nach kurzer Zeit die Applikation/System wieder hochgefahren. Und Ausfallsicherheit für IT-Systeme gibt es schon ewig (Stichwort Tandem Computers), von daher ist es egal wie alt die Systeme sind.

Und schon ewig ist das beste Tandem System ist keinen Pfifferling wert gewesen, wenn z.B. ein Backbone abgeraucht ist, der nicht redundant war oder ein Bagger ein Kabel erwischt hat. Und wie die großartig die 100% regularischen Vorgaben bezgl. Desaster Recovery Plans für Airlines funktionieren, hat man eindrucksvoll bei Delta und kürzlich bei Southwest gesehen. [emoji23]
 

tehbasti

Erfahrenes Mitglied
01.04.2016
862
18
LUX / DSM
Und schon ewig ist das beste Tandem System ist keinen Pfifferling wert gewesen, wenn z.B. ein Backbone abgeraucht ist, der nicht redundant war oder ein Bagger ein Kabel erwischt hat. Und wie die großartig die 100% regularischen Vorgaben bezgl. Desaster Recovery Plans für Airlines funktionieren, hat man eindrucksvoll bei Delta und kürzlich bei Southwest gesehen. [emoji23]

Wenn ein komplettes Failover regulatorisch vorgeschrieben ist (?), darf es keine fehlenden Redundanzen bzgl. Business Critical Systems geben. Und wenn der Bagger eine Leitung kappt, muss man zwar keinen Business Continuity Plan invoken, aber kann, dank der heutigen Technologie, das System trotzdem in einem anderen Rechenzentrum wieder starten.

In der Bankenwelt ist ein realistischer DR Test (also failover zu einer anderen Site) in den meisten Ländern vorgeschrieben. Dieser wird auch jährlich durch ein Audit überprüft.

Verstehe solche Ausfälle, die auch extrem sicherheitsrelevant sind, nicht.
 

Worldtraveler42

Erfahrenes Mitglied
15.02.2015
3.868
13
MRS
Wie soll der Plan B aussehen, wenn eine Airline weltweit vernetzt ist und Check-in Prozesse mit Anschlussflügen durchgeführt werden müssen? Strichlisten oder PDF Bordkarten können sie wohl kaum per email verschicken.

Redundanz, Redundanz und nochmals Redundanz.

Und Ausfallsicherheit für IT-Systeme gibt es schon ewig (Stichwort Tandem Computers), von daher ist es egal wie alt die Systeme sind.

Allerdings fällt eben ein System potenziell schneller aus, wenn während Jahren immer nur daran gebastelt und um Zusatzfunktionen erweitert wurde. Irgendwann sollte jedes Computersystem von Grund auf überholt werden sonst droht gegebenenfalls der Kollaps.
 

chrini1

Erfahrenes Mitglied
26.03.2013
6.190
4.715
HAM
In der Bankenwelt ist ein realistischer DR Test (also failover zu einer anderen Site) in den meisten Ländern vorgeschrieben. Dieser wird auch jährlich durch ein Audit überprüft.

Ja, es gibt dort Audits und Vorschriften für sicherheitsrelevante Systeme. Ein Ticketingsystem fällt vermutlich nicht darunter. Es fallen aktuell auch die Kassensysteme der Banken nicht unter die Tests.... Jeder, der hier 100% Verfügbarkeit fordert, hat von der Praxis keine Ahnung.

Und ja, auch wenn ich ein zweites Data Center habe, heißt es nicht, dass es eine ON-ON Kombination ist.
 

Andreas91

Erfahrenes Mitglied
30.03.2015
1.187
2
Ja, es gibt dort Audits und Vorschriften für sicherheitsrelevante Systeme. Ein Ticketingsystem fällt vermutlich nicht darunter. Es fallen aktuell auch die Kassensysteme der Banken nicht unter die Tests.... Jeder, der hier 100% Verfügbarkeit fordert, hat von der Praxis keine Ahnung.

Und ja, auch wenn ich ein zweites Data Center habe, heißt es nicht, dass es eine ON-ON Kombination ist.

Naja, in der Praxis sind Ausfallzeiten von mehreren Stunden wegen eines Stromausfalls in 1 RZ allerdings auch vollkommen unüblich. Redundanz sieht, auch in der Praxis, anders aus.
 

technikelse

Erfahrenes Mitglied
18.05.2016
2.092
7
Wiesbaden
Wenn ein komplettes Failover regulatorisch vorgeschrieben ist (?), darf es keine fehlenden Redundanzen bzgl. Business Critical Systems geben.
Und was ist jetzt die Konsequenz? Wird Delta jetzt vor dem internationalen Business Critical System Fail Tribunal angeklagt? Sie werden schon schmerzhaft (in ihrer Bilanz) spüren, dass es keine gute Idee war an der zu sparen, bzw. nicht ausreichend zu investieren.

Business Continuity Plan invoken,
Beim Bullshit Bingo gewonnen gestern?

...aber kann, dank der heutigen Technologie, das System trotzdem in einem anderen Rechenzentrum wieder starten.
Nicht alles was heute technisch möglich ist, wird auch gemacht, wenn der Controller oder die Beraterfirma es besser wissen.

In der Bankenwelt ist ein realistischer DR Test (also failover zu einer anderen Site) in den meisten Ländern vorgeschrieben. Dieser wird auch jährlich durch ein Audit überprüft.
Airline ungleich Bank

Verstehe solche Ausfälle, die auch extrem sicherheitsrelevant sind, nicht.
Versteht niemand, außer denen, die womöglich händeringend nach Budget für Ausfallsicherheit gefragt haben und vom Management: "dieses Jahr nicht aber nächstes Jahr gibt es Geld für Ausfallsicherheit" zu hören bekommen haben.
 
  • Like
Reaktionen: tehbasti

Brainpool

Erfahrenes Mitglied
15.03.2014
2.801
122
Beim Auto schaut alle 2 Jahre der TÜV nach dem Rechten, aber in Sachen EDV sind doch mindestens 50% der Anlagen Schrottreif.
Wenn man bedenkt das viele Firmen noch nie so etwas wie Backup, Sicherheitskopie etc durchgeführt haben und wenn dann die Festplatte den Geist aufgibt oder der liebe Einbrecher den PC unter den Arm klemmt vor dem Aus stehen, weil eben die gesamte Buchhaltung einschließlich der offenen Forderungen weg ist.
Am besten ist natürlich die Sicherheitskopie auf der gleichen Festplatte...

Auch immer wieder gerne gemacht und im eigenen Bekanntenkreis erlebt, arbeitsintensive Ausarbeitungen wie Doktorarbeit, Forschungsergebnisse der letzten 6 Monate etc ohne Kopie auf dem Notebook was dann unterwegs von Taschendieben geklemmt wird.
Wenn man hinter die Kulissen schaut wird man ganz schnell graue Haare bekommen.
 

flyglobal

Erfahrenes Mitglied
25.12.2009
5.604
505
Wie soll der Plan B aussehen, wenn eine Airline weltweit vernetzt ist und Check-in Prozesse mit Anschlussflügen durchgeführt werden müssen? Strichlisten oder PDF Bordkarten können sie wohl kaum per email verschicken. Computerabhängigkeit gibt es überall im Luftverkehr: im Cockpit, in der Flugsicherung, bei der Buchung, beim Check-in und und und. Es gilt diese Systeme so ausfallsicher wie möglich zu machen. Aber leider gibt es in der Airlinewelt und speziell in den USA noch reichlich veraltete Systeme. Durch Zusammenschlüsse von mehreren Airlines mit Uraltsystemen hat sich dieses Problem teilweise sogar noch verstärkt. Eine Erneuerung von Systemen kostet sehr viel Geld und Zeit und ist mit vielen Unwägbarkeiten verbunden. Das ist ein Riesenproblem für Airlines. Innovative Technologieunternehmen wie Amazon oder Netflix testen ihre Systeme selbst permanent gegen Ausfälle, in dem sie diese selbst provozieren. Schwachstellen werden so rechtzeitig ermittelt und beseitigt bevor sie zum Problem werden. Aber davon ist die US-Airlineindustrie noch meilenweit entfernt.

Normalerweise sollte die IT eines weltweiten Unternehmens mehrere Data Center (mindestens 2) an verschiedenen Standorten, so getrennt, dass sie nicht von der gleichen Naturkatastrophe heimgesucht werden können, betreiben.

Wir (Automobil weltweit), haben 3 globale Datacenter (dazu eins in Reserve) und noch mehrere Cashing Center (an jedem wichtigen Standort) in Betrieb.

Flyglobal
 
  • Like
Reaktionen: Andreas91

technikelse

Erfahrenes Mitglied
18.05.2016
2.092
7
Wiesbaden
Wenn man hinter die Kulissen schaut wird man ganz schnell graue Haare bekommen.

Ein Freund von mir kümmert sich um Netzwerke und Rechner in Arztpraxen. Wenn ich höre was der erzählt, wachsen mir die Haare durch die Mütze. Unfassbar.

Bei Delta möchte ich nicht wissen was für Altsysteme die noch von Northwest betreiben, die sie mit der Fusion als Altlasten übernommen haben. Solche teilweise sehr speziellen Systeme können nicht so einfach in moderne ausfallsichere Infrastrukturen überführt werden, weil die Plattformen so alt sind, dass nur noch Veteranen sie warten können. Um hier eine weitgehende Ausfallsicherheit herzustellen, bedarf es vollkommen neuer Systeme. Diese einzuführen ist ein immenser Aufwand, kostest richtig viel Geld und dauert mehrere Jahre. Solche Projekte werden gerne mal mit Hinblick auf das aktuelle Geschäftsergebnis und die schwierige Marktlage (blablabla...Power Point...) verschoben. Die Quittung kommt dann mitunter schnell und ist gnadenlos. Ich könnte mir vorstellen, dass in das Thema Ausfallsicherheit bei Delta nach diesem Vorfall etwas mehr Dynamik kommt. [emoji33]
 
  • Like
Reaktionen: Brainpool

tehbasti

Erfahrenes Mitglied
01.04.2016
862
18
LUX / DSM
Und was ist jetzt die Konsequenz? Wird Delta jetzt vor dem internationalen Business Critical System Fail Tribunal angeklagt? Sie werden schon schmerzhaft (in ihrer Bilanz) spüren, dass es keine gute Idee war an der zu sparen, bzw. nicht ausreichend zu investieren.


Beim Bullshit Bingo gewonnen gestern?


Nicht alles was heute technisch möglich ist, wird auch gemacht, wenn der Controller oder die Beraterfirma es besser wissen.


Airline ungleich Bank


Versteht niemand, außer denen, die womöglich händeringend nach Budget für Ausfallsicherheit gefragt haben und vom Management: "dieses Jahr nicht aber nächstes Jahr gibt es Geld für Ausfallsicherheit" zu hören bekommen haben.

Ich kenne die Regulations nicht, aber sollte so etwas vorgeschrieben sein in der Branche, wird Delta das wohl definitiv mit der zuständigen Behörde (in dem Fall wohl die FAA) aufarbeiten müssen. Mehr als eine zusätzliche Geldstrafe würde das aber wohl eh nicht werden.

Bist du privat stark frustriert und musst jetzt das an armen Foristen hier auslassen? :(
 

technikelse

Erfahrenes Mitglied
18.05.2016
2.092
7
Wiesbaden
Bist du privat stark frustriert und musst jetzt das an armen Foristen hier auslassen? :(

Nö, ich arbeite in der Technologiebranche schwerpunktmäßig mit US Airlines und vielen Leistungsabietern rund um Transport, Mietwagen und Hotellerie zusammen. Deren Plattformen sind teilweise denen von Banken in etwa so ähnlich wie Heidi Klum Inge Meysel (RIP). Mit Phrasen aus dem Katalog für IT Berater über Ausfallsicherheit können Jahrzehnte andauernde Investitionversäumnisse in diese Branche leider nicht beseitigt werden. Eine vermeintliche Geldstrafe irgendeiner Behörde ist Peanuts im Vergleich zu den Kosten, die Delta am Bein hat, weil ihre gesamte Flotte ein paar Stunden fast still stand. Das haben sie vermutlich bereits selbst gemerkt.
 
Zuletzt bearbeitet:

tehbasti

Erfahrenes Mitglied
01.04.2016
862
18
LUX / DSM
Es ist doch wurscht ob es eine Bank oder eine Airline ist. Wenn ein System business critical ist, also das operative Geschäfts davon abhängt, dann sollte es ausfallsicher oder zumindestens schnell wiederherstellbar gestaltet sein. Wobei es nun ja auch sein kann, dass das bei Delta der Fall war und der Failover nur nicht funktioniert hat. Alles andere wäre allerdings wohl schlechtes Risk Management :)