Journalistiek

Onpartijdig, onafhankelijk nieuws, uitsluitend in dienst van het branchebelang.

Edge switch storing legt deel AMS-IX plat

  • Door
  • Arnout Veenman
  • geplaatst op
  • 20 juni 2008 08:08 uur

AMS-IXGistermiddag rond 15:55 uur heeft de Amsterdam Internet Exchange (AMS-IX) zo’n 10 minuten deels plat gelegen, om 16:05 uur werd er overgeschakeld op het backup netwerk (topology swap). AMS-IX directeur Job Witteman liet ISPam.nl weten dat er een hardware storing was aan de edge switch bij Telecity 2. Een menselijke fout zoals het geval was bij een eerdere storing van de AMS-IX is volgens Witteman dit keer uitgesloten. Al wordt de exacte oorzaak van de storing op dit moment nog onderzocht.

Dat een storing aan één van de vijf edge switches van de AMS-IX een relatief grote uitval tot gevolg had is volgens Witteman toe te wijden aan het feit dat ook de netwerken die op de andere edge switches zijn aangesloten geen dataverkeer meer konden uitwisselen met netwerken die op de edge switch bij Telecity 2 zijn aangesloten. Overigens ontkent Witteman dat er de laatste tijd relatief meer storingen dan voorheen zijn. De AMS-IX groeit en wordt steeds belangrijker, waardoor storingen meer opvallen en een grotere impact hebben.

Casper Bakker, 20 juni 2008 8:37 am

Storing kan gebeuren, niet netjes en moet uiteraard zoveel mogelijk worden voorkomen, maar dit is waarom je redundante verbindingen hebt. Wat ik me bij deze storing dan ook nog het meeste afvraag is hoe het kan dat veel intergebruikers veel websites niet meer konden bereiken?

Hebben de accessproviders te weinig capaciteit om de uitval van de AMS-IX niet op te kunnen vangen? Dat zou zeer zorgelijk zijn. Ik heb vrij veel klanten aan de telefoon gehad waarvan het internet het niet meer deed en ook op onze eigen ADSL verbinding hier waren sommige sites niet te bereiken, maar sommige wel.

Ik heb niet zo veel verstand van routing en BGP en dergelijke, maar volgens mij moeten dit soort dingen (bij voldoende capaciteit) automatisch worden omzeild. Of werkt dat niet zo makkelijk?

Igor, 20 juni 2008 8:41 am

Het meest opvallende was dat verbindingen niet snel genoeg werden omgerouteerd naar andere lijnen. Vanuit ons oogpunt was bijvoorbeeld google.nl niet bereikbaar. We kwamen wel over de ams-ix op de eerst volgende google-router maar daarna was het stuk. Het leek wel alsof BGP bleef werken maar er geen verkeer uitgewisseld kon worden.
Een tweede theorie zou kunnen zijn dat de impact zoveel BGP veranderingen bij alle ISP's moest gebeuren dat daarom het veel langer duurde.
Toch heb ik het idee dat als Amsix niet gekozen had om over te gaan naar het backup-netwerk dat het probleem niet door BGP opgelost kon worden. 10 min. vind ik wel erg lang voor BGP.

Lennie, 20 juni 2008 9:17 am

Op het werk zag ik nauwelijks wijzigende routes tijdens de storing, ik vermoed dat het apparaat vooral pakketjes verloor, maar zeker niet alles waardoor BGP-sessies in de lucht bleven en daarom geen routes werder gewijzigd.

Wilfried Dudink, 20 juni 2008 10:06 am

Het grote voordeel van de AMS-IX is dat je "settlement-free" peering kan doen. Dus iedere provider zal zoveel mogelijk via die route proberen af te handelen. Het overige verkeer gaat dan via directe peers ("free" of "paid") en via upstream transit providers.
Het probleem is dan vaak dat die upstream niet gedimensioneerd is om uitval van de peers op te vangen of de transit provider zelf is dusdanig overbelast dat ze het verkeer niet kunnen afhandelen. Hier komt de prijs/kwaliteit verhouding dus weer om de hoek kijken.

Het een kan niet zonder het ander en dus zal je als provider het midden moeten vinden van deze mogelijkheden.

Punica, 20 juni 2008 10:51 am

Inderdaad Wilfried, maar het is opzich ook een logische economische keuze van de providers.

Immers, wat is erger, 1x een storing, met weinig financiele gevolgen, of je zeer dure transit capaciteit gelijk maken aan die van je peering capaciteit en 98% van het jaar daar amper wat van gebruiken.

Peter, 20 juni 2008 1:45 pm

Hoorde ergens ook iets vallen over verschillende sessies die gewoon online leken te zijn maar uiteindelijk niet bereikbaar bleken.

Trebbor, 20 juni 2008 7:31 pm

@ Peter,

Daarom werden de routes ook niet geupdate. Dit is mede de oorzaak dat bijvoorbeeld Google voor veel mensen onbereikbaar was (voorbeeld..)

Igor, 21 juni 2008 8:29 am

Zelf bgplay (http://www.ris.ripe.net/bgplay/) geeft geen updates voor bijv. leaseweb rond de tijd van de storing. Leaseweb was 1 van de partijen volgens de ams-ix die affected was (en hoe..).
Dus ja, de theorie dat BGP bleef werken lijkt aardig te kloppen.

Trebbor, 21 juni 2008 10:02 am

@igor

http://noc.leaseweb.com/alltraffic.png

Rond de 20gbit missen ze zo te zien, heftig :)

Laatste reacties

Bedankt voor het succes van ISPam.nl
Koen Stegeman, Editor-in-Chief & founder Hostingjournalist.com: Jammer Arnout, maar je hebt een mooie bijdrage aan de hosting industrie geleverd, en dat jaren lang....

Bedankt voor het succes van ISPam.nl
Dillard Blom: Jammer dat een 'instituut' verdwijnt, en daarmee een bron van informatie over actuele zaken (en opin...

Bedankt voor het succes van ISPam.nl
L.: Uit automatisme kijk ik toch nog steeds elke dag naar ispam.nl, toch de hoop dat er nog een berichtj...

Bedankt voor het succes van ISPam.nl
Toni Donkers: Arnout bedankt! ik ga het missen dat is een feit!

Bedankt voor het succes van ISPam.nl
Marcel Stegeman: Ik zie het nu pas. Inderdaad jammer maar ik kijk nu al uit naar het volgende project.