Opened 12 years ago

Closed 12 years ago

#252 closed incident (fixed)

flapperende routering op som2

Reported by: huub Owned by:
Keywords: Cc:
Location: Generiek

Description

SOM2 stuurt het internetverkeer afwisselend richting LHS (via Psycho) en DeClercq (via Leythenrode). Zelfde aantal hops. Getest vanaf een client verbonden met NodeHuub, zie hieronder.
huubsmc:~ huubsch$ traceroute www.nu.nl
traceroute: Warning: www.nu.nl has multiple addresses; using 62.69.184.21
traceroute to www-nu-nl.gl.sanomaservices.nl (62.69.184.21), 64 hops max, 52 byte packets

1 172.17.16.129 (172.17.16.129) 3.295 ms 2.863 ms 2.806 ms
2 172.16.4.9 (172.16.4.9) 4.530 ms 4.532 ms 4.433 ms
3 172.16.16.17 (172.16.16.17) 6.482 ms 6.329 ms 7.645 ms
4 172.16.16.116 (172.16.16.116) 8.187 ms 8.470 ms 8.609 ms
5 172.16.3.52 (172.16.3.52) 9.031 ms 9.722 ms 9.348 ms
6 172.16.3.52 (172.16.3.52) 9.120 ms 9.147 ms 9.548 ms

huubsmc:~ huubsch$ traceroute www.nu.nl
traceroute: Warning: www.nu.nl has multiple addresses; using 62.69.184.24
traceroute to www-nu-nl.gl.sanomaservices.nl (62.69.184.24), 64 hops max, 52 byte packets

1 172.17.16.129 (172.17.16.129) 3.291 ms 2.889 ms 2.774 ms
2 172.16.4.9 (172.16.4.9) 5.333 ms 4.738 ms 4.845 ms
3 172.16.16.17 (172.16.16.17) 7.120 ms 8.093 ms 6.347 ms
4 * * 172.16.17.188 (172.16.17.188) 10.711 ms
5 172.16.3.212 (172.16.3.212) 11.829 ms 11.510 ms 12.366 ms
6 172.16.3.212 (172.16.3.212) 20.356 ms 16.192 ms 56.896 ms

huubsmc:~ huubsch$ traceroute www.nu.nl
traceroute: Warning: www.nu.nl has multiple addresses; using 62.69.184.24
traceroute to www-nu-nl.gl.sanomaservices.nl (62.69.184.24), 64 hops max, 52 byte packets

1 172.17.16.129 (172.17.16.129) 3.327 ms 2.592 ms 2.558 ms
2 172.16.4.9 (172.16.4.9) 4.536 ms 4.615 ms 4.728 ms
3 172.16.16.17 (172.16.16.17) 6.365 ms 5.836 ms 6.092 ms
4 172.16.17.188 (172.16.17.188) 9.700 ms 9.363 ms 9.421 ms
5 172.16.3.212 (172.16.3.212) 11.670 ms 13.279 ms 11.738 ms
6 172.16.3.212 (172.16.3.212) 11.710 ms 11.115 ms 12.175 ms

huubsmc:~ huubsch$ traceroute www.nu.nl
traceroute: Warning: www.nu.nl has multiple addresses; using 62.69.179.15
traceroute to www-nu-nl.gl.sanomaservices.nl (62.69.179.15), 64 hops max, 52 byte packets

1 172.17.16.129 (172.17.16.129) 4.568 ms 2.469 ms 3.153 ms
2 172.16.4.9 (172.16.4.9) 5.037 ms 4.709 ms 4.392 ms
3 172.16.16.17 (172.16.16.17) 6.692 ms 6.768 ms 6.416 ms
4 172.16.16.116 (172.16.16.116) 8.711 ms 8.195 ms 8.154 ms
5 172.16.3.52 (172.16.3.52) 9.629 ms 10.140 ms 8.902 ms
6 172.16.3.52 (172.16.3.52) 9.689 ms 9.843 ms 9.516 ms

huubsmc:~ huubsch$ traceroute www.nu.nl
traceroute: Warning: www.nu.nl has multiple addresses; using 62.69.184.24
traceroute to www-nu-nl.gl.sanomaservices.nl (62.69.184.24), 64 hops max, 52 byte packets

1 172.17.16.129 (172.17.16.129) 2.729 ms 2.747 ms 2.997 ms
2 172.16.4.9 (172.16.4.9) 4.360 ms 4.470 ms 4.659 ms
3 172.16.16.17 (172.16.16.17) 6.219 ms 6.773 ms 5.851 ms
4 * * *
5 * * *
6 * * *
7 *C

huubsmc:~ huubsch$ traceroute www.nu.nl
traceroute: Warning: www.nu.nl has multiple addresses; using 62.69.179.15
traceroute to www-nu-nl.gl.sanomaservices.nl (62.69.179.15), 64 hops max, 52 byte packets

1 172.17.16.129 (172.17.16.129) 2.982 ms 2.721 ms 2.673 ms
2 172.16.4.9 (172.16.4.9) 4.414 ms 4.383 ms 4.439 ms
3 172.16.16.17 (172.16.16.17) 6.073 ms 6.058 ms 6.159 ms
4 * * *
5 * * *
6 * * *
7 172.16.5.172 (172.16.5.172) 12.450 ms 11.531 ms 11.115 ms

huubsmc:~ huubsch$ traceroute www.nu.nl
traceroute: Warning: www.nu.nl has multiple addresses; using 62.69.184.21
traceroute to www-nu-nl.gl.sanomaservices.nl (62.69.184.21), 64 hops max, 52 byte packets

1 172.17.16.129 (172.17.16.129) 3.120 ms 2.981 ms 2.677 ms
2 172.16.4.9 (172.16.4.9) 4.895 ms 4.715 ms 4.711 ms
3 172.16.16.17 (172.16.16.17) 6.408 ms 8.784 ms 5.977 ms
4 172.16.17.188 (172.16.17.188) 9.331 ms 10.424 ms 9.327 ms
5 172.16.3.212 (172.16.3.212) 13.583 ms 13.251 ms 11.388 ms
6 172.16.3.212 (172.16.3.212) 12.417 ms 12.272 ms 12.877 ms

huubsmc:~ huubsch$ traceroute www.nu.nl
traceroute: Warning: www.nu.nl has multiple addresses; using 62.69.179.15
traceroute to www-nu-nl.gl.sanomaservices.nl (62.69.179.15), 64 hops max, 52 byte packets

1 172.17.16.129 (172.17.16.129) 3.366 ms 2.953 ms 3.227 ms
2 172.16.4.9 (172.16.4.9) 4.381 ms 4.603 ms 4.702 ms
3 172.16.16.17 (172.16.16.17) 6.420 ms 6.968 ms 6.333 ms
4 172.16.16.116 (172.16.16.116) 7.805 ms 8.008 ms 8.381 ms
5 172.16.3.52 (172.16.3.52) 9.483 ms 9.632 ms 8.941 ms
6 172.16.3.52 (172.16.3.52) 9.134 ms 9.241 ms 9.417 ms

Change History (7)

comment:1 by huub, 12 years ago

NodeHuub heeft nog een derde route naar internet, die ook af en toe voorkomt (via Cetim2, LUMC en Unigor1 naar ZwaluwAK), vanaf de node ook 4 hops:
HybridHuub# traceroute to www-nu-nl.gl.sanomaservices.nl (62.69.184.24), 64 hops max, 40 byte packets

1 172.16.4.25 (172.16.4.25) 2.192 ms 2.063 ms 1.782 ms
2 172.16.4.97 (172.16.4.97) 3.634 ms 4.020 ms 3.503 ms
3 172.16.4.81 (172.16.4.81) 5.089 ms 5.579 ms 5.091 ms
4 172.16.3.70 (172.16.3.70) 6.775 ms 7.548 ms 8.088 ms
5 172.16.3.70 (172.16.3.70) 6.591 ms 7.059 ms 6.935 ms

comment:2 by lodewijk, 12 years ago

ik heb wat code in de daemon gestopt die als er meerdere paden die hetzelfde kosten zijn de gateway die het laagste adres heeft laat winnen, en ook de default gateway zo aanpast wanneer nodig.

dit draait nu op node huub en node som2. zie je het nu nog flapperen?

comment:3 by huub, 12 years ago

Eerste indruk: op nodehuub werkt youtube en speedtest nu prima. Downloadsnelheid in speedtest is ook veel beter constant (geen dips).
Bij SOM2 iets anders getest, nl. met fetch van een grote file van internet. Dat lijkt de routering in de war te schoppen. De pingtijden over zo'n interlink lopen dan ook flink op. Misschien ziet lvrouted geen pakketjes meer komen?
(ingekort):
HybridSOM2# traceroute www.nu.nl
..

1 172.16.16.116 (172.16.16.116) 2.211 ms 2.284 ms 1.888 ms
2 172.16.3.52 (172.16.3.52) 3.542 ms 3.391 ms 3.591 ms

HybridSOM2# fetch -o /dev/null http://www.bbned.nl/scripts/speedtest/download/file32mb.bin
/dev/null 84% of 32 MB 1123 kBps 00m04sC
fetch: transfer interrupted

HybridSOM2# traceroute www.nu.nl

1 * * *

C
HybridSOM2# traceroute www.nu.nl
traceroute: Warning: www.nu.nl has multiple addresses; using 62.69.179.12
traceroute to www-nu-nl.gl.sanomaservices.nl (62.69.179.12), 64 hops max, 40 byte packets

1 * * *

C
HybridSOM2# traceroute www.nu.nl

1 172.16.16.116 (172.16.16.116) 3.720 ms 2.381 ms 1.685 ms
2 172.16.16.116 (172.16.16.116) 2.002 ms !H 2.016 ms !H 1.889 ms !H

.....
HybridSOM2# traceroute www.nu.nl

1 172.16.17.188 (172.16.17.188) 3.543 ms 3.553 ms 3.440 ms
2 172.16.5.172 (172.16.5.172) 5.295 ms 5.239 ms 5.126 ms
3 172.16.5.172 (172.16.5.172) 5.184 ms 5.256 ms 5.298 ms

HybridSOM2# fetch -o /dev/null http://www.bbned.nl/scripts/speedtest/download/file32mb.bin
/dev/null 0% of 32 MB 436 kBps
fetch: http://www.bbned.nl/scripts/speedtest/download/file32mb.bin: Connection reset by peer
HybridSOM2# fetch -o /dev/null http://www.bbned.nl/scripts/speedtest/download/file32mb.bin
/dev/null 36% of 32 MB 710 kBps 00m29s
fetch: transfer interrupted

HybridSOM2# traceroute www.nu.nl

1 * * *

C
HybridSOM2# traceroute www.nu.nl

1 * * *
2 * 172.16.16.116 (172.16.16.116) 3.612 ms !H 2.362 ms !H

HybridSOM2# traceroute www.nu.nl

1 172.16.16.116 (172.16.16.116) 2.025 ms 1.952 ms 1.959 ms
2 172.16.16.116 (172.16.16.116) 1.904 ms !H 1.995 ms !H 1.964 ms !H

HybridSOM2# traceroute www.nu.nl

1 172.16.17.188 (172.16.17.188) 3.778 ms 3.934 ms 3.392 ms
2 172.16.5.172 (172.16.5.172) 5.386 ms 5.128 ms 5.033 ms
3 172.16.5.172 (172.16.5.172) 5.046 ms 5.199 ms 5.424 ms

en na een paar minuten:

HybridSOM2# traceroute www.nu.nl

1 172.16.16.116 (172.16.16.116) 1.939 ms 1.829 ms 2.612 ms
2 172.16.3.52 (172.16.3.52) 3.716 ms 3.322 ms 3.382 ms
3 172.16.3.52 (172.16.3.52) 3.533 ms 3.374 ms 3.414 ms

en daar blijft hij dan op staan, zo te zien.

comment:4 by huub, 12 years ago

Het lijkt een som2/psycho probleem: op nodehuub kan ik rustig zo'n fetch doen zonder effect op de routering, ping tijden gaan eventjes omhoog, parallelle radiouitzending gaat ongestoord door.

comment:5 by lodewijk, 12 years ago

ja als je een ping naar de andere kant van de link tussen som2 en psycho laat lopen terwijl je die fetch doet zie je dat 'ie er gewoon mee op houdt als er verkeer over gaat. en na ~45 seconden van helemaal geen verkeer door laten is het dan weer goed.

het is denk ik niet de kwaliteit van de link zelf, want er is geen packet loss tot het mis gaat.

dus, niet zo vreemd dat de routering dan flappert :)

comment:6 by huub, 12 years ago

Probleem van nodehuub heeft zich nu verplaatst naar vosko2, zie onder. Vosko2 heeft ook een nieuwe lvrouted nodig:
dhcp-140-iface-ue1:~ huubsch$ traceroute www.nu.nl

1 172.17.16.129 (172.17.16.129) 3.165 ms 2.650 ms 2.812 ms
2 2hybridhuub.hybridvosko2.wleiden.net (172.16.4.121) 6.266 ms 6.086 ms 5.652 ms
3 2ring.hybridvosko3.wleiden.net (172.17.175.73) 7.627 ms 7.759 ms 7.958 ms
4 2hybridvosko3.hybridplantsoen2.wleiden.net (172.16.5.92) 9.439 ms 9.442 ms 9.354 ms
5 proxyplantsoen.wleiden.net (172.17.169.66) 10.196 ms 9.889 ms 9.967 ms

C
dhcp-140-iface-ue1:~ huubsch$ traceroute www.nu.nl

1 172.17.16.129 (172.17.16.129) 3.495 ms 2.781 ms 3.227 ms
2 2hybridhuub.hybridvosko2.wleiden.net (172.16.4.121) 6.788 ms 6.422 ms 9.117 ms
3 * * *
4 * * *
5 * * *
6 *C

dhcp-140-iface-ue1:~ huubsch$ traceroute www.nu.nl

1 172.17.16.129 (172.17.16.129) 3.252 ms 3.248 ms 2.648 ms
2 2hybridhuub.hybridvosko2.wleiden.net (172.16.4.121) 6.444 ms 5.713 ms 5.728 ms
3 * * *
4 * * *
5 *C

dhcp-140-iface-ue1:~ huubsch$ traceroute www.nu.nl

1 172.17.16.129 (172.17.16.129) 2.800 ms 2.631 ms 2.738 ms
2 2hybridhuub.hybridvosko2.wleiden.net (172.16.4.121) 6.403 ms 5.979 ms 5.812 ms
3 * 2hybridrabo1.hybridsom2.wleiden.net (172.16.16.17) 6.091 ms 6.209 ms
4 2hybridsom2.hybridpsycho.wleiden.net (172.16.16.116) 7.725 ms 9.515 ms 7.925 ms
5 2hybridpsycho.hybridlhs.wleiden.net (172.16.3.52) 9.118 ms 9.323 ms 9.941 ms
6 2hybridpsycho.hybridlhs.wleiden.net (172.16.3.52) 9.822 ms 8.925 ms 9.591 ms

comment:7 by huub, 12 years ago

Resolution: fixed
Status: newclosed

op alle (bereikbare) nodes nieuwste versie van lvrouted geinstalleerd. Dit lijkt goed te werken. Niet vergeten de niet-bereikbare nodes te updaten (WP, DirkLos2, LivingLab, Rund, Meerburg, Leythenrode2).

Note: See TracTickets for help on using tickets.