Opened 11 years ago

Closed 10 years ago

#322 closed incident (fixed)

instabiele routering

Reported by: huub Owned by:
Keywords: Cc:
Location: Generiek

Description

Ik zie tussen nodes huub en kwvdekaag twee routes gebruikt worden, zonder dat er sprake is van packet loss. De ene route linksom:
huub-vosko2-robijn-unigor-kaag2-kaag1-kwvdekaag
en de ander rechtsom:
huub-vosko2-rabo1-som-juffermans-lijtweg2-kwvdekaag

allebei 7 hops dus.

mtr output:

My traceroute [v0.82]

HybridHuub.wleiden.net. (0.0.0.0) Mon May 6 20:09:19 2013
Keys: Help Display mode Restart statistics Order of fields quit Packets Pings

Host Loss% Snt Last Avg Best Wrst StDev

  1. 2hybridhuub.hybridvosko2.wleiden.net 0.0% 140 1.8 1.8 1.7 2.7 0.1
  2. 2hybridvosko2.hybridrobijn.wleiden.net 0.0% 140 3.4 3.5 3.3 8.5 0.5 2hybridvosko2.hybridrabo1.wleiden.net
  3. 2hybridrobijn.hybridunigor1.wleiden.net 0.0% 139 6.6 5.2 4.3 35.5 2.7 2hybridrabo1.hybridsom2.wleiden.net
  4. 2ring.hybridunigorn.wleiden.net 0.0% 139 4.8 5.6 4.5 29.0 2.5 2hybridsom2.hybridsom1.wleiden.net
  5. 2hybridunigorn.hybridkaag2.wleiden.net 0.0% 139 8.1 8.4 6.3 40.2 3.5 2hybridsom1.hybridjuffermans.wleiden.net
  6. 2hybridkaag2.hybridkaag1.wleiden.net 0.7% 139 9.4 10.5 8.1 25.7 2.3 2hybridhofwijck.hybridlijtweg2.wleiden.net 2hybridbroekplein.hybridlijtweg2.wleiden.net
  7. hybridkwvdekaag.wleiden.net 0.0% 139 10.1 11.3 9.2 40.4 3.0

Change History (9)

comment:1 by huub, 11 years ago

De interface vr0 van Lijtweg2 (naar o.a. Juffermans) is nu down, de route loopt nu stabiel volgens het kortste pad:

My traceroute [v0.82]

HybridHuub.wleiden.net. (0.0.0.0) Thu May 9 14:06:34 2013
Keys: Help Display mode Restart statistics Order of fields quit

Packets Pings

Host Loss% Snt Last Avg Best Wrst StDev

  1. 2hybridhuub.hybridvosko2.wleiden 0.0% 871 1.9 1.8 1.6 7.0 0.4
  2. 2hybridvosko2.hybridrobijn.wleid 0.1% 871 3.6 3.4 3.2 20.5 0.7
  3. 2hybridrobijn.hybridunigor1.wlei 0.0% 871 4.7 4.7 4.3 12.3 0.6
  4. 2ring.hybridunigorn.wleiden.net 0.1% 871 4.6 4.8 4.5 12.3 0.7
  5. 2hybridunigorn.hybridkaag2.wleid 0.3% 871 7.6 8.1 6.4 44.7 1.5
  6. 2hybridkaag2.hybridkaag1.wleiden 0.1% 871 10.1 9.9 8.2 26.9 1.1
  7. hybridkwvdekaag.wleiden.net 0.5% 871 11.1 11.2 9.3 60.0 2.5

comment:2 by huub, 11 years ago

vr0 op Lijtweg2 doet het weer en de link naar kwvdekaag is prima.
Maar er is daar nog wel een probleempje: Lijtweg2 routeert rechtstreeks naar KWVdeKaag, maar omgekeerd loopt de route via Kaag1. Herstarten van lvrouted op beide nodes kon dit niet verhelpen. De nano's hebben de meest recente firmware (geupgrade naar 5.5.4) en lvrouted-versie is ook de meest recente 11479.

Alleen de route HybridHuub - Kwvdekaag heeft nu weer vele varianten:
HybridHuub.wleiden.net. (0.0.0.0) Fri May 10 11:08:12 2013

Packets Pings

Host Loss% Snt Last Avg Best Wrst StDev

  1. 2hybridhuub.hybridvosko2.wleiden 3.5% 1999 1.8 1.7 1.6 18.1 0.6 2hybridhuub.hybridcetim2.wleiden.net
  2. 2hybridvosko2.hybridrabo1.wleide 3.4% 1999 3.4 3.2 1.8 10.0 0.7 2hybridvosko2.hybridrobijn.wleiden.net 2hybridcetim2.hybridcetim1.wleiden.net 2ring.hybridvosko3.wleiden.net 2hybridcetim2.hybridrabo1.wleiden.net
  3. 2hybridrabo1.hybridsom2.wleiden. 4.1% 1999 5.2 4.6 3.5 70.6 1.7 2hybridrobijn.hybridunigor1.wleiden.net 2hybridcetim1.hybridhoutmarkt.wleiden.net 2hybridvosko3.hybridstadhuis.wleiden.net
  4. 2hybridsom2.hybridsom1.wleiden.n 5.5% 1999 5.3 5.1 4.5 17.3 1.1 2ring.hybridunigorn.wleiden.net
  5. 2hybridsom1.hybridjuffermans.wle 5.1% 1999 6.7 7.5 6.2 89.3 2.8 2hybridunigorn.hybridkaag2.wleiden.net 2hybridsom2.hybridleythenrode1.wleiden.net
  6. 2hybridjuffermans.hybridlijtweg2 6.2% 1999 8.3 9.5 7.1 91.1 2.6 2hybridhofwijck.hybridlijtweg2.wleiden.net 2hybridkaag2.hybridkaag1.wleiden.net 2hybridbroekplein.hybridlijtweg2.wleiden.net 2hybridleythenrode1.hybridgraficall.wleiden.net
  7. hybridkwvdekaag.wleiden.net 8.0% 1998 10.2 20.8 8.9 6827. 235.6 2hybridgraficall.hybridleeuwenhorst.wleiden.net

comment:3 by lodewijk, 11 years ago

da's wel erg veel packetloss. en als die packetloss asymmetrisch is leidt dat dan vanzelf tot asymmetrische routes.

comment:4 by ronald, 11 years ago

Zou het zo kunnen zijn, dat lvrouted packets gedropt worden, omdat de transmit queues van nodes en/of nanostations vollopen met gebruikersverkeer? Lijkt misschien onwaarschijnlijk, daar al het verkeer van/naar de buitenwereld over TCP loopt en dat protocol ingebouwde flow control heeft. Toch zouden we wellicht eens kunnen kijken of we lvrouted packets kunnen beschermen door ze een hogere prioriteit te geven (d.w.z. gaan spelen met DiffServ op de routers en 802.11 WME op de nano's).

comment:5 by huub, 11 years ago

@lodewijk : ik heb de indruk dat de packetloss in dit lijstje van mtr een artefact is en ontstaat op het moment dat de routering omklapt. Zal nog checken.

comment:6 by lodewijk, 11 years ago

als je de packetloss probeert te meten in de context van routering is het trouwens beter om packets van ongeveer dezelfde grootte te sturen. dus ping -s 2048 ofzo. een packetloss van zoveel procent met de standaard grootte van 56 bytes is *veel* slechter met een grotere (en meer relevante) packet grootte.

comment:7 by huub, 11 years ago

Wat metingen met -s 2048 langs het pad: huub-cetim-houtmarkt-som-juffermans-lijtweg geven inderdaad flink wat packet loss op de link van juffermans naar lijtweg2 en ook op houtmarkt-som en huub-cetim

juffermans - lijtweg2:
--- hybridlijtweg2.wleiden.net ping statistics ---
741 packets transmitted, 682 packets received, 8.0% packet loss
round-trip min/avg/max/stddev = 2.155/3.670/22.257/1.901 ms

som1-juffermans:
--- hybridjuffermans.wleiden.net ping statistics ---
391 packets transmitted, 391 packets received, 0.0% packet loss
round-trip min/avg/max/stddev = 2.748/3.104/7.449/0.469 ms

houtmarkt-som1:
--- hybridsom1.wleiden.net ping statistics ---
264 packets transmitted, 261 packets received, 1.1% packet loss
round-trip min/avg/max/stddev = 3.368/3.696/10.189/0.638 ms

cetim1-houtmarkt:
--- hybridhoutmarkt.wleiden.net ping statistics ---
583 packets transmitted, 583 packets received, 0.0% packet loss
round-trip min/avg/max/stddev = 3.417/3.765/11.614/0.539 ms

huub-cetim2:
--- hybridcetim2.wleiden.net ping statistics ---
577 packets transmitted, 560 packets received, 2.9% packet loss
round-trip min/avg/max/stddev = 3.674/4.903/20.262/1.478 ms

rabo1-vosko2:
--- hybridvosko2.wleiden.net ping statistics ---
284 packets transmitted, 284 packets received, 0.0% packet loss
round-trip min/avg/max/stddev = 3.361/3.708/11.701/0.859 ms

robijn-vosko2:
--- hybridvosko2.wleiden.net ping statistics ---
423 packets transmitted, 422 packets received, 0.2% packet loss
round-trip min/avg/max/stddev = 3.414/4.077/11.643/0.819 ms

robijn-unigor1:
--- hybridrobijn.wleiden.net ping statistics ---
675 packets transmitted, 675 packets received, 0.0% packet loss
round-trip min/avg/max/stddev = 2.854/4.177/17.613/1.082 ms

comment:8 by huub, 11 years ago

Ik heb interlink van lijtweg2 naar kwvdekaag verhuisd naar il-ozo en dat helpt wat betreft de routering tussen kwvdekaag en lijtweg2 (gaat nu rechtstreeks).
De ongewijzigde interlink lijtweg2-juffermans (dezelfde nanostation) geeft nog wel packetloss:
HybridJuffermans# ping -s 2048 lijtweg2
--- hybridlijtweg2.wleiden.net ping statistics ---
509 packets transmitted, 480 packets received, 5.7% packet loss
round-trip min/avg/max/stddev = 2.190/4.902/19.068/2.197 ms
Alle verloren pakketten zitten bij elkaar:
....
2056 bytes from 172.23.13.1: icmp_seq=394 ttl=64 time=2.234 ms
2056 bytes from 172.23.13.1: icmp_seq=395 ttl=64 time=5.977 ms
2056 bytes from 172.23.13.1: icmp_seq=396 ttl=64 time=3.549 ms
2056 bytes from 172.23.13.1: icmp_seq=426 ttl=64 time=12.873 ms
2056 bytes from 172.23.13.1: icmp_seq=427 ttl=64 time=19.068 ms
2056 bytes from 172.23.13.1: icmp_seq=428 ttl=64 time=16.716 ms
.....

comment:9 by huub, 10 years ago

Resolution: fixed
Status: newclosed

Ik heb een stuk of vijf slechte interlinks uit bedrijf genomen. Dit lijkt de stabiliteit van de routering zeer tengoede te zijn gekomen.

Note: See TracTickets for help on using tickets.