Como ativar eth0 / eth1 anteriormente no processo de inicialização do ubuntu

1

Vamos ver se consigo explicar isso direito:

  1. Eu tenho servidores com duas interfaces Ethernet - uma externa e uma interna.
  2. Eu tenho um banco de dados (pg) em um servidor e acessível de outras máquinas na rede interna.
  3. Tenho aplicativos RoR em outros servidores e configurados para usar os bancos de dados no servidor de banco de dados.
  4. Os clusters híbridos estão configurados corretamente - posso iniciar o cluster e acessar o aplicativo Rails por meio do console.
  5. Estou na edição do servidor do ubuntu 9.10.
  6. IPs são atribuídos estaticamente na máquina - não há DHCP no trabalho.

OK, então o problema são os scripts init para iniciar o Mongrel fire ANTES de os adaptadores ethernet aparecerem. O problema, claro, é que o banco de dados não é visível para o aplicativo Rails, pois a rede ainda não está ativa.

Uma parte relevante dos eventos de inicialização do syslog é postada abaixo.

Eu adicionei os scripts "normalmente" ao init usando os padrões /usr/sbin/update-rc.d mongrel_cluster. Eu mudei a "ordem de inicialização" para 99z_mongrel_cluster. Por favor, note que no syslog abaixo que o cluster mestiço é executado logo após CRON, então parece que eu tenho o mais tarde possível WRT para init.d.

O que parece que está acontecendo é que as interfaces ethernet tentam ativá-lo logo no final do ciclo de inicialização e depois levar algum tempo para ativá-lo. Eu sou um pouco ignorante sobre alguns destes, mas parece que vamos de 7,537 ... no tcpdump para eth0 NIC até 9,266 ... o que é mais de 1,5 segundos para carregar?

Isso funciona "como deveria" em outros ambientes que usam DHCP para atribuir endereços IP estáticos.

Então, as perguntas são:

  1. Existe uma maneira de fazer as NICs carregarem mais cedo ou mais rapidamente (com base nos HDs que estão chegando, eu acho que "não" para a pergunta mais rápida)?

  2. Existe uma maneira de garantir que as NICs estejam ativas ANTES de passar para outras tarefas de inicialização? Com base no que li sobre a especificação LSB, coloquei $ network no script init para Required-Start para o cluster mestiço (novamente, não tive que fazer isso em outros ambientes de teste).

  3. há algo que preciso fazer para configurar a rede para carregar mais rapidamente? meus / etc / hosts e /etc/resolv.conf parecem corretos.

  4. Problema de driver
  5. ?

Muito obrigado. Eu tenho coçado a cabeça por alguns dias sobre isso.

Jul 26 15:08:03 web-01 kernel: [    4.166954] usbhid: v2.6:USB HID core driver
Jul 26 15:08:03 web-01 kernel: [    4.321657] 0000:03:00.0: eth0: (PCI Express:2.5GB/s:Width x1) 00:30:48:9f:08:cc
Jul 26 15:08:03 web-01 kernel: [    4.321659] 0000:03:00.0: eth0: Intel(R) PRO/1000 Network Connection
Jul 26 15:08:03 web-01 kernel: [    4.321743] 0000:03:00.0: eth0: MAC: 3, PHY: 8, PBA No: 0101ff-0ff
Jul 26 15:08:03 web-01 kernel: [    4.321974] e1000e 0000:04:00.0: PCI INT A -> GSI 17 (level, low) -> IRQ 17
Jul 26 15:08:03 web-01 kernel: [    4.322008] e1000e 0000:04:00.0: setting latency timer to 64
Jul 26 15:08:03 web-01 kernel: [    4.322264]   alloc irq_desc for 37 on node 0
Jul 26 15:08:03 web-01 kernel: [    4.322265]   alloc kstat_irqs on node 0
Jul 26 15:08:03 web-01 kernel: [    4.322270] e1000e 0000:04:00.0: irq 37 for MSI/MSI-X
Jul 26 15:08:03 web-01 kernel: [    4.322271]   alloc irq_desc for 38 on node 0
Jul 26 15:08:03 web-01 kernel: [    4.322272]   alloc kstat_irqs on node 0
Jul 26 15:08:03 web-01 kernel: [    4.322274] e1000e 0000:04:00.0: irq 38 for MSI/MSI-X
Jul 26 15:08:03 web-01 kernel: [    4.322275]   alloc irq_desc for 39 on node 0
Jul 26 15:08:03 web-01 kernel: [    4.322276]   alloc kstat_irqs on node 0
Jul 26 15:08:03 web-01 kernel: [    4.322278] e1000e 0000:04:00.0: irq 39 for MSI/MSI-X
Jul 26 15:08:03 web-01 kernel: [    4.397418] scsi6 : 3ware 9000 Storage Controller
Jul 26 15:08:03 web-01 kernel: [    4.397484] 3w-9xxx: scsi6: Found a 3ware 9000 Storage Controller at 0xfadff000, IRQ: 16.
Jul 26 15:08:03 web-01 kernel: [    4.481131] 0000:04:00.0: eth1: (PCI Express:2.5GB/s:Width x1) 00:30:48:9f:08:cd
Jul 26 15:08:03 web-01 kernel: [    4.481133] 0000:04:00.0: eth1: Intel(R) PRO/1000 Network Connection
Jul 26 15:08:03 web-01 kernel: [    4.481218] 0000:04:00.0: eth1: MAC: 3, PHY: 8, PBA No: 0101ff-0ff
Jul 26 15:08:03 web-01 kernel: [    4.757252] 3w-9xxx: scsi6: Firmware FE9X 4.10.00.007, BIOS BE9X 4.08.00.002, Ports: 2.
Jul 26 15:08:03 web-01 kernel: [    4.757743] scsi 6:0:0:0: Direct-Access     AMCC     9650SE-2LP DISK  4.10 PQ: 0 ANSI: 5
Jul 26 15:08:03 web-01 kernel: [    4.768713] sd 6:0:0:0: Attached scsi generic sg0 type 0
Jul 26 15:08:03 web-01 kernel: [    4.769035] sd 6:0:0:0: [sda] 585916416 512-byte logical blocks: (299 GB/279 GiB)
Jul 26 15:08:03 web-01 kernel: [    4.769880] sd 6:0:0:0: [sda] Write Protect is off
Jul 26 15:08:03 web-01 kernel: [    4.769885] sd 6:0:0:0: [sda] Mode Sense: 23 00 10 00
Jul 26 15:08:03 web-01 kernel: [    4.770609] sd 6:0:0:0: [sda] Write cache: disabled, read cache: enabled, supports DPO and FUA
Jul 26 15:08:03 web-01 kernel: [    4.772342]  sda: sda1 sda2 < sda5 >
Jul 26 15:08:03 web-01 kernel: [    4.775558] sd 6:0:0:0: [sda] Attached SCSI disk
Jul 26 15:08:03 web-01 kernel: [    5.278745] PM: Starting manual resume from disk
Jul 26 15:08:03 web-01 kernel: [    5.278747] PM: Resume from partition 252:1
Jul 26 15:08:03 web-01 kernel: [    5.278748] PM: Checking hibernation image.
Jul 26 15:08:03 web-01 kernel: [    5.278922] PM: Resume from disk failed.
Jul 26 15:08:03 web-01 kernel: [    5.301586] kjournald starting.  Commit interval 5 seconds
Jul 26 15:08:03 web-01 kernel: [    5.301606] EXT3-fs: mounted filesystem with ordered data mode.
Jul 26 15:08:03 web-01 kernel: [    5.689456] type=1505 audit(1280182081.322:2): operation="profile_load" pid=480 name=/sbin/dhclient3
Jul 26 15:08:03 web-01 kernel: [    5.689838] type=1505 audit(1280182081.322:3): operation="profile_load" pid=480 name=/usr/lib/NetworkManager/nm-dhcp-client.action
Jul 26 15:08:03 web-01 kernel: [    5.690045] type=1505 audit(1280182081.322:4): operation="profile_load" pid=480 name=/usr/lib/connman/scripts/dhclient-script
Jul 26 15:08:03 web-01 kernel: [    5.703353] type=1505 audit(1280182081.332:5): operation="profile_load" pid=481 name=/usr/sbin/tcpdump
Jul 26 15:08:03 web-01 kernel: [    6.118815] Adding 1949688k swap on /dev/mapper/web--01-swap.  Priority:-1 extents:1 across:1949688k 
Jul 26 15:08:03 web-01 kernel: [    6.262044] EXT3 FS on dm-0, internal journal
Jul 26 15:08:03 web-01 kernel: [    6.298767] udev: starting version 147
Jul 26 15:08:03 web-01 kernel: [    6.798595] ADDRCONF(NETDEV_UP): eth1: link is not ready
Jul 26 15:08:03 web-01 kernel: [    6.803872] ip_tables: (C) 2000-2006 Netfilter Core Team
Jul 26 15:08:03 web-01 kernel: [    6.830538] ADDRCONF(NETDEV_UP): eth0: link is not ready
Jul 26 15:08:03 web-01 kernel: [    6.834499] lp: driver loaded but no devices found
Jul 26 15:08:03 web-01 kernel: [    7.285196] kjournald starting.  Commit interval 5 seconds
Jul 26 15:08:03 web-01 kernel: [    7.321785] EXT3 FS on dm-2, internal journal
Jul 26 15:08:03 web-01 kernel: [    7.321792] EXT3-fs: mounted filesystem with ordered data mode.
Jul 26 15:08:03 web-01 kernel: [    7.535727] type=1505 audit(1280182083.165:6): operation="profile_replace" pid=868 name=/sbin/dhclient3
Jul 26 15:08:03 web-01 kernel: [    7.536095] type=1505 audit(1280182083.165:7): operation="profile_replace" pid=868 name=/usr/lib/NetworkManager/nm-dhcp-client.action
Jul 26 15:08:03 web-01 kernel: [    7.536298] type=1505 audit(1280182083.165:8): operation="profile_replace" pid=868 name=/usr/lib/connman/scripts/dhclient-script
Jul 26 15:08:03 web-01 kernel: [    7.537283] type=1505 audit(1280182083.165:9): operation="profile_replace" pid=869 name=/usr/sbin/tcpdump
Jul 26 15:08:03 web-01 cron[950]: (CRON) INFO (pidfile fd = 3)
Jul 26 15:08:03 web-01 init: apport pre-start process (943) terminated with status 1
Jul 26 15:08:03 web-01 init: apport post-stop process (958) terminated with status 1
Jul 26 15:08:03 web-01 cron[961]: (CRON) STARTUP (fork ok)
Jul 26 15:08:03 web-01 cron[961]: (CRON) INFO (Running @reboot jobs)
Jul 26 15:08:03 web-01 logger: mongrel: starting mongrel cluster
Jul 26 15:08:04 web-01 kernel: [    9.266524] e1000e: eth0 NIC Link is Up 1000 Mbps Full Duplex, Flow Control: None
Jul 26 15:08:04 web-01 kernel: [    9.266892] ADDRCONF(NETDEV_CHANGE): eth0: link becomes ready
Jul 26 15:08:05 web-01 kernel: [    9.430149] e1000e: eth1 NIC Link is Up 1000 Mbps Full Duplex, Flow Control: None
Jul 26 15:08:05 web-01 kernel: [    9.430505] ADDRCONF(NETDEV_CHANGE): eth1: link becomes ready
Jul 26 15:08:05 web-01 kernel: [    9.777969] e1000e: eth0 NIC Link is Down
Jul 26 15:08:07 web-01 kernel: [   12.056047] e1000e: eth0 NIC Link is Up 1000 Mbps Full Duplex, Flow Control: None
Jul 26 15:08:15 web-01 kernel: [   19.831671] eth0: no IPv6 routers present
Jul 26 15:08:16 web-01 kernel: [   20.401469] eth1: no IPv6 routers present
Jul 26 15:08:38 web-01 ntpdate[783]: can't find host ntp.ubuntu.com
Jul 26 15:08:38 web-01 ntpdate[783]: no servers can be used, exiting
Jul 26 15:08:53 web-01 ntpdate[1130]: step time server 91.189.94.4 offset -0.293984 sec
Jul 26 15:17:01 web-01 CRON[1294]: (root) CMD (   cd / && run-parts --report /etc/cron.hourly)
    
por Jeff 27.07.2010 / 00:38

3 respostas

2

A menos que você tenha feito algo estranho, a rede é iniciada antes que qualquer serviço seja iniciado, por isso estou um pouco surpreso que as coisas não estejam funcionando.

Não sei ao certo o que você tem em seu arquivo / etc / network / interfaces, mas convém substituir as linhas como allow-hotplug eth0 por auto eth0 . A opção hotplug significa que a interface não será ativada até que haja um link de rede totalmente negociado.

Eu também verificaria sua configuração de switch. Talvez seja necessário ativar o portfast ou o equivalente em seus comutadores. O Portfast permite que o computador pule algumas das negociações relacionadas à árvore de abrangência, vlans e etherchannel e aumente o link mais rapidamente. Mas você não deve usar esse recurso em nenhuma porta de switch usada para conectar-se a outros switches.

    
por 27.07.2010 / 01:15
1

Você precisa tornar a inicialização do Mongrel dependente do funcionamento da rede. Adicione algo como:

start on started networking

para o seu /etc/init/mongrel.conf (ou similar). Veja outros arquivos nesse diretório para obter orientação ou consulte man 5 init .

    
por 27.07.2010 / 01:42
0

Update - Dennis sua recomendação me apontou na direção certa, embora o Ubuntu / Debian não faça uso do Upstart por padrão, que é o que "start on" parece ser um comando de. Antes de instalar, eu queria ver se poderia trabalhar com o SysVInit.

O LSB especifica esse tipo de ação com Required-Start. Eu usei $ network originalmente que parece ativar somente quando a NIC fica on-line não necessariamente quando um endereço IP é adquirido ou outros serviços de rede se tornam ativos. Eu então mudei para $ all, mas em vez de serviços de consulta, isso parece simplesmente mover a execução do script para o final de todos os outros scripts de init, mas não espera nos serviços.

Então, para resolver, adicionei $ named e $ time ao Required-Start. $ named refere-se à resolução de nomes e $ time requer que a hora do sistema tenha sido definida após consultar um servidor de horário. Eu sei do syslog que isso acontece depois da eth0, então isso deve ser seguro.

Obrigado pela ajuda - isso definitivamente me ajudou.

    
por 27.07.2010 / 07:11