Eu tenho algumas máquinas usando o qual estou construindo um cluster. Para melhorar o desempenho, optamos por usar a ligação nas interfaces Ethernet (cada link é 1Gig). Eu instalei o módulo ifenslave-2.6 para o Ubuntu 10.04 e configurei as interfaces também. O seguinte é minha configuração.
# The loopback network interface
auto lo
iface lo inet loopback
# The primary network interface
auto eth0
iface eth0 inet manual
bond-master bond0
auto eth1
iface eth1 inet manual
bond-master bond0
auto bond0
iface bond0 inet static
address x.x.x.x
gateway x.x.x.1
netmask 255.255.255.0
bond-mode 6
bond-miimon 100
bond-slaves none
Também tentei escravos eth0 eth1 em vez de bond-master bond0. Mas não fez nada.
Então, como você pode ver, eu estou executando a ligação no modo balanceado ou no modo 6 para ativar a ligação para upstream e downstream. Freqüentemente (freqüência de cerca de quatro dias), vemos que as máquinas não podem falar umas com as outras. Não pings. Não visível no nmap (nmap -sP x.x.x.x). Às vezes, algumas máquinas são visíveis, enquanto outras não. Todos eles são clones, mas esse comportamento é estranho.
Eu verifiquei pela primeira vez o arp -a para ver se estou com problemas lá. E havia muitas entradas incompletas. (Geralmente ocorre após a varredura do nmap), mas mesmo após o tempo limite ter ocorrido e a tabela ter sido resolvida, tenho problemas para efetuar o ping.
Eles estão todos na mesma sub-rede. Sem firewall. Todos vão para o mesmo interruptor. Minha configuração do switch é simples e segue abaixo
interface GigabitEthernet1/1
!
interface GigabitEthernet1/2
!
interface GigabitEthernet1/3
switchport mode access
spanning-tree portfast
!
interface GigabitEthernet1/4
switchport mode access
spanning-tree portfast
!
interface GigabitEthernet1/5
switchport mode access
spanning-tree portfast
.
.
.
!
interface GigabitEthernet1/17
switchport mode access
spanning-tree portfast
!
interface GigabitEthernet1/18
switchport mode access
spanning-tree portfast
Todos eles estão na VLAN 1. A porta 1 vai para o nosso roteador. E as portas 3 a 18 são todas configuradas da mesma maneira. Seu modo definido para acessar e spanning-tree definido como portfast. Cada máquina usa dois links neste switch. O interruptor é um cisco 4948.
Eu posso perfeitamente falar com as máquinas do nosso gateway ou máquinas fora do nosso gateway. Mas fazê-los falar internamente está se tornando um problema especificamente porque planejamos executar o Hadoop. Qualquer ajuda, cutucada, opinião seria realmente útil! Obrigado.
Além disso, adicionando a saída ifenslave-2.6-a.
ifenslave.c:v1.1.0 (December 1, 2003)
o Donald Becker ([email protected]).
o Detach support added on 2000/10/02 by Willy Tarreau (willy at meta-x.org).
o 2.4 kernel support added on 2001/02/16 by Chad N. Tindel
(ctindel at ieee dot org).
The result of SIOCGIFFLAGS on lo is 49.
The result of SIOCGIFADDR is 00.00.7f.00.
The result of SIOCGIFHWADDR is type 772 00:00:00:00:00:00.
The result of SIOCGIFFLAGS on bond0 is 1443.
The result of SIOCGIFADDR is 00.00.ffffff80.0a.
The result of SIOCGIFHWADDR is type 1 00:1b:21:47:a0:c1.
Mesmo se esta multa puder me informar? Então o problema pode estar em outro lugar.