Problema do DRBD ativo-ativo

Quando deu o kernel panic do OCFS2(ver outro post no blog), quando as duas máquinas voltaram minha surpresa foi que o DRBD não subia. Ele sempre voltava como standalone quando dava o drbdadm connect all nas duas máquinas. Dando um dmesg, vi que tava dando split-brain(é quando ele acha que o metadado está zuado em um dos dois nós). Meu problema também é que o meu metadado do DRBD é interno, ou seja, ele usa 128M do final da partição para guardar metadados. Depois de googlar muito, testar umas coisas meio bizarras como fazer um dd if=/dev/zero com inicio no tamanho da partição – 128M para limpar o metadado, descobri que o método mais simples é o próprio drbdadm create-md mysql no servidor2(o que morreu primeiro). Isto recriou o metadado zerado e quando dei o drbdadm up all, ele começou o sync sozinho do servidor1 para o servidor2. Depois foi só dar o drbdadm primary all, mount e já era, voltou a funcionar.

BUG do OCFS2 e documentação

Meu RAID1 via rede DRBD deu kernel panic e matou minhas duas máquinas(ARGHHH!!!). Depois de vasculhar a net, achei no FAQ do OCFS2(primeiro lugar que eu devia ter olhado) o problema:

Q05 I encounter “Kernel panic – not syncing: ocfs2 is very sorry to
be fencing this system by panicing” whenever I run a heavy io
load?
A05 We have encountered a bug with the default “cfq” io scheduler
which causes a process doing heavy io to temporarily starve out
other processes. While this is not fatal for most environments,
it is for OCFS2 as we expect the hb thread to be r/w to the hb
area atleast once every 12 secs (default).
Bug with the fix has been filed with Red Hat and Novell. For
more, refer to the tracker bug filed on bugzilla:

http://oss.oracle.com/bugzilla/show_bug.cgi?id=671

Till this issue is resolved, one is advised to use the
“deadline” io scheduler. To use deadline, add “elevator=deadline”
to the kernel command line as follows:

1. For SLES9, edit the command line in /boot/grub/menu.lst.
title Linux 2.6.5-7.244-bigsmp elevator=deadline
kernel (hd0,4)/boot/vmlinuz-2.6.5-7.244-bigsmp root=/dev/sda5
vga=0×314 selinux=0 splash=silent resume=/dev/sda3
elevator=deadline showopts console=tty0
console=ttyS0,115200 noexec=off
initrd (hd0,4)/boot/initrd-2.6.5-7.244-bigsmp

2. For RHEL4, edit the command line in /boot/grub/grub.conf:
title Red Hat Enterprise Linux AS (2.6.9-22.EL)
root (hd0,0)
kernel /vmlinuz-2.6.9-22.EL ro root=LABEL=/ console=ttyS0,115200
console=tty0 elevator=deadline noexec=off
initrd /initrd-2.6.9-22.EL.img

To see the current kernel command line, do:
# cat /proc/cmdline

Fiz também a documentação de como foi feito isso, disponível no meu site.
Configurando DRBD com OCFS2 Em Modo Ativo-Ativo

Maldito openswan/iproute2/iptables e toda a parafernalha do linux

Povo,

Hoje foi foda… Deu um pau na minha firewall do escritório de SP. Tenho dois links de internet lá, mais 2 saídas de rede(DMZ e Rede Local). A VPN entre escritório/datacenter simplesmente parou de funcionar depois que eu reiniciei o shorewall(eu sei, eu sei, eu sou preguiçoso…). Investigando mais um pouco dando uns tcpdumps aqui, uns tcpdumps lá descobri que o pacote protocolo ESP(tcpdump -i any proto \\esp), estava indo por um link de internet e voltando pelo outro, lógico que o ipsec dropa a porra do pacote. Pois então achei um post na lista de discussão da netfilter, e simplesmente adicionando:

iptables -t nat -I POSTROUTING -s 192.168.5.0/24 -d 192.168.10.0/24 -j ACCEPT

o bagulho voltou a funcionar.

Site no ar

AE POVO!!! Finalmente consegui fazer uma página descente onde seja fácil gerenciar o conteúdo. Basicamente instalei um Joomla, e coloquei alguns módulos geniais como o Gallery2.1 para colocar as minhas fotos, WordPressé um BLOG e você está nele agora, DokuWiki para fazer algumas documentações de domínio público e deixar disponível, WebAmoeba que é um sistema de chamados de suporte para facilitar minha vida um pouco.

Enfim, espero que todo mundo goste e aproveite.

Get Adobe Flash playerPlugin by wpburn.com wordpress themes
multifarious