Hi Peter<br><br>Thanks for your reply. <br><br>Some more info:<br><br>/etc/resolv.conf on ns1 <br>nameserver ns0IP<br>nameserver ns1IP<br><br>At the time ns0 was down, I can see that even ns1 fails mounting the nfs shares (timed out):
<br><br>Aug 14 08:30:31 ns1 automount[4093]: >> mount: mount to NFS server 'nfs-web' failed: timed out (retrying).<br>Aug 14 08:31:53 ns1 last message repeated 2 times<br>Aug 14 08:32:13 ns1 automount[4093]: >> mount: mount to NFS server 'nfs-web' failed: timed out (giving up).
<br><br>If I go back in the logs I can see a full zone synch happening on the 2nd of August, no chnages have been made after that so I am pretty confident the zones were ok.<br><br>In what way reverse lookup would affect it?
<br><br>We are still scratching our heads.....<br><br>Thanks<br><br>Simone<br><br><div><span class="gmail_quote">On 8/15/07, <b class="gmail_sendername">Peter (CentOS List)</b> <<a href="mailto:centos@ourvirtualhome.com">
centos@ourvirtualhome.com</a>> wrote:</span><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">The first thing that popped in my head was reverse lookup, but as I kept
<br>reading and saw your test with web3 it could ave been a sync problem<br>between the two nameservers. By restarting ns1 all the zones were synced<br>again and your initial problem isn't there anymore and so your test with
<br>web3 was successful as in it didn't loose it's mount. Keep an eye on ns1<br>when you make updates in the zones on ns0. I have seen problems where<br>the sync didn't occur automatically and I had to sync "manually" by
<br>stopping and starting bind on the secondary server.<br><br>Hope it helps you a little bit.<br><br>Peter<br><br>Simone wrote:<br>> Hi all,<br>><br>> Today we have had a strange problem that has taken down our website, we
<br>> understand what happened but not why so I am hoping someone has seen<br>> this before.<br>><br>> We have our web servers (web1 web2 web3 ..... web10) mounting an NFS<br>> share (/export/data) from server nfs1. On the web server side we use
<br>> autofs in the format nfs-dedicated:/export/data where nfs-dedicated is<br>> an alias in our internal DNS servers pointing to server nfs1. We run a<br>> primary and a secondary DNS (bind) server ns0, ns1 authoritative for our
<br>> zones and our webservers have them configured in /etc/resolv.conf<br>> Today we had to run some upgrade on the dns servers (bios firmwares etc)<br>> so we took down ns0 and with it our website went down.<br>
> All the nfs shares disappeared from the web servers (the logs show<br>> requests to mount/unmount timing out), but at the same time on nfs1 the<br>> logs show requests (mount and unmount) coming from the web servers and
<br>> no errors.<br>><br>> As soon as ns0 is back up, all gets back to normal. Minutes later we<br>> take down ns1 for maintenance and it doesn't have any impact on the<br>> website.<br>><br>> dig @ns0 nfs-web gives exactly the same results on ns0/1
<br>><br>> Back to the office we try to reproduce the same scenario configuring<br>> iptables on web3 to block traffic to ns0 but the server (web3) keeps<br>> working fine reverting to ns1 for name resolution (as you would expect).
<br>><br>> Has anybody seen this happening before? Any comment/suggestion much<br>> appreciated.<br>><br>> Thanks<br>><br>> Simone<br>><br>> _______________________________________________<br>> CentOS mailing list
<br>> <a href="mailto:CentOS@centos.org">CentOS@centos.org</a><br>> <a href="http://lists.centos.org/mailman/listinfo/centos">http://lists.centos.org/mailman/listinfo/centos</a><br>><br>><br>><br><br><br><br>
_______________________________________________<br>CentOS mailing list<br><a href="mailto:CentOS@centos.org">CentOS@centos.org</a><br><a href="http://lists.centos.org/mailman/listinfo/centos">http://lists.centos.org/mailman/listinfo/centos
</a><br><br><br></blockquote></div><br>