05 July, 2007

Cluster helvede

Vi har i vores hosting løsning et server cluster (vi har faktisk flere, men der er kun et af dem, der er interressant i dag), som giver mig en del hovedpine.

Dette cluster består af to temmeligt kraftige maskiner. Der er en delt ressource på et netværksdrev, som de begge to har adgang til, dog kun imens de er aktive. Der er til enhver tid en af disse to maskiner, der er aktiv, og en passiv, der tager over hvis den aktive skulle gå ned. Hvis en maskine skifter fra aktiv til passiv tilstand unmounter den øjeblikkeligt det delte drev og dræber den bruger, der bruger det delte drev.

Nu er det bare sådan, at der er nogle data på det delte drev, der er ødelagte og derfor går vores service ned. Netop som den går ned bliver drevet unmountet, og mountet ovre på den anden server i clusteret, som loader, går ned, og skifter tilbage til den første server, som loader, går ned og skifter tilbage til den anden server...

Mine chancer for at rette op på noget som helst ligger nu i at rette i de delte filer i de få sekunder de er på en server ad gangen...

3 comments:

  1. Men da du kom hjem så virkede det jo :-) Og du har ferie idag... så det skal nok gå alt sammen ikk :-D

    ReplyDelete
  2. Jo, det skal det jo nok :)

    ... men nogen havde jo allerede købt "lortedag.dk"...

    ReplyDelete
  3. Men lortefuckerdag.dk er ledigt og skodfuck.dk er ledig og pisdag.dk er ledigt og møjlortedag.dk er ledigt og skoddag.dk og fucking-moderknipper-lorte-pis-røv-dag.dk er også ledigt... så der er masser af muligheder :D

    ReplyDelete