Нэг сервэр дээр байсан бүх өгөгдлүүдээ алдаж маш том сургамж авлаа. Завшаанд нь хэд хэдэн судалгааны сэдэвтэй болоод авлаа. 2хон жилийн өмнө RAID гэж юу байдаг, хэрхэн ажилладаг талаар юу ч мэддэггүй байсан би хэсэг хугацаанд гайгүй сайн судласны үндсэн дээр нэлээн хэдэн сервер тавьсны эхнийх нь ингээд хамаг өгөгдлийг маань аваад явчих нь энэ. Уг нь 2 сувагт (channel) хуваагдсан овоо хэдэн диск нийлүүлээд нэг HotSpare диск бүхий RAID5 тохируулж тавьсан байсан юм. RAID5-ын гол давуу тал нь өгөгдлийг бүх дискүүдэд хуваан байршуулснаар унших болон бичих хурдыг сайжруулдаг, харин дутагдал нь 1-с дээш диск эвдэрсэн тохиолдолд өгөгдөл маань сэргэлт авах бараг боломжгүй болдог. Гэтэл энэ удаад тохиолдолд 2 нь эвдэрчихлээ. Ядаж байхад нөгөө HotSpare бүхий сувагт нь биш нөгөөхөд нь 2уулаа таардаг нь ч юу вэ дээ. Дараагийн удаа бол суваг бүр дээр 1 HotSpare тавих ёстой юм байна, тэгвэл 1 эсвэл 2 диск эвдэрсэн ч өгөгдлөө алдахгүй байх боломжтой юм шиг байна. Нэг туршилт хийнээ.
Хэзээ ч билээ дээ Google болон бас нэг их сургууль тус тусдаа дискний наслалт, найдвартай ажиллагааны талаар судалгаа хийсэн байсныг хальт үзчээд хаяаж байсныгаа эргүүлж олж үзье гэж бодлоо. Судалгаанд бичигдсэнээр бол сүүлийн үеийн дискнүүд өөр дээрээ S.M.A.R.T гээд технологийг агуулдаг болсон юм гэсэн, тэр нь дискийн яг техникийн ажиллагааны үзүүлэлтүүдийг гаргаж өгдөг юм гэсэн. Түүнийг нь ашигласнаар дискний доголдол, гэмтлийг урьдчилан илрүүлэх боломжтой болох юм гэсэн. Өдөр ирэх бүр мэдээллийн аюулгүй байдал, мэдээллийн хадгалалтын асуудал улам бүр чухлаар тавигдах боллоо. Тийм болохоор мэдээллийн бүрэн бүтэн байдлыг хангах системүүдийг судлах, амьдралд нэвтрүүлэх нь нэн чухал байна. Бас дээрээс нь найдвартай нөөцийн (backup) системийг үйл ажиллагаандаа нэвтрүүлэх юм бол ч ийм төрлийн асуудлаас хөнгөхөн сэргийлж чадна. Ингээд өгөгдлөө алдчихсан гэж бодохоор сэтгэлд жоохон сэвтэй юмаа. Бусаддаа сургамж болох болов уу гэсэн үүднээс бичлээ.
No comments:
Post a Comment