تصور کنید تنها در یک چشم بههمزدن، دادههای حیاتی سازمانتان از دست برود. این کابوس تنها با یک خرابی سختافزاری ساده در سرورها، ممکن است به واقعیت تبدیل شود. بنابراین، آشنایی با مشکلات سختافزاری سرورها و آگاهی از روشهای پیشگیری از آنها برای ادمینهای شبکه و متخصصان IT اهمیت بالایی دارند. اگر خرابیهای رایجی مثل مشکل در پاور، هارد دیسک، باتری سرور و… بهموقع شناسایی و رفع نشوند، میتوانند هزینههای سنگینی را به سازمان شما تحمیل کنند. در این مطلب، میخواهیم تعدادی از مهمترین مشکلات سختافزاری سرورها را بررسی کنیم و راهکارهایی را برای پیشگیری از بروز آنها در اختیارتان قرار دهیم. اگر میخواهید زیرساختهای خود را پایدار و ایمن نگه دارید، حتما تا انتهای این مطلب با ما همراه باشید.
رایجترین مشکلات سختافزاری سرورها
بهطور کلی، مشکلات متداول سختافزارهای سرور را میتوانیم بهصورت زیر خلاصه کنیم:
- خرابی هارد دیسک
- خرابی باتری سرور
- خرابی پاور سرور
- خرابی چیپ intelligent provisioning
- خرابی کش
- خرابی raid
گاهی اوقات این مشکلات با چند راهکار ساده رفع میشوند و گاهی اوقات نیز باید برای تعمیر سرور hp یا سایر سرورها بهتر است از مراجع تخصصی کمک بگیرید. در ادامه، درباره این مشکلات و نحوه پیشگیری از آنها اطلاعات بیشتری ارائه خواهیم کرد:
خرابی پاور سرور
پاور سرور وظیفه تامین برق پایدار قطعات مختلف را بر عهده دارد و هرگونه آسیب در این بخش ممکن است به خرابی گسترده و در نتیجه، خاموشی کامل سرور و ازدسترفتن اطلاعات حیاتی منجر شود. مواردی مثل خرابی ترانسفورماتور، خازن یا رگولاتور ولتاژ، از اصلیترین دلایل خرابی پاور سرور هستند. بهعلاوه، مواردی مثل وسانات شدید ولتاژ برق شهری میتواند باعث آسیبدیدن یا حتی سوختن پاور شود. برای جلوگیری از بروز این مشکل و رفع، میتوانید از راهکارهای زیر کمک بگیرید:
- راهکار رفع مشکل: اگر علائمی مانند خاموشی ناگهانی سرور یا پیامهای خطای مربوط به پاور را مشاهده کردید، باید سریعا وضعیت پاور را بررسی و در صورت نیاز آن را تعویض کنید.
- پیشگیری: مهمترین اقدام برای جلوگیری از خرابی پاور، استفاده از UPS استاندارد است. UPS نوسانات برق ورودی به سرور را کاهش میدهد و در صورت قطعی برق نیز بهطور موقت انرژی مورد نیاز سرور را تامین میکند. بهعلاوه، درصورتیکه سرور شما از دو منبع تغذیه پشتیبانی میکند، حتما منبع تغذیه دوم را روی سرور نصب کنید تا اگر یکی از پاورها خراب و از مدار خارج شد، خللی در کارکرد سرور ایجاد نشود.
خرابی هارد دیسک
ازآنجاییکه هارد دیسک ماهیت مکانیکی دارد، بهمرور زمان و با استفاده مداوم مستعد خرابی و فرسودگی میشود. هرچقدر که میزان خواندن و نوشتن داده روی این هاردها بیشتر باشد، عمر مفیدشان نیز کوتاهتر خواهد شد. بهعلاوه، اگر این هارد دیسکها بدون استفاده از تکنولوژی رید روی سرور نصب شدهباشند، در صورتی خرابی دیسک، احتمال ازدسترفتن اطلاعات نیز بیشتر میشود. در زیر، راهکار پیشگیری و رفع این مشکل را ارائه کردهایم:
- راهکار رفع مشکل: اگر از رید استفاده کردهباشید، در صورت خرابی هارد اطلاعات بازیابی میشوند. در غیر این صورت، برای ریکاوری اطلاعات باید از خدمات تخصصی بهرهمند شوید.
- پیشگیری: استفاده از ریدبندی متناسب با تعداد هاردها، پیکربندی سرور با SSD (درصورتیکه دوام بالای هارد حیاتی است)، بکاپگیری منظم از دادهها
خرابی باتری سرور
از رایجترین مشکلات سختافزاری سرورها، خرابشدن باتری سرور است. آسیب به باتری رید سرور یا کاهش عمر مفید آن، علائمی مانند پیام خطای کنترلر رید، بادکردن باتری، شارژدهی ضعیف و خاموششدن ناگهانی سرور را بههمراه دارد. گاهی اوقات هم سیستمعامل ویندوز، مستقیما با نشاندادن پیغام خطا این مشکل را اطلاعرسانی میکند. برای پیشگیری یا رفع این مشکل، میتوانید راهکارهای زیر را امتحان کنید:
- راهکار رفع مشکل: در صورت مشاهده علائم خرابی باتری سرور، باید فورا آن را تعویض کنید تا باتری معیوب به سایر سختافزارهای سرور آسیب نرساند.
- پیشگیری: بررسی دورهای سلامت باتری، توجه به پیامهای هشدار و تعویض بهموقع باتریهای فرسوده
خرابی چیپ intelligent provisioning
تراشه Intelligent Provisioning (IP) نقش مهمی در مدیریت پیکربندی و راهاندازی سرور ایفا میکند. اگر این تراشه خراب شود، مشکلاتی جدی مانند بوتنشدن سرور، عدم بارگذاری تنظیمات شبکه یا سایر تنظیمات سیستمی را بههمراه خواهد داشت. در برخی موارد نیز ممکن است خرابی کامل این تراشه، سرور را کاملا غیرقابلاستفاده کند. بوتنشدن سرور، نمایش پیامهای خطای مربوط به تراشه IP و کاهش و ناپایداری عملکرد کلی سرور از علائم خرابی تراشه IP هستند. از راهکارهایی که در ادامه ارائه کردهایم، میتوانید برای پیشگیری و رفع مشکل کمک بگیرید:
- راهکار رفع مشکل: در صورت مشاهده علائم فوق، ابتدا Firmware سرور و تراشه IP را به آخرین نسخه بهروزرسانی کنید. اگر مشکل حل نشد، باید سختافزارهای سرور را بهصورت دقیق بررسی کنید. در صورت آسیب فیزیکی یا خرابی مدار، تنها راهحل تعویض مادربرد سرور یا تعمیر تخصصی آن خواهد بود.
- پیشگیری: جلوگیری از واردشدن ضربه فیزیکی به سرور، استفاده از UPS برای کنترل نوسانات برق و بهروزرسانی مرتب Firmware
خرابی کش
از دیگر مشکلات سختافزاری سرورها، باید به خرابی کش اشاره کنیم. درصورت خرابی باتری رید کنترلر، کش غیرفعال میشود و در صورت قطعی برق، ممکن است اطلاعات ذخیرهنشده در کش از بین بروند. ازآنجاییکه این موضوع ممکن است باعث ازدسترفتن دادههای حساس شود، بهتر است راهکارهایی را که در ادامه برای پیشگیری و رفع مشکل ارائه میکنیم، جدی بگیرید:
- راهکار رفع مشکل: اگر متوجه بروز خطا یا غیرفعالشدن کش شدید، باتری رید کنترلر را در اسرع وقت تعویض کنید تا عملکرد کش و امنیت دادهها حفظ شود.
- پیشگیری: استفاده از ابزارهایی مثل hp ssacli برای مانیتورینگ مستمر وضعیت کش و باتری رید کنترلر، تعویض بهموقع باتری معیوب
خرابی raid
منظور از خرابیRAID ، مشکلاتی است که در آرایههای RAID رخ میدهد و ممکن است باعث ازدسترفتن یا عدم دسترسی به دادهها شود. مشکلات سختافزاری در هارد دیسک یا رید کنترلر، دلیل اصلی از خرابیRAID است. برای مثال، در ریدبندی سفر، خرابی هر یک از هارد دیسکها میتواند باعث ازدسترفتن تمامی اطلاعات شود. همچنین در RAID 5، اگر دو هارد دیسک خراب شوند، اطلاعات از دست میروند. برای پیشگیری و رفع این مشکل، میتوانید راهکارهای زیر را امتحان کنید:
- راهکار رفع مشکل: بررسی مستمر و تعویض هاردهای معیوب، نصب و پیکربندی RAID کنترلرهای معتبر و با قابلیت مدیریت خودکار خطا
- پیشگیری: اولین گام برای رفع این مشکل، شناسایی دقیق خطا و بررسی وضعیت هارد دیسکها و کنترلر است. در صورت لزوم، دیسکهای خراب را تعویض کنید و ریدبندی را مجددا انجام دهید.
مشکلات سختافزاری رایج سرور را جدی بگیرید!
مواردی که در این مطلب آنها را بهعنوان مشکلات متداول سختافزارهای سرور معرفی کردیم، میتوانند آسیبهایی جدی به زیرساختهای سازمان وارد کنند و باعث توقف عملیات سرور یا ازدسترفتن اطلاعات حیاتی آنها شوند. با شناخت این مشکلات و رعایت نکات پیشگیرانه، تا حد بسیار زیادی احتما وقوع این خرابیها را بهحداقل میرساند و عملکرد بهینه سرورها را تضمین میکند. در این مطلب، با شما درباره مشکلات سخت افزاری سرورها صحبت کردیم و راهکارهایی ساده برای پیشگیری یا رفع آنها در اختیارتان قرار دادیم. بهنظر شما چطور میتوانیم احتمال بروز این مشکلات را بهحداقل برسانیم؟