
Sebelumnya kita pernah membuat artikel perihal cara pengecekan kesehatan SSD Storage pada server di : https://www.natanetwork.com/portal/knowledgebase/260/Tutorial-melakukan-pengecekan-kesehatan-SSD-Storage-di-Linux-OS.html
Namun tutorial tersebut berlaku jika kamu menggunakan raid software (mdadm). Nah, trus gimana kalo menggunakan raid hardware? ini kadang yang menjadi permasalahan. Namun jangan kawatir, kami akan mencoba menjelaskan secara rinci. Simak artikel ini sampe habis ya!
Install MegaCLI
Langkah awal yang harus kamu lakukan adalah install MegaCli. Ini tergantung jenis raid hardware yang kamu gunakan ya.
Sebagai contoh:
Raid Hardware model 9361-8i menggunakan chipset LSI SAS3108, yaitu setara dengan Dell Perc H730 + BBU
Raid Hardware model 9341-8i menggunakan chipset LSI SAS3008, yaitu setara dengan Dell Perc H330
Jika kamu pengguna raid hardware dell, silahkan install PERCCLI for linux di: https://www.dell.com/support/kbdoc/en-id/000217748/how-to-install-perccli-utility-on-red-hat-linux-ubuntu-linux-vmware-esxi-and-windows-server
Namun jika kamu menggunakan raid hardware adaptor jenis lain, mungkin bisa juga mencoba ini : MegaCli-8.07.14-1.noarch.rpm
https://www.mellowhost.com/billing/index.php?rp=/knowledgebase/69/How-to-Install-LSI-Command-Line-Tool.html
Melihat Virtual Drive
Setelah install, biasanya file akan disimpan di lokasi /opt/MegaRAID/MegaCli/

jalankan perintah ini untuk membaca Virtual Drive yang sudah kamu buat.
[root@sgp-server MegaCli]# /opt/MegaRAID/MegaCli/MegaCli64 -LdPdInfo -aAll
Contoh salah satu Virtual Drive yang saya miliki yaitu :
Virtual Drive: 1 (Target Id: 1)Name :VD02RAID Level : Primary-1, Secondary-0, RAID Level Qualifier-0Size : 1.745 TBSector Size : 512Is VD emulated : NoMirror Data : 1.745 TBState : DegradedStrip Size : 256 KBNumber Of Drives : 2Span Depth : 1Default Cache Policy: WriteThrough, ReadAheadNone, Direct, No Write Cache if Bad BBUCurrent Cache Policy: WriteThrough, ReadAheadNone, Direct, No Write Cache if Bad BBUDefault Access Policy: Read/WriteCurrent Access Policy: Read/WriteDisk Cache Policy : Disk's DefaultEncryption Type : NoneBad Blocks Exist: NoPI type: No PI
Terlihat disana menggunakan RAID-1 mirroring dengan konfigurasi WriteThrough dan No Read Ahead.
berikut detail salah satu ssd storage yang digunakan.
=== START OF INFORMATION SECTION ===Model Family: Samsung based SSDsDevice Model: SAMSUNG MZ7KM1T9HMJP-00005Serial Number: xxxxxxxxxxxLU WWN Device Id: 5 002538 c40a4fc6aFirmware Version: GXM1003QUser Capacity: 1.920.383.410.176 bytes [1,92 TB]Sector Size: 512 bytes logical/physicalRotation Rate: Solid State DeviceDevice is: In smartctl database [for details use: -P show]ATA Version is: ACS-2, ATA8-ACS T13/1699-D revision 4cSATA Version is: SATA 3.1, 6.0 Gb/s (current: 6.0 Gb/s)Local Time is: Thu Mar 13 20:34:34 2025 WIBSMART support is: Available - device has SMART capability.SMART support is: Enabled
PD: 0 InformationEnclosure Device ID: 252Slot Number: 3Drive's position: DiskGroup: 1, Span: 0, Arm: 0Enclosure position: N/ADevice Id: 70WWN: 5002538c40a4fc6aSequence Number: 2Media Error Count: 0Other Error Count: 4829Predictive Failure Count: 0Last Predictive Failure Event Seq Number: 0PD Type: SATA
Cek Kesehatan SSD via SMART
Dilihat di sini dia sudah suport SMART, jadi kita bisa cek kesehatan SSD nya.
Gunakan perintah smartctl dengan addon megaraid. Lalu cek Device ID yaitu 70. Syntax nya bisa dilihat dibawah ini:
[root@sgp-server MegaCli]# smartctl -d megaraid,70 /dev/sdb -a
SMART Attributes Data Structure revision number: 1Vendor Specific SMART Attributes with Thresholds:ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE5 Reallocated_Sector_Ct 0x0033 100 100 010 Pre-fail Always - 09 Power_On_Hours 0x0032 095 095 000 Old_age Always - 2411012 Power_Cycle_Count 0x0032 099 099 000 Old_age Always - 11177 Wear_Leveling_Count 0x0013 097 097 005 Pre-fail Always - 911179 Used_Rsvd_Blk_Cnt_Tot 0x0013 100 100 010 Pre-fail Always - 0180 Unused_Rsvd_Blk_Cnt_Tot 0x0013 100 100 010 Pre-fail Always - 15259181 Program_Fail_Cnt_Total 0x0032 100 100 010 Old_age Always - 0182 Erase_Fail_Count_Total 0x0032 100 100 010 Old_age Always - 0183 Runtime_Bad_Block 0x0013 100 100 010 Pre-fail Always - 0184 End-to-End_Error 0x0033 100 100 097 Pre-fail Always - 0187 Uncorrectable_Error_Cnt 0x0032 100 100 000 Old_age Always - 0190 Airflow_Temperature_Cel 0x0032 059 050 000 Old_age Always - 41195 ECC_Error_Rate 0x001a 200 200 000 Old_age Always - 0197 Current_Pending_Sector 0x0032 100 100 000 Old_age Always - 0199 CRC_Error_Count 0x003e 095 095 000 Old_age Always - 4777202 Exception_Mode_Status 0x0033 100 100 010 Pre-fail Always - 0235 POR_Recovery_Count 0x0012 099 099 000 Old_age Always - 10241 Total_LBAs_Written 0x0032 099 099 000 Old_age Always - 384396059168242 Total_LBAs_Read 0x0032 098 098 000 Old_age Always - 5496400536207243 SATA_Downshift_Ct 0x0032 100 100 000 Old_age Always - 0244 Thermal_Throttle_St 0x0032 100 100 000 Old_age Always - 0245 Timed_Workld_Media_Wear 0x0032 100 100 000 Old_age Always - 65535246 Timed_Workld_RdWr_Ratio 0x0032 100 100 000 Old_age Always - 65535247 Timed_Workld_Timer 0x0032 100 100 000 Old_age Always - 65535251 NAND_Writes 0x0032 100 100 000 Old_age Always - 3817332726848
Perhatikan baris Wear_Leveling_Count, dimana indikator tersebut menunjukan kesehatan disk SSD. Bisa terlihat menunjukan angka 97, artinya SSD Health = 97%
Kesimpulan
Ilmu baru nih, sekarang kamu sudah paham kan cara cek SSD Health menggunakan smartctl + raid hardware. Sering-seringlah cek kesehatan storage terutama SSD atau NVMe. Karena mereka punya umur tersendiri. Kalo Health sudah dibawah 95%, kemungkinan besar kemampuan baca dan tulis nya sudah menurun. jadi sebaiknya segera dijadwalkan untuk replace yang baru.
Kalo kamu punya masukan lainnya, silahkan hubungi kami ya! Semoga dengan artikel ini bisa membantu kamu untuk lebih peduli terhadap data, apalagi kalo datamu penting.!



