Terkadang dalam penggunaan jumlah keping memory RAM server yang banyak bisa memunculkan kendala seperti memory tidak terbaca dan error. Hal ini biasanya akan muncul blue screen pada komputer jenis desktop / PC biasa. Namun untuk server, efek sampingnya beragam mulai dari bisa server hang, server reboot sendiri, atau bahkan server mati total.
Dalam kasus error memory ini, kita harus teliti dalam melihat akar permasalahan. Langkah pertama kamu harus cek kedalam IPMI / BMC / iDRAC server. Apakah ada tanda-tanda server unhealth? Terutama kamu harus cek error log nya.
Sebagai contoh kasus terdapat server branded merek Dell 1U dengan konfigurasi memory: 8gb x 16 keping = 128gb RAM DDR3
Ditemukan terdapat 1 keping RAM yang error yaitu di DIMM_A7, artinya ada 1 keping RAM yang bermasalah yang berlokasi di slot A7.
Error message yang didapat adalah : Multi-bit memory error on DIMM_A7
Jika kita lihat lebih detail di menu Hardware --> Memory RAM, maka akan terlihat detail error ram terletak di lokasi slot A7 (CPU 1)
Solusi pembenaran memory error
Menurut dokumentasi Dell sendiri, mereka memberikan tutorial cara troubleshoot jika terjadi masalah memory seperti ini, yaitu dengan cara mencabut memory di slot yang bermasalah dan menukar dengan slot pasangannya.
Dalam kasus ini slot yang bermasalah ada di A7, maka kita akan tukar dengan memory yang ada di B7.
Kamu bisa baca dokumentasi troubleshooting memory errors on Dell Server.
Setelah proses swap memory tersebut selesai. Pengecekan kita terlihat bahwa memory yang asalnya slot A7 bermasalah, sekarang sudah tidak masalah lagi. Semua memory terdetek dengan baik sebanyak total 16 slot.
Kesimpulan
Jika kamu mengahadapi masalah memory error "uncorrectable memory error", jangan langsung panik. Hal ini wajar ditemukan terutama untuk server yang sudah berumur. Biasanya issue ini muncul karena adanya debu kotor pada slot memory. Belum tentu juga masalah di memory nya yang rusak, tetapi lebih ke arah memory atau slot memory nya yang kotor. Solusi sederhana adalah melepas memory tersebut, membersihkan atau bahkan memindah slot memory lainnya yang kosong.
Demikian tutorial sederhana yang kami berikan, semoga bermanfaat bagi kalian semua.