• Apa yang hilang dari perencanaan operasional fasilitas data center Anda?

Man stares at server rack in confusion
Kesalahan manusia dan kurangnya perhatian dapat memengaruhi kinerja berbagai desain data center

Dalam data center, 70% penyebab pemadaman listrik adalah faktor kesalahan manusia - yang bertentangan dengan lingkungan ketika kesalahan bukanlah sebuah pilihan. Fasilitas operasional yang dirancang sempurna dan program perawatan (O&M) dapat meminimalisasi risiko dan mengurangi biaya tambahan. Agar dapat berhasil, program O&M bergantung pada dua pilar utama: menanamkan "pola pikir misi kritis" dan menggabungkan 12 elemen inti.

Langkah 1: Mengadopsi pola pikir misi kritis
Tujuan utama dari fasilitas data center adalah untuk menyediakan daya yang stabil, pendingin, jaringan, dan sumber daya ruangan dalam jumlah yang tepat, dan waktu yang tepat untuk server TI, perlengkapan jaringan serta tempat penyimpanan. Sesederhana menggunakan: Kegagalan bukanlah sebuah pilihan.

Mendorong staf untuk melakukan internalisasi "pola pikir misi kritis" menjadi kunci dari efektivitas program O&M, seperti yang didefinisikan melalui:

  • Fokus pada risiko mitigasi pada semua aktivitas, prosedur dan proses kerja
  • Bekerja dengan rasa percaya diri dan sabar, hasilnya adalah persiapan dan perencanaan yang matang
  • Mengambil sebuah analisis, pendekatan berdasarkan proses untuk menghindari risiko dan dapat memecahkan masalah
  • Memahami fungsi dan hubungan antara sistem fasilitas dan komponen
  • Berkomitmen untuk terus mempelajari dan melakukan peningkatan

Langkah 2: Menggabungkan 12 elemen inti
Membangun atas prinsip pola pikir misi kritis, fasilitas tim dapat menggunakan dan mengelola sebuah program efektif dengan menguraikan kedua belas elemen inti:

  1. 1. Kesehatan dan keselamatan lingkungan:: keselamatan pabrik/ pelatihan; perlengkapan perlindungan pribadi; prosedur lockout/tagout; analisis bahaya, penanganan materi berbahaya, dan komunikasi berbahaya, serta patuh pada peraturan dan hukum tentang kesehatan dan keselamatan

  2. 2. Anggota manajemen: pakar, latihan, taraf staf pengganti; dan mentalitas misi kritis

    Referensi Cepat: 12 Elemen Penting dari Program O&M
    Keselamatan dan Kesehatan LingkunganPelatihan
    Anggota manajemenPengelolaan infratsruktur
    Kesiagaan dan tanggap daruratPengelolaan kualitas
    Pengelolaan perawatanPengelolaan energi
    Pengelolaan perubahanPengelolaan keuangan
    Pengelolaan dokumentasiDocumentation managementPantauan dan review kinerja
  3. 3. Kesiagaan dan tanggap darurat: prosedur operasional gawat darurat untuk semua skeneraio tinggi risiko; memberikan analisis untuk mengurangi kegagalan dan meningkatkan respon di masa depan.
  1. 4. Pengelolaan perawatan: aset, perintah kerja dan pengelolaan suku cadang dikombinasikan dengan rencana perawatan preventif dan prediktif.

  2. 5. Pengelolaan perubahan: pantauan dan review prosedur operasional, analisis risiko dan komunikasi, praktik kerja terstruktur, dan pengawasan vendor/ kontraktor

  3. 6. Pengelolaan dokumentasi: sistem pengaturan dokumen penting yang akurat untuk prosedur operasional, perawatan rekaman dan anggota

  4. 7. Pelatihan: penilaian dan pelatihan anggota untuk memastikan kemampuan dalam tugas perawatan dan operasional; termasuk sertifikasi dan edukasi berjalan

  5. 8. Pengelolaan infrastruktur: dukungan terhadap perubahan kebutuhan TI melalui fasilitas pemantauan, pengelolaan kapasitas, dan TI/Fasilitas terpadu

  6. 9. Pengelolaan kualitas: jaminan kualitas untuk menghindari kerusakan melalui proses dan prosedur yang konsisten; pemantauan kualitas untuk mendeteksi kesalahan sistem atau manusia melalui pengecekan, audit dan inspeksi; peningkatan kualitas yang berkesinambungan untuk menganalisis kesalahan dan membuat modifikasi agar kesalahan tidak terulang

  7. 10. Pengelolaan energi: penggunaan perangkat lunak pengelolaan infrastruktur data center (DCIM) untuk meningkatkan efisiensi energi, tolak ukur kinerja, analisis efisiensi dan sumber energi strategis

  8. 11. Pengelolaan keuangan: pengawasan ketat atau pembelian/ pengiriman/ faktur untuk memastikan perawatan kritis dan proyek fasilitas tetap pada jadwal dan menghindari waktu nonaktif

  9. 12. Review dan pemantauan kinerja: pengumpulan dan analisis pengukuran dan KPI untuk memastikan rencana O&M produktif, sesuai target dan sesuai dengan target bisnis

Jebakan umum
Kesalahan yang berhubungan dengan program operasional dapat mengacaukan efektivitas dan menyebabkan gangguan sistem, beban berlebih atau cidera staf. Program perawatan tidak akan efektif jika kekurangan metrik, misalnya, dan lemah pada pelatihan atau dokumentasi. Pengelolaan perubahan yang tidak efektif atau anggota tim yang masih terjebak dalam mode manual akan menghambat program; dan tim yang terlalu percaya diri (mengapa melakukan perubahan terhadap apa yang sudah berfungsi) akan menolak prosedur baru. Akhirnya, kegagalan untuk menguji coba dan mengevaluasi atau kegagalan untuk menerapkan sistem bermutu merupakan perangkap yang akan berdampak pada keberhasilan program.

Kesalahan manusia dan kurangnya perhatian dapat memengaruhi kinerja berbagai desain data center, namun menciptakan dan menerapkan sebuah program O&M yang efektif akan mengurangi pengeluaran operasional di saat pemeliharaan kinerja fasilitas sedang dilakukan.

Untuk mendapatkan petunjuk lengkap untuk meningkatkan fasilitas operasional, baca white paper "Elemen Penting dari Fasilitas Operasional Data Center."
Pelajari lebih lanjut