Friday, February 15, 2008

FCAPS - Fault Management

Tujuan utama dari fault management adalah untuk mendeteksi, mencatat, memberi tahu user dan jika memungkinkan membetulkan masalah jaringan secara otomatis. Tujuannya supaya jaringan bisa berjalan secara efektif. Fault management merupakan satu elemen dari manajemen jaringan ISO yang paling luas diterapkan karena komponen ini memang paling kritis dan dapat menyebabkan downtime atau penurunan kualitas jaringan.

Network Management Platform
Sebuah fault dapat terdeteksi melalui sebuah platform network management. Sehingga kemampuan sebuah network manager dalam mendeteksi fault menjadi sangat penting. Selain itu penggambaran grafikal kondisi suatu jaringan juga penting, karena gambar2 kondisi jaringan yang realtime sangat mudah dicerna oleh staf operasi.

Pada umumnya platform network management bisa terdiri dari multivendor. Fungsi utamanya adalah menerima laporan dari seluruh perangkat jaringan (dan server) yang hidup. Fungsi-fungsi lainnya adalah :
  • Network discovery
  • Topology mapping of network elements
  • Event handler
  • Performance data collector and grapher
  • Management data browser
Contoh network management platform adalah : HP OpenView, Computer Associates Unicenter, and SUN Solstice.

Di dalam suatu jaringan enterprise yang kompleks, akan terdapat banyak elemen jaringan yang berbeda2, dan menyulitkan manajemen jaringan secara keseluruhan. Untuk menjamin interoperability, masing2 vendor harus mengadopsi standard seperti CORBA (Common ObjectRequest Broker Architecture) dan CIM (Computer−Integrated Manufacturing).

Troubleshooting
Komponen penting lain dalam Fault Management adalah TFTP (Trivial File Transfer Protocol) dan Syslog server yang bisa digunakan untuk troubleshooting. Fungsi2 ini tersedia di dalam software semacam CiscoWorks RME (Resource Management Essential).

Fault Detection & Notification
Sebuah fault dapat terdeteksi melalui SNMP trap messages, SNMP polling, RMON (remote monitoring) thresholds, dan syslog messages. Management system akan memberitahu user pada saat terjadi masalah, sehingga dapat segera ditangani.

Pada suatu sistem jaringan yang besar, sebuah event manager yang powerful perlu dipertimbangkan, sehingga para personil NOC (Network Operation Center) akan bisa bekerja secara lebih efisien dalam mendeteksi dan mencari penyebab masalah, dan dapat melakukan tindakan2 yang proaktif. Salah satu software yang sangat membantu dalam hal ini adalah CIC (Cisco Info Center).

2 comments:

Anonymous said...

sebenernya event yg bagaimana yg bs dikategorikan sbg fault ? fault sendiri definisinya apa klo dlm fault management ^^?

tlg krm comment nya ke yusup_arkangel@yahoo.com

mks ^^

Tony Seno Hartono said...

1. Event yang dikategorikan fault misalnya interface down, temperature overheating, power supply mati, kegagalan perangkat, dan sebagainya

2. Definisi "fault" didalam fault management = "kegagalan/downtime/penurunan kualitas"