MONITORITZACIÓ DE DISPOSITIUS DE XARXA:MAPEIG D'OIDS I CREACIÓ DE PLANTILLES ZABBIX

Monitorització de Dispositius de Xarxa: Mapeig d’OIDs i Creació de Plantilles Zabbix

Perquè el nostre Centre d’Operacions de Xarxa (NOC) tingui visibilitat total de l’estat de salut de l’institut, no n’hi ha prou amb saber si un equip respon al ping. Necessitem extreure dades internes en temps real: la càrrega de la CPU, l’ús de la memòria RAM, l’estat i tràfic de les interfícies de xarxa, el temps d’activitat (uptime) o, en el cas de les impressores, el nivell de tòner restant.

Per aconseguir-ho, utilitzem el protocol SNMP (Simple Network Management Protocol). En aquest article es documenta el mapeig de les OIDs (Object Identifiers) essencials per a cada tipus de dispositiu (Switches, APs i Impressores) i com hem creat Templates a Zabbix per automatitzar la recollida de mètriques.

Pas 1: Què són les MIBs i les OIDs?

En el món de la monitorització de xarxes:

  • MIB (Management Information Base): És una base de dades jeràrquica en format text on s’estructura tota la informació que un dispositiu pot oferir (per exemple: dades del sistema, de les targetes de xarxa, etc.).

  • OID (Object Identifier): És un camí numèric únic (com un número de telèfon IP) que apunta a un valor o sensor concret dins de la MIB. Les OIDs es llegeixen en format numèric (ex: .1.3.6.1.2.1.1.3.0) o es tradueixen a text si tenim la MIB instal·lada (sysUpTime.0).

Pas 2: Mapeig d’OIDs SNMP per dispositiu

La xarxa del nostre institut compta amb diferents famílies de maquinari. Cadascuna requereix mètriques de control específiques:

1. Mètriques Comunes i de Sistema (MIB-II Estàndard)

Aquestes OIDs funcionen en qualsevol dispositiu que suporti SNMP (estàndard universal RFC 1213):

Mètrica

Nom de l’Objecte

OID Numèrica

Descripció

Uptime

sysUpTime.0

.1.3.6.1.2.1.1.3.0

Temps des de l’última encesa de l’equip (en centèsimes de segon).

Nom del dispositiu

sysName.0

.1.3.6.1.2.1.1.5.0

Nom de xarxa assignat al dispositiu (Hostname).

Localització

sysLocation.0

.1.3.6.1.2.1.1.6.0

Ubicació física definida per l’administrador (ex: “Rack-Aula102”).

2. Commutadors de Xarxa (Switches Cisco/Generic)

Per als switches, necessitem vigilar la saturació del processador i l’estat dels ports físics per detectar cables tallats o bucles:

Mètrica

Nom / MIB

OID Numèrica

Descripció

Càrrega de CPU (5s)

cpmCPUTotal5sec

.1.3.6.1.4.1.9.9.109.1.1.1.1.3

Ús de CPU en switches Cisco (darrera mitjana de 5 segons).

Memòria RAM Usada

ciscoMemoryPoolUsed

.1.3.6.1.4.1.9.9.48.1.1.1.5

Memòria RAM reservada i actualment en ús al dispositiu.

Estat del Port

ifOperStatus

.1.3.6.1.2.1.2.2.1.8.{#SNMPINDEX}

Estat actual del port (1 = Up, 2 = Down, 3 = Testing).

Tràfic de Entrada (Bytes)

ifHCInOctets

.1.3.6.1.2.1.31.1.1.1.6.{#SNMPINDEX}

Comptador de bytes rebuts (comptador d’alta velocitat de 64 bits).

Tràfic de Sortida (Bytes)

ifHCOutOctets

.1.3.6.1.2.1.31.1.1.1.10.{#SNMPINDEX}

Comptador de bytes enviats (comptador d’alta velocitat de 64 bits).

3. Punts d’Accés Wi-Fi (APs – Cisco / Standalone)

Per garantir una connexió Wi-Fi òptima a les aules de cicles, controlem la ràdio de freqüència i la concurrència d’usuaris:

Mètrica

Nom / MIB

OID Numèrica

Descripció

Clients Connectats

cDot11ActiveStations

.1.3.6.1.4.1.9.9.273.1.1.2.1.1

Nombre total de telèfons/portàtils actius en un SSID concret de l’AP.

Nivell de Soroll

cDot11PhyRxNoiseLevel

.1.3.6.1.4.1.9.9.272.1.1.1.8

Mesura de l’interferència RF ambiental (expressada en dBm).

4. Impressores Compartides (Printer MIB – RFC 3805)

El principal punt de fallada d’una impressora a les aules és l’esgotament del tòner o el desgast del fusor:

Mètrica

Nom / MIB

OID Numèrica

Descripció

Nivell de Tòner

prtMarkerSuppliesLevel

.1.3.6.1.2.1.43.11.1.1.9.1.1

Quantitat de tòner restant al cartutx (retorna percentatge o valor brut).

Capacitat Màxima

prtMarkerSuppliesMax

.1.3.6.1.2.1.43.11.1.1.8.1.1

Capacitat màxima de càrrega del cartutx instal·lat.

Estat del Maquinari

hrPrinterStatus

.1.3.6.1.2.1.25.3.5.1.1.1

Estat operatiu (1 = Altres, 3 = Imprimint, 4 = Aturada/Error, 5 = Paper encallat).

Total de Pàgines

prtMarkerLifeCount

.1.3.6.1.2.1.43.10.2.1.4.1.1

Comptador acumulatiu històric de pàgines impreses (odòmetre).

Pas 3: Creació de Plantilles (Templates) a Zabbix

Un cop tenim mapejades les OIDs, creem les plantilles a la interfície de Zabbix per automatitzar la monitorització de desenes d’equips sense haver d’escriure les regles un per un:

  1. Crear el Template Base:

    • Anem a Data collection -> Templates i cliquem a Create template.

    • Li assignem un nom descriptiu, per exemple: Template NOC - Impressores SNMPv3.

    • L’afegim al grup de plantilles Templates/Network devices.

  2. Definir els Items (Mètriques individuals):

    • Dins de la plantilla, anem a la pestanya Items i cliquem a Create item.

    • Name: Nivell de Tòner restant

    • Type: SNMP agent

    • Key: prtMarkerSuppliesLevel

    • SNMP OID: .1.3.6.1.2.1.43.11.1.1.9.1.1

    • Type of information: Numeric (unsigned)

    • Update interval: 5m (per a impressores no cal saturar la xarxa, amb consultar-ho cada 5 minuts n’hi ha prou).

  3. Configurar el Descobriment de Ports (LLD – Low Level Discovery):

    • En els switches amb 24 o 48 ports no podem crear els ítems manualment. Utilitzem les Discovery Rules de Zabbix.

    • Cliquem a Discovery rules -> Create discovery rule.

    • SNMP OID: discovery[{#IFDESCR},1.3.6.1.2.1.2.2.1.2,{#IFALIAS},1.3.6.1.2.1.31.1.1.1.18]

    • Això farà que Zabbix autodetecti tots els ports físics actius i els afegeixi automàticament a la base de dades sense intervenció humana.

Pas 4: Definició de Triggers (Alertes i Llindars)

Les mètriques només recullen dades; necessitem alertes automàtiques (Triggers) que adverteixin el nostre equip del NOC quan hi hagi un problema crític:

  • Alerta de Paper o Tòner Baix:

    • Expressió de l’alerta: last(/Template NOC - Impressores SNMPv3/prtMarkerSuppliesLevel) < 10

    • Severitat: Average (Groc). Llançarà un avís al Dashboard si el tòner baixa del 10%.

  • Alerta d’Equip Fora de Línia (Uptime reiniciat):

    • Expressió de l’alerta: change(/Template NOC - General SNMP/sysUpTime.0) < 0

    • Severitat: Information (Blau). Adverteix l’equip del NOC que un switch s’ha reiniciat recentment.

  • Alerta de Port de Switch Caigut:

    • Expressió de l’alerta: last(/Template NOC - Switches SNMP/ifOperStatus[{#SNMPINDEX}]) == 2

    • Severitat: High (Vermell). Salta immediatament si una línia troncal cau.