Kaique Mitsuo Silva Yamamoto
Redes isp

Zabbix e NOC para Provedores de Internet

Monitoramento profissional de ISPs com Zabbix: instalação, templates MikroTik, SNMP, Grafana, alertas via Telegram e estrutura de NOC para provedores de pequeno e médio porte.

O monitoramento de rede é o que separa um provedor reativo (que descobre a falha quando o cliente liga) de um provedor proativo (que age antes que o cliente perceba). Com Zabbix bem configurado, é possível detectar degradação de sinal óptico, latência alta em uplinks e falhas de equipamentos com antecedência de minutos a horas.

Segundo pesquisa da Anatel de 2023, latência e instabilidade respondem por mais de 40% das reclamações de usuários de banda larga fixa. A maioria dessas falhas poderia ser detectada com monitoramento adequado antes de impactar clientes.


Arquitetura de monitoramento para ISP

┌─────────────────────────────────────┐
│           Zabbix Server             │
│   (coleta, alertas, dashboards)     │
└──────────────┬──────────────────────┘

    ┌──────────┴──────────┐
    │                     │
┌───┴───┐           ┌─────┴─────┐
│Zabbix │           │  Grafana  │
│Proxy  │           │(dashboards│
│(PoP2) │           │ NOC)      │
└───┬───┘           └───────────┘

┌───┴────────────────────────────┐
│  Equipamentos monitorados       │
│  MikroTik, OLTs, Switches,     │
│  Roteadores, Servidores         │
└─────────────────────────────────┘

Quando usar Zabbix Proxy

Use Zabbix Proxy quando houver múltiplos PoPs (pontos de presença) — o proxy coleta dados localmente e envia ao servidor central, reduzindo o tráfego WAN de monitoramento e evitando que falhas de link afetem a coleta.


Instalação do Zabbix 7.x

Instalação no Ubuntu 22.04 LTS

# Adicionar repositório oficial Zabbix
wget https://repo.zabbix.com/zabbix/7.0/ubuntu/pool/main/z/zabbix-release/zabbix-release_7.0-1+ubuntu22.04_all.deb
dpkg -i zabbix-release_7.0-1+ubuntu22.04_all.deb
apt update

# Instalar servidor, frontend e agente
apt install -y zabbix-server-mysql zabbix-frontend-php \
    zabbix-apache-conf zabbix-sql-scripts \
    zabbix-agent2 mysql-server

# Criar banco de dados
mysql -u root -p <<EOF
create database zabbix character set utf8mb4 collate utf8mb4_bin;
create user zabbix@localhost identified by 'senha-forte-zabbix';
grant all privileges on zabbix.* to zabbix@localhost;
flush privileges;
EOF

# Importar schema
zcat /usr/share/zabbix-sql-scripts/mysql/server.sql.gz | \
    mysql --default-character-set=utf8mb4 -u zabbix -p zabbix

# Iniciar serviços
systemctl enable --now zabbix-server zabbix-agent2 apache2

Configuração do Zabbix Server

# /etc/zabbix/zabbix_server.conf
DBHost=localhost
DBName=zabbix
DBUser=zabbix
DBPassword=senha-forte-zabbix

# Performance para ISP com muitos hosts
StartPollers=20
StartPingers=10
StartTrappers=10
CacheSize=256M
HistoryCacheSize=128M
TrendCacheSize=64M

Templates MikroTik no Zabbix

Template oficial — Zabbix MikroTik SNMP

O Zabbix possui templates oficiais para MikroTik via SNMP. Para ativá-los:

  1. Habilitar SNMP no MikroTik:
# No MikroTik RouterOS
/snmp community
add addresses=10.0.0.0/8 authentication-password=auth-pass \
    encryption-password=enc-pass \
    encryption-protocol=AES name=public-isp \
    security=private

/snmp
set contact="NOC ISP <noc@meuprovedor.com.br>" \
    enabled=yes location="PoP Principal - SP" \
    trap-community=public-isp trap-version=2
  1. Configurar host no Zabbix com interface SNMP v2c ou v3
  2. Aplicar template: Template Net MikroTik SNMP

Itens críticos a monitorar em roteadores ISP

ItemOID SNMPLimiar de alerta
CPU Usage.1.3.6.1.2.1.25.3.3.1.2> 80% por 5 min
Free Memory.1.3.6.1.4.1.14988.1.1.1.2< 20%
Interface Traffic.1.3.6.1.2.1.31.1.1.1.6/10> 90% da capacidade
Interface Errors.1.3.6.1.2.1.2.2.1.14> 100 erros/min
BGP Session State.1.3.6.1.2.1.15.3.1.2≠ 6 (established)
Temperature.1.3.6.1.4.1.14988.1.1.3.10> 70°C

Monitoramento de ONTs via OLT Huawei

Para provedores com GPON, é possível coletar métricas de cada ONT diretamente da OLT via SNMP:

# OID para potência Rx de ONTs Huawei MA5800
# .1.3.6.1.4.1.2011.6.128.1.1.2.51.1.4  = Rx power (em 0.01 dBm)
# .1.3.6.1.4.1.2011.6.128.1.1.2.51.1.5  = Tx power

# No Zabbix, criar item com tipo SNMP e OID da OLT
# Trigger: Rx power < -27 dBm → alerta de degradação óptica

Alertas via Telegram

Configurar alertas no Telegram é simples e muito eficaz para equipes de NOC pequenas:

# 1. Criar bot no Telegram via @BotFather
# 2. Obter token: 1234567890:AAEexample...
# 3. Obter chat_id do grupo de NOC

# No Zabbix: Administration → Media types → Telegram
# Configurar:
# Token: {SEU_TOKEN}
# Parse mode: HTML
# Configurar Action com condição: Trigger severity >= Warning

# Mensagem de alerta sugerida (Script Zabbix → Telegram):
# 🔴 PROBLEMA: {TRIGGER.NAME}
# Host: {HOST.NAME} ({HOST.IP})
# Severidade: {TRIGGER.SEVERITY}
# Horário: {EVENT.TIME} {EVENT.DATE}
# Valor atual: {ITEM.LASTVALUE}

Dashboard NOC para ISP

Grafana integrado ao Zabbix

O Grafana oferece visualizações mais ricas que o frontend nativo do Zabbix. Para ISPs, os painéis mais úteis são:

# Instalar Grafana
apt install -y grafana

# Plugin Zabbix para Grafana
grafana-cli plugins install alexanderzobnin-zabbix-app

# Configurar datasource Zabbix no Grafana:
# URL: http://localhost/zabbix
# Credentials: usuário/senha do Zabbix

Painéis recomendados para NOC de ISP:

  1. Visão geral de uptime — todos os equipamentos críticos em grid
  2. Tráfego de borda — gráfico de banda do uplink (entrada/saída)
  3. BGP Sessions — status de todas as sessões BGP em tempo real
  4. Potência óptica — mapa de calor das potências dos ONTs (detecta setores com degradação)
  5. Latência por cliente — latência média por cluster/setor

Estrutura de NOC para provedores pequenos

Um NOC funcional para um ISP de até 5.000 clientes pode operar com apenas:

  • 1 servidor Zabbix (8 vCPU, 16 GB RAM, 500 GB SSD)
  • Alertas automáticos via Telegram para o grupo de técnicos
  • Dashboard Grafana aberto em TV na sala de operações
  • Plantão on-call com escalamento de alertas (nível 1 → nível 2 → gerência)
Fluxo de alertas:
Zabbix detecta anomalia

Alerta Telegram → Grupo Técnico N1 (resposta em 5 min)
    ↓ (se não resolvido em 15 min)
Alerta Telegram → Técnico N2 Sênior
    ↓ (se não resolvido em 30 min)
Alerta WhatsApp → Gerência Técnica

Recursos

Quer implementar Zabbix no seu provedor? → Consultoria gratuita

On this page