1. Usar System Dashboard
Puntos Clave
- Accesible vía página principal del Management Portal
- Visualización de salud del sistema en tiempo real
- Métricas clave: CPU, memoria, E/S de disco, unidades de licencia, conteo de procesos
- Indicadores codificados por color para evaluación rápida de estado
- Capacidad de drill-down para investigación detallada
Notas Detalladas
Visión General y Acceso
El System Dashboard proporciona una vista centralizada en tiempo real de métricas de salud y rendimiento de InterSystems IRIS accesible a través de la página principal del Management Portal. El dashboard presenta información crítica del sistema en un formato intuitivo y visual usando gráficos, grafos e indicadores codificados por color que habilitan evaluación rápida del estado del sistema.
Componentes del Dashboard
Los componentes clave del dashboard incluyen métricas de visión general del sistema mostrando nombre de instancia, versión, uptime y estado actual; utilización de licencia mostrando unidades de licencia usadas versus disponibles con advertencias visuales a medida que se acerca la capacidad; actividad de proceso mostrando conteo de procesos activos y tendencias recientes; utilización de CPU con gráficos históricos y porcentaje actual; uso de memoria incluyendo memoria asignada, usada y disponible; estadísticas de E/S de disco mostrando operaciones de lectura/escritura por segundo; indicadores de espacio libre de base de datos con advertencias para bases de datos acercándose a capacidad; estado de journal incluyendo archivo actual y utilización de espacio; actividad de red para conexiones de cliente; y estado de servicio mostrando si los servicios críticos (servidor web, superserver, etc.) están en ejecución.
Codificación de Color y Drill-Down
El dashboard usa codificación de color para evaluación rápida de estado - verde indica operaciones normales, amarillo señala advertencias que requieren atención, y rojo destaca condiciones críticas demandando acción inmediata. Cada componente del dashboard típicamente ofrece capacidad de drill-down: hacer clic en una métrica navega a vistas detalladas con estadísticas completas, tendencias históricas y controles de gestión. Por ejemplo, hacer clic en la sección de utilización de licencia navega a páginas detalladas de gestión de licencias; hacer clic en conteo de procesos navega a la página Processes para examen detallado de procesos. El dashboard se auto-refresca periódicamente (intervalo configurable) para proporcionar monitoreo casi en tiempo real sin recarga manual de página.
Mejores Prácticas
Las mejores prácticas para uso del dashboard incluyen revisar el dashboard regularmente como parte de procedimientos operacionales diarios, investigar indicadores amarillos/rojos prontamente, establecer comprensión de línea base de la apariencia normal del dashboard para su entorno para reconocer anomalías rápidamente, y entrenar personal operacional en interpretación del dashboard para monitoreo efectivo de primera línea. El dashboard sirve como el punto de entrada primario para monitoreo del sistema y a menudo el primer lugar donde buscar cuando los usuarios reportan problemas de rendimiento o problemas del sistema. Mientras el dashboard proporciona excelente monitoreo de visión general, la solución detallada de problemas típicamente requiere navegar a páginas de gestión específicas o usar utilidades especializadas como ^PERFMON.
Referencias de Documentación
2. Monitorear rendimiento de buffer global y de rutina
Puntos Clave
- Los buffers globales almacenan en caché bloques de base de datos en memoria
- Los buffers de rutina almacenan en caché código de rutina compilado en memoria
- El ratio de hit de buffer es indicador clave de rendimiento (debe ser >90%)
- Ratios de hit bajos indican asignación de buffer insuficiente
- Configurar tamaños de buffer en sección [config] de iris.cpf
Notas Detalladas
Comprensión de Pools de Buffer
El rendimiento de buffer es fundamental para el throughput y tiempo de respuesta de InterSystems IRIS. El sistema usa dos pools de buffer primarios: buffers globales almacenan en caché bloques de base de datos, mientras que buffers de rutina almacenan en caché código de rutina compilado. Cuando el código de aplicación accede a un global, IRIS primero verifica el pool de buffer global. Si el bloque se encuentra (un "hit"), el acceso se completa inmediatamente desde memoria. Si no se encuentra (un "miss"), IRIS debe leer desde disco (órdenes de magnitud más lento) y almacenar en caché el bloque en buffers para acceso futuro. El ratio de hit de buffer (hits divididos por referencias totales) mide la efectividad del buffer - ratios arriba del 90% generalmente indican buen rendimiento, mientras ratios más bajos sugieren asignación de buffer insuficiente causando E/S de disco excesiva.
Monitoreo de Rendimiento de Buffer
Monitoree el rendimiento de buffer a través de múltiples interfaces. El System Dashboard muestra ratios actuales de hit de buffer. La utilidad ^PERFMON proporciona estadísticas de buffer en tiempo real incluyendo conteo de hits, conteo de misses, porcentaje de ratio de hit, tamaño de pool de buffer y operaciones de lectura de disco. La página System Performance del Management Portal (System Operations > System Performance) ofrece análisis detallado de buffer con tendencias históricas. Las métricas clave de buffer incluyen ratio de hit de buffer global (objetivo: >90-95%), ratio de hit de buffer de rutina (objetivo: >95%), porcentaje de utilización de pool de buffer (cuánto del buffer asignado se usa activamente), tasa de lectura de disco (lecturas físicas por segundo - menor es mejor cuando el ratio de hit es alto), y envejecimiento de pool de buffer (qué tan rápido se están reciclando los buffers).
Diagnóstico de Ratios de Hit Bajos
Los ratios de hit de buffer bajos indican problemas de rendimiento. La resolución típicamente involucra aumentar la asignación de buffer, aunque el análisis de causa raíz debe confirmar que esto es apropiado. Ratios de hit muy bajos (<70%) pueden indicar problemas de diseño de aplicación como escanear grandes globales completos ineficientemente.
Configuración de Tamaños de Buffer
Los tamaños de buffer se configuran en el archivo de parámetros de configuración (iris.cpf) sección [config] usando parámetros como globals_buffers (número de bloques de buffer global) y routines_buffers (número de bloques de buffer de rutina). Los cambios requieren reinicio de instancia. Al aumentar buffers, asegure que exista RAM física adecuada - asignar más buffers que la memoria disponible causa paginación del sistema operativo que degrada severamente el rendimiento. Fórmula para memoria de buffer: globals_buffers x database_block_size (por defecto 8KB) + routines_buffers x 8KB = memoria total de buffer. Monitoree estadísticas de memoria del sistema operativo junto con métricas de buffer de IRIS para asegurar que no haya presión de memoria a nivel de sistema. Para rendimiento óptimo, dimensione buffers globales para contener el conjunto de trabajo (datos frecuentemente accedidos) en memoria y buffers de rutina para contener todo el código compilado. El monitoreo periódico de buffer identifica tendencias - ratios de hit en declive constante pueden indicar volumen de datos creciente requiriendo aumentos de buffer.
Referencias de Documentación
3. Rastrear estadísticas de ECP (si aplica)
Puntos Clave
- ECP habilita acceso remoto a base de datos a través de instancias IRIS
- Monitorear estado de conexión ECP y throughput
- Rastrear transferencias de buffer y latencia de red
- Application server envía solicitudes; data server responde con bloques
- Estadísticas ECP disponibles vía Management Portal y utilidad ^PERS
Notas Detalladas
Visión General de ECP y Áreas de Monitoreo
Enterprise Cache Protocol (ECP) es el protocolo de InterSystems para acceso de datos distribuido, habilitando application servers para acceder bases de datos ubicadas en data servers remotos. En configuraciones ECP, el monitoreo completo asegura rendimiento óptimo del sistema distribuido e identifica problemas de conectividad o latencia. El monitoreo ECP se enfoca en varias áreas clave: salud de conexión, estadísticas de transferencia de datos, rendimiento de red y eficiencia de buffer.
Herramientas de Monitoreo y Métricas Clave
El Management Portal proporciona monitoreo ECP a través de System Operations > ECP Connections, mostrando todas las conexiones ECP activas con estado, utilización de ancho de banda y conteos de error. La utilidad ^PERS ofrece estadísticas ECP de línea de comandos incluyendo conteos de transferencia detallados y métricas de rendimiento. Las métricas ECP clave a monitorear incluyen estado de conexión (todas las conexiones configuradas deben mostrar "active"), bloques transferidos (volumen de bloques de datos enviados sobre ECP), latencia de red (tiempo de ida y vuelta para solicitudes ECP - debe ser consistentemente bajo), ratio de hit de buffer ECP (qué tan a menudo se encuentran bloques solicitados en caché del application server), errores de conexión (problemas de red, timeouts o fallos), y utilización de ancho de banda (asegurando que la capacidad de red sea adecuada).
Arquitectura ECP y Flujo de Datos
La arquitectura ECP tiene application servers solicitando datos de data servers. Cuando un application server necesita un bloque global, primero verifica sus buffers ECP locales. En miss, envía una solicitud ECP al data server, que recupera el bloque de sus buffers globales (o disco si es necesario) y lo transmite de vuelta. La latencia de red impacta directamente este proceso, por lo que las configuraciones ECP deben usar redes de alta velocidad, baja latencia (típicamente conexiones dedicadas de gigabit o más rápidas).
Problemas Comunes y Solución de Problemas
Los problemas comunes de ECP incluyen fallos de conexión por problemas de red o errores de configuración, alta latencia por congestión de red o distancia geográfica, buffers ECP insuficientes en application servers causando solicitudes de red excesivas, y sobrecarga de data server por demasiados application servers. La solución de problemas de ECP involucra verificar estado de conexión para verificar que todas las conexiones estén activas, revisar estadísticas de red para pérdida de paquetes o alta latencia, examinar ratios de hit de buffer ECP en application servers (ratios bajos sugieren aumentar asignación de buffer ECP), analizar carga de data server para asegurar capacidad adecuada para todos los application servers, y correlacionar métricas ECP con rendimiento de aplicación para identificar impacto. Las mejores prácticas para monitoreo ECP incluyen establecer métricas de línea base para operación normal, implementar monitoreo automatizado con alertas para fallos de conexión o degradación de rendimiento, dimensionar buffers ECP apropiadamente en application servers (basado en tamaño de conjunto de trabajo), y documentar topología y dependencias ECP para solución de problemas.
Referencias de Documentación
4. Usar System Performance Monitor
Puntos Clave
- Utilidad de monitoreo de rendimiento en tiempo real
- Acceso vía Terminal: do ^PERFMON
- Muestra comandos/seg, globales/seg, E/S de disco, hits de buffer
- Intervalo de actualización configurable (por defecto 5 segundos)
- Esencial para identificar cuellos de botella de rendimiento
Notas Detalladas
Lanzamiento y Uso de ^PERFMON
El System Performance Monitor, accedido vía la utilidad ^PERFMON, es la herramienta primaria de InterSystems IRIS para análisis de rendimiento en tiempo real y solución de problemas. A diferencia del dashboard del Management Portal que proporciona monitoreo de visión general, ^PERFMON entrega métricas detalladas, continuamente actualizadas esenciales para investigación de rendimiento en profundidad. Lance ^PERFMON desde Terminal entrando "do ^PERFMON" - la utilidad muestra una pantalla continuamente actualizada de estadísticas de rendimiento refrescando en intervalos configurables (por defecto 5 segundos).
Métricas Clave Mostradas
Las métricas clave mostradas incluyen tasas de actividad (comandos por segundo, referencias globales por segundo, llamadas de rutina por segundo), estadísticas de buffer (ratio de hit de buffer global, ratio de hit de buffer de rutina, lecturas de disco por segundo), E/S de disco (lecturas físicas, escrituras físicas, operaciones de E/S por segundo), actividad de lock (solicitudes de lock por segundo, tiempo de espera de lock), estadísticas de journal (entradas de journal por segundo, bytes de journal escritos), información de proceso (conteo de procesos activos, procesos en espera), utilización de memoria (uso de pool de buffer, asignación de memoria), y actividad de red (transferencias ECP si está configurado).
Interpretación de Salida de ^PERFMON
Comprender la salida de ^PERFMON habilita identificación rápida de problemas. Altos comandos/segundo con bajas referencias globales sugiere procesamiento intensivo de rutinas. Altas referencias globales con bajos ratios de hit de buffer indica presión de memoria requiriendo aumentos de buffer. Altas operaciones de lectura de disco con ratios de hit razonables puede sugerir escaneos secuenciales pobremente diseñados. Altos tiempos de espera de lock apunta a problemas de contención de locks. La utilidad ofrece varios modos de visualización. El modo "standard" por defecto muestra estadísticas completas en una sola pantalla. Los modos de detalle se enfocan en subsistemas específicos como E/S de disco, actividad de lock o estadísticas ECP. La utilidad también soporta redirección de salida a archivos de log para análisis histórico.
Comparación de Línea Base y Flujos de Trabajo de Solución de Problemas
Interpretar datos de ^PERFMON requiere comprender líneas base de rendimiento normales para su entorno. Las tasas de transacción, patrones de referencia global y ratios de hit de buffer varían significativamente basándose en características de carga de trabajo de aplicación. Establezca líneas base durante operaciones normales para reconocer patrones anormales durante problemas. Flujos de trabajo comunes de solución de problemas con ^PERFMON: usuario reporta rendimiento lento -> ejecutar ^PERFMON -> observar ratio de hit de buffer bajo y altas lecturas de disco -> diagnóstico: buffers globales insuficientes -> resolución: aumentar configuración globals_buffers. O: timeouts de aplicación -> ejecutar ^PERFMON -> observar altas estadísticas de espera de lock -> examinar locks de proceso para contención -> identificar procesos bloqueantes. ^PERFMON es particularmente valioso durante problemas de rendimiento en vivo cuando se necesita diagnóstico inmediato antes de que los síntomas desaparezcan.
Referencias de Documentación
5. Configurar alertas y notificaciones
Puntos Clave
- System Monitor proporciona generación automatizada de alertas
- Configurar umbrales para espacio en disco, unidades de licencia, conteos de proceso
- Notificaciones por correo electrónico para condiciones de alerta
- Seguimiento de historial de alertas para análisis de tendencias
- Integración con herramientas de monitoreo empresarial posible
Notas Detalladas
Visión General de System Monitor
El monitoreo proactivo a través de alertas automatizadas habilita a los administradores identificar y abordar problemas potenciales antes de que causen caídas o pérdida de datos. InterSystems IRIS proporciona funcionalidad de System Monitor para monitoreo y alertas automatizadas. Acceda a la configuración de System Monitor a través del Management Portal en System Operations > System Monitor. System Monitor verifica continuamente métricas configuradas contra umbrales definidos y genera alertas cuando se exceden umbrales.
Condiciones Alertables
Las condiciones alertables clave incluyen espacio libre de base de datos cayendo por debajo de porcentaje especificado, espacio de directorio de journal acercándose a capacidad, utilización de unidades de licencia excediendo umbrales, conteos de proceso excesivos indicando procesos fugitivos potenciales, fallos de servicio (apagados de servidor web, superserver), ratios de hit de buffer cayendo por debajo de niveles aceptables, alta utilización de CPU sostenida, asignación de memoria acercándose a límites, y fallos o retrasos de backup.
Configuración de Alertas
Para cada métrica, configure umbrales de alerta (nivel de advertencia y nivel crítico), métodos de notificación (correo electrónico, trap SNMP, entrada de log), destinatarios de notificación (listas de distribución de correo), y reglas de supresión de alerta (prevenir inundación de alertas por condiciones transitorias). System Monitor también implementa escalación de alertas - si una condición de advertencia persiste o empeora a crítica, puede disparar notificaciones escaladas a personal adicional. El historial de alertas se mantiene en la base de datos de System Monitor, proporcionando capacidad de análisis de tendencias. Revise el historial de alertas para identificar patrones recurrentes sugiriendo problemas subyacentes que necesitan cambios arquitectónicos. Por ejemplo, alertas regulares de espacio en disco pueden indicar necesidad de volúmenes más grandes o archivado de datos más agresivo.
Integración de Correo Electrónico y Empresarial
La configuración de notificación por correo electrónico requiere ajustes de servidor SMTP configurados en preferencias de System Monitor. Especifique dirección de servidor SMTP, puerto, credenciales de autenticación (si se requieren), y dirección de correo del remitente. Pruebe la configuración de correo electrónico para verificar que las notificaciones se entregarán exitosamente. La integración con plataformas de monitoreo empresarial (Nagios, Zabbix, SCOM, etc.) es alcanzable a través de generación de trap SNMP, reenvío de correo electrónico, o integración personalizada usando APIs de InterSystems IRIS para consultar métricas. Tal integración proporciona monitoreo centralizado a través de infraestructura heterogénea.
Mejores Prácticas
Las mejores prácticas para configuración de alertas incluyen establecer umbrales basados en patrones operacionales normales de su entorno (demasiado sensible crea fatiga de alertas; demasiado permisivo pierde problemas reales), probar entrega de alertas regularmente para asegurar que las notificaciones funcionen cuando se necesiten, documentar procedimientos de respuesta a alertas para que el personal de guardia sepa cómo manejar cada tipo de alerta, y revisar y ajustar configuraciones de alertas trimestralmente basándose en experiencia operacional. Los entornos de producción críticos deben tener monitoreo de alertas 24/7 con procedimientos de escalación documentados.
Referencias de Documentación
6. Revisar logs de auditoría
Puntos Clave
- La base de datos de auditoría registra eventos de seguridad y cambios del sistema
- Rastrear autenticación de usuario, escalación de privilegios, cambios de configuración
- Acceso vía Management Portal: System Operations > Audit Log
- Configurar qué eventos auditar
- Revisión regular requerida para cumplimiento y seguridad
Notas Detalladas
Propósito y Almacenamiento
El logging de auditoría proporciona seguimiento completo de eventos relevantes de seguridad y cambios del sistema para cumplimiento, monitoreo de seguridad e investigación forense. InterSystems IRIS mantiene una base de datos de auditoría (típicamente IRISAUDIT) registrando tipos de eventos configurados con información detallada sobre quién realizó acciones, qué se cambió, cuándo ocurrieron cambios y desde dónde se originaron las acciones.
Categorías de Eventos Rastreados
El log de auditoría rastrea numerosas categorías de eventos incluyendo autenticación de usuario (inicios de sesión exitosos y fallidos, cierres de sesión, timeouts de sesión), eventos de autorización (escalación de privilegios usando roles, denegaciones de permisos), cambios de configuración (modificaciones de parámetros del sistema, cambios de configuración de base de datos), gestión de cuentas de usuario (creación, eliminación de cuentas, cambios de contraseña, asignaciones de roles), operaciones de base de datos (creación, eliminación, montaje/desmontaje de base de datos), operaciones sensibles de seguridad (cambios de clave de licencia, modificaciones de ajustes de seguridad), acceso a datos (si está configurado - consultas, actualizaciones, eliminaciones), y operaciones del sistema (inicio, apagado de instancia, inicios/paradas de servicio).
Revisión y Configuración de Logs de Auditoría
Revise logs de auditoría a través del Management Portal en System Operations > Audit Log, que proporciona capacidades de filtrado, búsqueda y exportación. Los filtros incluyen rango de fechas, tipo de evento, usuario, namespace y resultado (éxito/fallo). Exporte datos de auditoría para archivado a largo plazo o importación en sistemas de gestión de información y eventos de seguridad (SIEM). La configuración de auditoría es accesible vía System Operations > Audit Configuration, donde habilita/deshabilita tipos de eventos específicos, configura tamaño de base de datos de auditoría y políticas de purga, y establece parámetros de rendimiento de auditoría. La auditoría completa genera volumen de datos significativo, por lo que balancee requisitos de seguridad contra impacto de rendimiento y consumo de almacenamiento.
Prácticas de Revisión y Cumplimiento
Las prácticas comunes de revisión de auditoría incluyen revisión diaria de fallos de autenticación para detectar intentos potenciales de intrusión, revisión semanal de eventos de escalación de privilegios para asegurar uso apropiado, revisión mensual de cambios de configuración para mantener control de cambios, y revisión bajo demanda durante incidentes de seguridad para investigación forense. Los marcos de cumplimiento (HIPAA, PCI-DSS, SOX, etc.) a menudo mandan capacidades específicas de logging de auditoría y períodos de retención. Asegure que la configuración de auditoría cumpla requisitos aplicables, incluyendo proteger logs de auditoría de manipulación (montaje de solo lectura o exportación a medios de escritura única), retener datos de auditoría por períodos requeridos, y demostrar procesos de revisión regular. La tarea programada PurgeAudit gestiona el tamaño de base de datos de auditoría eliminando registros antiguos basándose en políticas de retención configuradas. Configure esto cuidadosamente para balancear gestión de almacenamiento con requisitos de retención. La mejor práctica es exportar registros de auditoría a almacenamiento de archivo a largo plazo antes de purgar de la base de datos de auditoría operacional.
Referencias de Documentación
7. Interpretar indicadores clave de rendimiento
Puntos Clave
- Ratio de hit de buffer: >90% indica asignación de memoria adecuada
- Tiempo de espera de E/S de disco: Valores altos sugieren cuello de botella de almacenamiento
- Utilización de licencia: Rastrear contra capacidad para planificación
- Tasa de transacciones: Comandos/seg y globales/seg indican carga
- Tiempo de respuesta: métrica de experiencia de usuario final
Notas Detalladas
Visión General de KPIs Primarios
La gestión efectiva del sistema requiere comprender e interpretar indicadores clave de rendimiento que señalan salud y rendimiento del sistema. Los KPIs primarios para entornos de InterSystems IRIS incluyen ratios de hit de buffer, métricas de E/S de disco, utilización de CPU, consumo de licencia, tasas de transacción, tiempos de respuesta y tasas de error.
Ratios de Hit de Buffer
El ratio de hit de buffer global es quizás el indicador de rendimiento más importante - valores arriba del 90-95% indican asignación de memoria adecuada para almacenamiento en caché de base de datos, mientras valores más bajos señalan presión de memoria causando E/S de disco excesiva. Calcule como: (hits de buffer / referencias globales totales) x 100%. El ratio de hit de buffer de rutina (objetivo >95%) indica si el código compilado se almacena en caché efectivamente.
Métricas de Disco, CPU y Licencia
Las métricas de E/S de disco incluyen operaciones por segundo, tiempo de espera promedio y profundidad de cola. Altos tiempos de espera de disco (>10ms promedio) o profundidades de cola sugieren cuellos de botella de subsistema de almacenamiento requiriendo almacenamiento más rápido o reducción de carga de trabajo de E/S. La utilización de CPU debe promediar 60-70% durante carga pico, dejando espacio para picos. La utilización sostenida >80% sugiere necesidad de capacidad de CPU adicional u optimización de aplicación. La utilización de licencia rastrea unidades de licencia usadas versus disponibles. Monitoree tendencias para predecir cuándo se necesitarán licencias adicionales - la planificación de crecimiento empresarial típicamente comienza adquisición cuando la utilización excede consistentemente 70-75%.
Tasas de Transacción y Tiempos de Respuesta
Las métricas de tasa de transacción (comandos por segundo, referencias globales por segundo, llamadas de rutina por segundo) caracterizan volumen de carga de trabajo. Establezca líneas base y monitoree para desviaciones anormales. Caídas súbitas pueden indicar problemas de aplicación; picos inesperados podrían señalar procesos fugitivos o anomalías de uso. El tiempo de respuesta mide experiencia de usuario final - tiempos de carga de página de aplicación web, duración de ejecución de consulta o tiempo de finalización de transacción. A diferencia de métricas internas como ratio de hit de buffer, el tiempo de respuesta refleja directamente experiencia de usuario. Monitoree tiempo de respuesta a nivel de aplicación y correlacione con métricas de infraestructura para identificar causas cuando ocurre degradación.
Tasas de Error y Métricas de Red
Las tasas de error rastrean operaciones fallidas, fallos de autenticación, errores de aplicación y errores del sistema. Las tasas de error bajas (<0.1% de operaciones) son normales; los aumentos significativos merecen investigación. Las métricas de red para arquitecturas distribuidas incluyen utilización de ancho de banda, latencia y pérdida de paquetes. Alta latencia (>5ms para redes locales, >50ms para WAN) impacta rendimiento de aplicación distribuida.
Interpretación Efectiva de KPIs
La interpretación de KPI requiere contexto - los valores absolutos importan menos que las tendencias y desviaciones de líneas base establecidas. Implemente dashboards de seguimiento de KPI mostrando tendencias históricas junto con valores actuales. Las alertas automatizadas basadas en umbrales notifican a administradores cuando los KPIs exceden rangos aceptables. La revisión regular de KPI (semanal o mensual) identifica problemas en desarrollo requiriendo atención proactiva antes de que impacten el servicio.
Referencias de Documentación
8. Ejecutar utilidad ^SystemPerformance
Puntos Clave
- Recopila datos completos de rendimiento usando perfiles predefinidos
- Run(profile) - Inicia recopilación; Collect(runId) - Realiza recopilación de datos
- RunReport() - Genera reportes HTML desde datos recopilados
- Ejecutar interactivamente desde Terminal o programar vía Task Manager
- Captura métricas de IRIS más estadísticas del sistema operativo
- Esencial para casos de soporte WRC y planificación de capacidad
Notas Detalladas
Propósito y Comparación con ^PERFMON
La utilidad ^SystemPerformance proporciona capacidades extendidas de recopilación de datos de rendimiento y reportes más allá del monitoreo en tiempo real. Mientras ^PERFMON es ideal para solución de problemas en vivo, ^SystemPerformance sobresale en capturar instantáneas completas de rendimiento sobre períodos de tiempo para análisis de tendencias, planificación de capacidad y documentación de casos de soporte.
Ejecución de ^SystemPerformance
Lance ^SystemPerformance interactivamente desde Terminal entrando "do ^SystemPerformance" que presenta un menú de perfiles disponibles. Seleccione un perfil para comenzar recopilación de datos. Los perfiles definen qué métricas recopilar, intervalos de recopilación y duración. La utilidad luego captura métricas de rendimiento en intervalos regulares a través del período especificado, incluyendo estadísticas específicas de IRIS (referencias globales, ratios de hit de buffer, actividad de lock, E/S de journal, conteos de proceso) y métricas del sistema operativo (utilización de CPU, uso de memoria, E/S de disco, tráfico de red). La recopilación de datos se realiza por la función Collect(). Al completarse, los datos recopilados se almacenan en archivos dentro del directorio de salida configurado. Los reportes HTML se generan usando la función RunReport(), presentando los datos recopilados en formato organizado, legible con gráficos y tablas adecuados para compartir con colegas o soporte de InterSystems.
Funciones Clave y Programación
Las funciones clave de ^SystemPerformance incluyen:
- Run(profile) - Inicia recopilación de datos usando el nombre de perfil especificado
- Collect(runId) - Realiza la recopilación de datos real para un ID de ejecución dado
- RunReport() - Genera reportes HTML desde datos previamente recopilados
- GetProfiles() - Lista perfiles de recopilación disponibles
- Funciones adicionales para personalización: configuración de directorio de salida, gestión de perfiles e información de versión
Para recopilación automatizada, programe ^SystemPerformance usando Task Manager. Cree una tarea programada que llame al método Run() con el nombre de perfil deseado. Esto habilita recopilación regular de línea base de rendimiento (e.g., muestras diarias de una hora durante horas pico de negocio) sin intervención manual. El perfil define todos los parámetros de recopilación incluyendo duración, intervalo y métricas a capturar.
Casos de Uso y Mejores Prácticas
Los datos recopilados soportan múltiples casos de uso: establecer líneas base de rendimiento para operaciones normales, identificar tendencias indicando problemas en desarrollo, documentar rendimiento para decisiones de planificación de capacidad, proporcionar datos completos para casos de soporte WRC de InterSystems, y comparar métricas antes/después para validación de cambios. Los contenidos del reporte varían por plataforma pero típicamente incluyen resumen de configuración del sistema, estadísticas de CPU y memoria, métricas de E/S de disco, contadores de rendimiento de IRIS, estadísticas de pool de buffer y actividad de red. Las mejores prácticas incluyen ejecutar recopilaciones regulares de línea base, archivar reportes para comparación histórica, usar parámetros de recopilación consistentes para resultados comparables, e incluir salida de ^SystemPerformance al abrir casos de soporte WRC para problemas de rendimiento.
Referencias de Documentación
9. Determinar tamaños de globales
Puntos Clave
- La utilidad ^%GSIZE calcula consumo de almacenamiento de globales
- El Management Portal System Explorer proporciona información de tamaño de globales
- Las verificaciones de integridad ^INTEGRIT incluyen estadísticas de tamaño de globales
- Identificar globales que crecen rápidamente para planificación de capacidad
- Esencial para dimensionamiento de base de datos y optimización
- Nota: ^GLOSTAT es para estadísticas de uso de pool de buffer, NO tamaños de globales
Notas Detalladas
Propósito y Herramientas Disponibles
Comprender los tamaños de globales es esencial para planificación de capacidad de base de datos, optimización de almacenamiento e identificación de patrones de crecimiento de datos de aplicación. InterSystems IRIS proporciona múltiples métodos para determinar tamaños de globales. Es importante notar que ^GLOSTAT se usa para monitorear uso de pool de buffer y estadísticas de rendimiento, NO para determinar tamaños de globales.
Herramientas Primarias para Determinar Tamaños de Globales
Utilidad ^%GSIZE: La utilidad ^%GSIZE es la herramienta primaria basada en Terminal para calcular tamaños de globales. Para usarla: 1. Abra Terminal y cambie al namespace que contiene los globales 2. Ejecute: `do ^%GSIZE` 3. Seleccione globales a analizar (puede usar comodines, e.g., `MyApp*`) 4. La utilidad muestra información de tamaño incluyendo bloques totales y bytes para cada global
^%GSIZE proporciona cálculos de tamaño precisos recorriendo estructuras globales y contando utilización de almacenamiento real. La salida muestra:
- Nombre del global
- Bloques totales usados
- Bytes totales consumidos
- Bloques de puntero vs. bloques de datos
- Eficiencia de utilización de bloques
Management Portal - System Explorer: Navegue a System Explorer > Globals para análisis de tamaño de globales basado en GUI:
- Explore globales en cualquier namespace
- Vea lista de globales con columnas de tamaño mostrando bloques y MB
- Ordene por tamaño para identificar globales más grandes
- Haga clic en globales individuales para ver desgloses detallados de tamaño
- Exporte listas de globales con información de tamaño para reportes
El Management Portal proporciona la interfaz más amigable para análisis de tamaño de globales y es ideal para:
- Identificación rápida de globales más grandes
- Revisiones periódicas de capacidad
- Generar reportes para gestión
- Comparación visual de tamaños de globales a través de bases de datos
Verificación de Integridad ^INTEGRIT: Ejecutar ^INTEGRIT (utilidad de verificación de integridad) proporciona información de tamaño de globales como parte de su análisis completo de base de datos: 1. Ejecute: `do ^INTEGRIT` desde Terminal 2. Seleccione bases de datos a verificar 3. El reporte de integridad incluye para cada global:
- Bloques totales usados
- Bloques de datos y bloques de puntero
- Densidad de bloques globales (porcentaje de utilización)
- Estado de integridad estructural
La verificación de integridad es particularmente valiosa porque combina información de tamaño con validación estructural, ayudando a identificar globales que pueden necesitar compactación u optimización.
Métodos Programáticos Adicionales
Método $SYSTEM.OBJ.GlobalSize(): Para acceso programático, use: ``` set size = $SYSTEM.OBJ.GlobalSize("^MyGlobal") ``` Esto devuelve el tamaño en bytes para el global especificado y puede incorporarse en scripts de monitoreo o aplicaciones.
Clase %SYS.GlobalQuery: Consulte información de globales incluyendo tamaños usando SQL u ObjectScript: ``` set query = ##class(%SYS.GlobalQuery).%New() do query.NamespaceSet("USER") do query.DatabaseSet("C:\InterSystems\IRIS\mgr\user\") ```
Métricas Clave y Análisis
Métricas importantes del análisis de tamaño de globales:
- Bloques totales usados: Multiplique por tamaño de bloque (típicamente 8KB) para bytes totales
- Bloques de datos vs. bloques de puntero: El ratio indica eficiencia de estructura global
- Ratio alto de bloques de puntero puede indicar estructura global ineficiente
- Globales pesados en datos usan principalmente bloques de datos
- Densidad/utilización de bloques: Porcentaje de espacio de bloque asignado realmente usado
- Densidad baja sugiere fragmentación o patrones de eliminación
- Candidatos para compactación global
- Tasa de crecimiento a lo largo del tiempo: Compare mediciones periódicas para proyectar necesidades de capacidad
Usos Administrativos
La información de tamaño de globales soporta tareas administrativas críticas:
Planificación de Capacidad:
- Proyecte cuándo las bases de datos necesitan expansión basándose en tasas de crecimiento
- Identifique globales creciendo más rápido de lo esperado
- Planifique actualizaciones de almacenamiento antes de quedarse sin espacio
- Establezca alertas en umbrales de tamaño específicos
Optimización de Rendimiento:
- Identifique globales de tamaño excesivo que pueden beneficiarse de reestructuración
- Detecte fragmentación a través de análisis de densidad de bloques
- Planifique operaciones de compactación global
- Evalúe si dividir globales grandes en estructuras particionadas
Planificación de Backup:
- Comprenda volúmenes de datos para estimación de ventana de backup
- Identifique globales que pueden necesitar horarios de backup separados
- Calcule tamaños de backup incremental basándose en crecimiento diario
- Planifique capacidad de almacenamiento de backup
Solución de Problemas de Aplicación:
- Detecte crecimiento inesperado de datos indicando problemas de aplicación
- Identifique acumulación fugitiva de datos (logs, datos temp)
- Verifique que procesos de archivo de datos funcionen correctamente
- Investigue problemas de memoria relacionados con almacenamiento en caché grande en memoria
Gestión Proactiva de Capacidad
Establezca un proceso regular de monitoreo de tamaño de globales:
1. Medición de Línea Base: Documente tamaños actuales de globales a través de todos los namespaces de producción 2. Monitoreo Periódico: Ejecute ^%GSIZE semanalmente o mensualmente para globales clave 3. Análisis de Tendencias: Rastree tasas de crecimiento para identificar crecimiento acelerado 4. Alertas de Umbral: Establezca alertas cuando globales alcancen umbrales de tamaño específicos 5. Planificación de Archivo: Identifique globales requiriendo archivo o purga de datos
Patrones de Crecimiento Comunes a Monitorear:
- Globales de auditoría/log: Pueden crecer rápidamente y necesitar purga regular
- Globales de transacción: Deben crecer predeciblemente con volumen de negocio
- Globales de configuración: Deben permanecer estables; crecimiento súbito indica problemas
- Globales temporales: No deben acumularse; crecimiento indica problemas de limpieza
Información de Tamaño a Nivel de Base de Datos: La página Databases del Management Portal (System Operations > Databases) muestra:
- Tamaño total de base de datos y espacio libre
- Parámetros de crecimiento (tamaño de expansión, tamaño máximo)
- Porcentaje de utilización actual
- Estado de montaje y estado de journaling
Comprender la relación entre tamaños de globales y tamaños de bases de datos habilita asignación óptima de recursos. Mientras las bases de datos pueden auto-expandirse, el monitoreo proactivo de patrones de crecimiento de globales habilita mejor planificación de infraestructura y previene agotamiento inesperado de espacio.
Distinción Importante: ^GLOSTAT vs. Herramientas de Tamaño de Globales
^GLOSTAT se confunde frecuentemente con herramientas de dimensionamiento de globales pero sirve un propósito diferente:
- Propósito de ^GLOSTAT: Monitorea rendimiento de pool de buffer y actividad de referencia global
- Métricas de ^GLOSTAT: Ratios de hit de buffer global, conteos de referencia, lecturas/escrituras de bloques
- Caso de uso de ^GLOSTAT: Ajuste de rendimiento y análisis de eficiencia de caché
- Para tamaños de globales: Use ^%GSIZE, Management Portal o ^INTEGRIT en su lugar
Resumen de Preparación para el Examen
Conceptos Críticos a Dominar:
- Navegación del Dashboard: Comprender cómo acceder e interpretar el System Dashboard
- Rendimiento de Buffer: Conocer ratios de hit de buffer objetivo (>90% global, >95% rutina) y cómo aumentar buffers
- ^PERFMON: Memorizar cómo lanzar e interpretar métricas clave de ^PERFMON
- Métricas ECP: Comprender monitoreo de conexión ECP para arquitecturas distribuidas
- Alertas: Saber cómo configurar alertas para métricas críticas como espacio en disco
- Logging de Auditoría: Comprender qué eventos se auditan y cómo revisar logs de auditoría
- Interpretación de KPI: Reconocer valores normales vs. anormales para indicadores clave de rendimiento
Escenarios Comunes de Examen:
- Identificar ratio de hit de buffer bajo y recomendar aumento de buffer
- Usar ^PERFMON para diagnosticar tipos de cuello de botella de rendimiento
- Configurar alertas para monitoreo proactivo
- Interpretar indicadores codificados por color del System Dashboard
- Revisar logs de auditoría para investigación de seguridad
- Monitorear conexiones ECP en entornos distribuidos
- Correlacionar KPIs para diagnosticar problemas de rendimiento
Recomendaciones de Práctica Práctica:
- Explorar todas las secciones del System Dashboard
- Ejecutar ^PERFMON durante varias condiciones de carga de trabajo
- Configurar y probar notificaciones de alerta
- Practicar interpretación de ratios de hit de buffer desde ^PERFMON
- Revisar entradas de log de auditoría para diferentes tipos de eventos
- Monitorear sistema durante operaciones de compactación o backup de base de datos
- Rastrear tendencias de KPI a lo largo del tiempo para establecer líneas base
- Probar monitoreo ECP si hay entorno distribuido disponible
- Configurar System Monitor para monitoreo automatizado