T42.4: Diagnoses and Troubleshoots InterSystems IRIS - InterSystems IRIS System Administration Specialist Study Guide

1. Interpretar entradas de cconsole.log

Puntos Clave

cconsole.log registra el inicio, apagado de la instancia y eventos críticos del sistema
Ubicado en el directorio mgr de la instalación
Muestra la secuencia de inicialización del sistema y condiciones de error
Crítico para diagnosticar fallos de inicio y problemas de configuración
Revisar después de cualquier reinicio o fallo del sistema

Notas Detalladas

Propósito y Ubicación

El archivo cconsole.log es uno de los recursos de diagnóstico más importantes para los administradores de sistema de InterSystems IRIS. Ubicado en el directorio mgr (e.g., C:\InterSystems\IRIS\mgr\cconsole.log), este archivo registra la secuencia completa de eventos durante el inicio, apagado de la instancia y ciertas condiciones críticas de tiempo de ejecución.

Qué se Captura

Durante el inicio, cconsole.log captura la inicialización de todos los componentes del sistema incluyendo validación de licencia, montaje de bases de datos, inicio de servicios, carga de parámetros de configuración y condiciones de error a nivel de sistema. El log usa un formato de marca de tiempo que muestra la fecha y hora exacta de cada evento, haciéndolo invaluable para correlacionar el comportamiento del sistema con líneas de tiempo operacionales. Las entradas comunes incluyen carga y validación de clave de licencia, operaciones de montaje de base de datos y fallos, análisis de parámetros de configuración y errores, inicialización de servicios (servidor web, superserver, etc.), configuración de asignación de memoria y recursos del sistema, y errores críticos del sistema que previenen el inicio.

Solución de Problemas con cconsole.log

Al solucionar problemas de inicio, cconsole.log es típicamente el primer recurso a examinar. Por ejemplo, si la instancia falla al iniciar, cconsole.log mostrará exactamente qué paso de inicialización falló y a menudo proporcionará códigos de error o mensajes explicando por qué. El log captura tanto mensajes informativos (progresión normal del inicio) como mensajes de error (fallos que requieren atención). Los escenarios clave donde cconsole.log proporciona información de diagnóstico crítica incluyen expiración o corrupción de licencia (el sistema no iniciará), fallos de montaje de base de datos (archivos de base de datos corruptos o faltantes), errores de archivo de configuración (sintaxis de iris.cpf o problemas de valor de parámetro), recursos de sistema insuficientes (fallos de asignación de memoria), conflictos de puerto (servicios incapaces de enlazarse a puertos configurados), y fallos de actualización (problemas de compatibilidad o migración).

Mejores Prácticas

Las mejores prácticas para usar cconsole.log incluyen revisarlo inmediatamente después de cualquier intento de inicio fallido, comparar logs de inicio exitoso versus fallido para identificar diferencias, archivar logs antes de cambios importantes del sistema para referencia de rollback, e incorporar la revisión de logs en procedimientos operacionales estándar. El archivo de log persiste a través de reinicios y crece continuamente, por lo que el archivado periódico puede ser necesario para gestionar el tamaño.

Referencias de Documentación

2. Reconocer y solucionar problemas comunes de inicio

Puntos Clave

Problemas de licencia: claves de licencia expiradas, inválidas o faltantes
Problemas de base de datos: bases de datos corruptas, desmontadas o inaccesibles
Conflictos de puerto: servicios incapaces de enlazarse a puertos configurados
Restricciones de recursos: memoria o espacio en disco insuficiente
Errores de configuración: parámetros inválidos en iris.cpf

Notas Detalladas

Fallos Relacionados con Licencia

Los fallos de inicio de InterSystems IRIS generalmente caen en varias categorías comunes, cada una con síntomas característicos y enfoques de resolución. Los fallos relacionados con licencia están entre los más comunes - si la clave de licencia está expirada, corrupta o faltante, la instancia fallará al iniciar con mensajes de error de licencia específicos en cconsole.log. La resolución involucra instalar una clave de licencia válida usando la utilidad ^SYSKEY o la interfaz de gestión de licencias del Management Portal.

Fallos de Montaje de Base de Datos

Los fallos de montaje de base de datos ocurren cuando el sistema no puede acceder o montar una o más bases de datos configuradas. Esto puede resultar de archivos de base de datos corruptos, permisos de archivo incorrectos, archivos de base de datos faltantes o problemas del sistema de archivos. El cconsole.log identificará qué bases de datos específicas fallaron al montar. La resolución típicamente involucra verificar la existencia de archivos y permisos, ejecutar verificaciones de integridad en bases de datos sospechosas, o restaurar desde backup si se detecta corrupción.

Conflictos de Puerto y Restricciones de Recursos

Los errores de conflicto de puerto previenen que los servicios de red inicien cuando otras aplicaciones ya están usando puertos configurados. El puerto del servidor web (típicamente 52773), puerto superserver (típicamente 1972), u otros puertos de servicio pueden conflictuar. La resolución requiere detener la aplicación conflictiva o reconfigurar IRIS para usar puertos diferentes. Los fallos de restricción de recursos ocurren cuando recursos de sistema insuficientes previenen la inicialización - los escenarios comunes incluyen memoria inadecuada (RAM) para tamaños de buffer configurados, espacio en disco agotado previniendo expansión de journal o base de datos, o limitaciones del sistema operativo en memoria compartida o manejadores de archivo. El cconsole.log mostrará fallos de asignación de memoria o errores de límite de recursos. La resolución involucra liberar recursos, reducir el uso de recursos configurado, o aumentar límites del sistema.

Errores de Archivo de Configuración

Los errores de archivo de configuración resultan de sintaxis inválida o valores de parámetro en iris.cpf - esto puede incluir referenciar directorios no existentes, especificar valores de parámetro inválidos, o ajustes conflictivos. La revisión cuidadosa de mensajes de error de cconsole.log identifica el parámetro problemático específico. La resolución involucra editar iris.cpf directamente (cuando la instancia está detenida) para corregir los errores.

Metodología Sistemática de Solución de Problemas

La metodología sistemática de solución de problemas incluye examinar cconsole.log para mensajes de error específicos, verificar messages.log para contexto adicional, verificar recursos del sistema y prerrequisitos, validar sintaxis y valores del archivo de configuración, y probar correcciones en entornos aislados antes de aplicar a producción.

Referencias de Documentación

3. Usar Terminal para examinar el estado del sistema

Puntos Clave

Acceso directo vía Terminal cuando el Management Portal no está disponible
Utilidades clave: ^SYSLOG, ^JOURNAL, ^DATABASE, ^PERFMON
Examinar estado del sistema, configuración e información de tiempo de ejecución
Revisar globales de error ^ERRORS y ^rOBJ
Ejecutar comandos de diagnóstico para solución de problemas

Notas Detalladas

Cuándo Usar Acceso por Terminal

Terminal proporciona acceso directo a las interioridades de InterSystems IRIS cuando las herramientas basadas en web no están disponibles o cuando se requiere examen detallado del sistema. El acceso por Terminal es particularmente valioso durante escenarios de solución de problemas donde el Management Portal es inaccesible debido a problemas del servidor web, problemas de autenticación o fallos de conectividad de red.

Utilidades de Diagnóstico Clave

Varias utilidades clave proporcionan capacidades de diagnóstico desde Terminal. La utilidad ^SYSLOG permite revisar el archivo messages.log directamente desde Terminal, mostrando mensajes recientes del sistema, errores y entradas informativas sin necesidad de acceso al sistema de archivos. La utilidad ^JOURNAL proporciona información detallada del journal incluyendo estado actual del journal, historial, estadísticas y capacidades de gestión. La utilidad ^DATABASE habilita examen y gestión de base de datos incluyendo ver espacio libre, ejecutar verificaciones de integridad y gestionar configuraciones de base de datos. La utilidad ^PERFMON ofrece monitoreo de rendimiento en tiempo real mostrando tasas de actividad, utilización de recursos y métricas de salud del sistema.

Examen de Globales del Sistema

Más allá de las utilidades, Terminal permite el examen directo de globales del sistema. El global ^ERRORS contiene mensajes de error y puede consultarse para revisar condiciones de error recientes. El global ^rOBJ contiene información de tiempo de ejecución sobre rutinas y clases compiladas. El examen directo de globales usando comandos ObjectScript habilita inspección de datos de aplicación, globales de configuración del sistema e información de estado interno.

Comandos de Diagnóstico Comunes

Los comandos de diagnóstico comunes incluyen "write $system.Version.GetBuildOS()" para mostrar información de versión y plataforma, "do ^%SYSLOG" para ver logs del sistema, "do $system.Status.DisplayError(status)" para decodificar códigos de estado de error, "write $system.SYS.NameSpace()" para confirmar el namespace actual, y "do $system.OBJ.ShowFlags()" para mostrar flags de compilación. Terminal también habilita ejecutar fragmentos de código ObjectScript para diagnósticos personalizados, examinar variables específicas de proceso y realizar consultas del sistema no disponibles a través de otras interfaces. Para solución de problemas de producción, Terminal proporciona acceso de emergencia a funciones críticas del sistema cuando otras interfaces fallan. Los administradores de sistema deben mantener familiaridad con comandos y utilidades esenciales de Terminal para respuesta efectiva a incidentes.

Referencias de Documentación

4. Analizar contención de locks

Puntos Clave

Ver locks vía página Process Details: campo Lock muestra locks retenidos
Identificar procesos bloqueantes y procesos en espera
Modos de lock: Shared (S) y Exclusive (X)
Usar Lock Manager para ver estado de locks a nivel de sistema
Resolver vía terminación de proceso o rediseño de aplicación

Notas Detalladas

Comprensión de la Contención de Locks

La contención de locks ocurre cuando múltiples procesos compiten por acceso a las mismas referencias globales, con uno o más procesos esperando por locks retenidos por otros. InterSystems IRIS usa locks para coordinar acceso concurrente y prevenir corrupción de datos, pero la contención excesiva de locks degrada el rendimiento y puede causar ralentizaciones de aplicación o cuelgues.

Identificación de Contención de Locks

El análisis de contención de locks comienza identificando procesos afectados a través de la página Processes del Management Portal (System Operations > Processes). La página Process Details muestra información de lock para cada proceso - el campo Lock muestra qué referencias el proceso actualmente retiene locks, incluyendo el modo de lock (Shared o Exclusive) y nombre de referencia. Los locks Shared permiten múltiples lectores; los locks Exclusive previenen cualquier otro acceso. Al diagnosticar problemas de rendimiento o procesos colgados, examine el campo Lock para identificar relaciones de bloqueo. Un proceso esperando por un lock mostrará el lock deseado en su información, mientras que el proceso bloqueante mostrará esa misma referencia como un lock retenido. La utilidad ^LOCKTAB proporciona análisis de locks a nivel de sistema, mostrando todos los locks activos y qué procesos los retienen.

Síntomas y Causas

La contención de locks se manifiesta de varias maneras: ralentizaciones de aplicación cuando procesos esperan liberación de lock, cuelgues completos de aplicación cuando ocurren dependencias circulares de lock (deadlocks), o errores de timeout cuando los tiempos de espera de lock exceden límites configurados. Las causas comunes de contención de locks incluyen lógica de aplicación pobremente diseñada que retiene locks demasiado tiempo, altos volúmenes de transacciones compitiendo por nodos globales populares, granularidad de lock inadecuada (bloqueo demasiado amplio), o bugs causando que los locks no se liberen.

Resolución y Mejores Prácticas

Resolver la contención de locks puede involucrar remediación inmediata (terminar procesos bloqueantes para liberar locks) o soluciones a largo plazo (rediseñar lógica de aplicación para reducir duración de lock, implementar estrategias de bloqueo más granulares, u optimizar patrones de transacción). Las mejores prácticas para gestión de locks incluyen mantener la duración de lock lo más corta posible, implementar orden consistente de locks para prevenir deadlocks, usar granularidad de lock apropiada (bloquear solo lo necesario), e incluir manejo de timeout de lock en código de aplicación. El monitoreo regular de estadísticas de lock ayuda a identificar problemas de contención en desarrollo antes de que impacten a los usuarios.

Referencias de Documentación

5. Revisar problemas de integridad de base de datos

Puntos Clave

Ejecutar verificación de integridad para detectar corrupción estructural
Revisar salida de verificación de integridad para indicadores de error
Problemas comunes: corrupción de punteros, errores de bloques, inconsistencias de índice
Puede resultar de fallos de hardware, apagados inesperados o bugs de software
La resolución a menudo requiere restauración de base de datos desde backup

Notas Detalladas

Ejecución de Verificaciones de Integridad

Los problemas de integridad de base de datos representan corrupción estructural dentro de archivos de base de datos que puede llevar a pérdida de datos, errores de aplicación o inestabilidad del sistema. La verificación de integridad es la herramienta de diagnóstico primaria para detectar tales problemas. Ejecute verificaciones de integridad vía Management Portal (System Operations > Databases, luego botón Integrity Check) o a través del Task Manager como tarea programada. La verificación de integridad realiza examen completo de estructuras de base de datos incluyendo enlace de nodos globales, validez de punteros, consistencia de estructura de bloques, corrección de índices y estructuras de gestión de espacio libre.

Interpretación de Resultados

El reporte de salida indica la salud general de la base de datos e identifica problemas específicos si se encuentran. La salida limpia muestra todas las estructuras verificadas exitosamente; la salida problemática muestra mensajes de error identificando globales o bloques específicos con corrupción. Los tipos comunes de error de integridad incluyen errores de puntero (referencias a bloques inválidos o incorrectos), corrupción de encabezado de bloque (metadatos de bloque dañados), inconsistencias de índice (entradas de índice que no coinciden con datos), y errores de mapa de espacio libre (rastreo incorrecto de espacio libre).

Causas Raíz

Los problemas de integridad típicamente resultan de varias causas raíz: fallos de hardware incluyendo errores de controlador de disco, sectores malos o corrupción de memoria escribiendo bloques incorrectamente; apagados inesperados del sistema por fallos de energía o caídas del sistema operativo interrumpiendo escrituras de base de datos; bugs de software (raros) en IRIS mismo o herramientas de terceros accediendo archivos de base de datos directamente; y corrupción del sistema de archivos por problemas de almacenamiento subyacentes.

Respuesta y Prevención

Cuando se detectan errores de integridad, la respuesta depende de la severidad. Errores menores pueden estar aislados a globales específicos que pueden reconstruirse desde datos fuente. La corrupción mayor afectando estructuras críticas típicamente requiere restaurar la base de datos desde backup y reproducir journals para restaurar transacciones recientes. La opción de configuración "freeze on error" previene operación continua cuando ocurren errores serios de base de datos o journal, protegiendo contra propagación de corrupción. Las estrategias de prevención incluyen usar hardware confiable con memoria ECC y almacenamiento de grado empresarial, implementar estrategias completas de backup con procedimientos de restauración probados, habilitar journaling para todas las bases de datos críticas para soportar recuperación, monitorear salud de disco y sistema de archivos proactivamente, y realizar verificaciones de integridad programadas regularmente para detectar problemas temprano antes de que empeoren.

Referencias de Documentación

6. Identificar y resolver problemas de journal

Puntos Clave

El agotamiento de espacio de journal causa congelamiento del sistema si "freeze on error" está habilitado
Monitorear espacio de directorio de journal continuamente
Los fallos de escritura de journal previenen commits de transacciones
El directorio de journal alternativo proporciona capacidad de failover
La recuperación requiere integridad de journal para replay

Notas Detalladas

Agotamiento de Espacio de Journal

Los problemas relacionados con journal pueden causar impacto severo al sistema que va desde degradación de rendimiento hasta congelamiento completo del sistema. El problema de journal más crítico es el agotamiento de espacio de journal - cuando el directorio de journal se queda sin espacio en disco, IRIS no puede crear nuevos archivos de journal o continuar escribiendo a archivos actuales. Con "freeze on error" habilitado (recomendado para producción), el sistema detiene todas las operaciones en lugar de arriesgar pérdida de datos, requiriendo intervención manual para liberar espacio y reanudar operaciones. El monitoreo preventivo del espacio del directorio de journal es esencial - las alertas automatizadas deben dispararse cuando el espacio libre cae por debajo del 20%.

Problemas de Rendimiento y Corrupción

Los problemas de rendimiento de escritura de journal se manifiestan como ralentizaciones de transacciones ya que las transacciones no pueden hacer commit hasta que las escrituras de journal se completen. El diagnóstico involucra monitorear latencia de escritura de journal a través de ^PERFMON o herramientas de monitoreo del sistema. La resolución puede incluir mover el directorio de journal a almacenamiento más rápido, aumentar el tamaño del buffer de journal, o investigar problemas de rendimiento de almacenamiento subyacentes. La corrupción de journal, aunque rara, previene replay de journal para recuperación. Esto puede resultar de fallos de hardware escribiendo archivos de journal, corrupción del sistema de archivos o bugs de software. La integridad del journal puede verificarse usando la utilidad ^JOURNAL antes de intentar operaciones de recuperación. En el evento de corrupción de journal afectando el marco de tiempo de recuperación requerido, la recuperación solo puede ser posible hasta el último archivo de journal conocido como bueno, resultando en pérdida de transacciones.

Directorio Alternativo y Fallos de Cambio

La configuración del directorio de journal alternativo proporciona protección contra fallos de escritura de journal - si el directorio primario no está disponible (disco lleno, fallo de hardware, problemas de permisos), IRIS automáticamente cambia a escribir al directorio alternativo, previniendo congelamiento del sistema. Sin embargo, esto requiere que el directorio alternativo esté en almacenamiento físico separado. Los fallos de cambio de journal previenen rotación normal de archivos de journal, potencialmente llevando a archivos de journal de tamaño excesivo o agotamiento de espacio. Esto puede resultar de permisos del sistema de archivos, disponibilidad de directorio o errores de configuración. El diagnóstico involucra revisar cconsole.log y messages.log para mensajes de error de cambio de journal. La resolución aborda la causa subyacente - correcciones de permisos, creación de directorio o corrección de configuración.

Mejores Prácticas

Las mejores prácticas para salud del sistema de journal incluyen monitorear espacio del directorio de journal con alertas automatizadas, configurar directorio de journal alternativo en almacenamiento separado, realizar backups y purga regular de archivos de journal, validar integridad de journal periódicamente y mantener documentación de configuración y procedimientos de journal.

Referencias de Documentación

7. Abordar cuellos de botella de rendimiento

Puntos Clave

Identificar tipo de cuello de botella: CPU, memoria, E/S de disco o contención de locks
Usar ^PERFMON para monitoreo en tiempo real y estadísticas
Examinar detalles de proceso para identificar procesos que consumen recursos
Revisar eficiencia de buffer global y de rutina
Analizar planes de ejecución de consultas para problemas de rendimiento SQL

Notas Detalladas

Tipos de Cuellos de Botella de Rendimiento

La solución de problemas de rendimiento requiere identificación sistemática de cuellos de botella de recursos y sus causas raíz. Los problemas de rendimiento generalmente caen en categorías: saturación de CPU (procesos esperando tiempo de CPU), presión de memoria (buffers insuficientes causando E/S de disco excesiva), cuellos de botella de E/S de disco (almacenamiento lento limitando throughput), latencia de red (para aplicaciones distribuidas o cliente-servidor), y contención de locks (procesos esperando por locks).

Uso de ^PERFMON para Diagnóstico

La utilidad ^PERFMON proporciona monitoreo de rendimiento en tiempo real mostrando métricas a través de todas las categorías incluyendo comandos por segundo, referencias globales por segundo, lecturas y escrituras de disco, ratios de hit de buffer, esperas de lock y actividad de proceso. Comience el diagnóstico ejecutando ^PERFMON para identificar qué recursos muestran patrones preocupantes.

Diagnóstico de Cuellos de Botella Específicos

Los cuellos de botella de CPU muestran altos porcentajes de utilización de CPU con procesos en estados running o runnable. La resolución puede involucrar optimizar código de aplicación para reducir trabajo computacional, agregar capacidad de CPU, o redistribuir carga de trabajo. Los cuellos de botella de memoria se manifiestan como bajos ratios de hit de buffer (buffer global o buffer de rutina) con altas lecturas físicas de disco. El sistema está leyendo repetidamente desde disco en lugar de encontrar datos en buffers de memoria. La resolución involucra aumentar tamaños de buffer global o de rutina en configuración (requiere reinicio) u optimizar patrones de acceso de aplicación para mejorar localidad de referencia. Los cuellos de botella de E/S de disco muestran altas profundidades de cola de disco, tiempos de respuesta lentos y procesos esperando en estados de espera de E/S de disco. La resolución puede incluir moverse a almacenamiento más rápido (SSD en lugar de HDD), distribuir bases de datos a través de múltiples spindles, u optimizar patrones de E/S de aplicación. La contención de locks muestra procesos en estados de espera de lock con estadísticas de lock mostrando altos tiempos de espera de lock. La resolución requiere cambios de diseño de aplicación para reducir duración o granularidad de lock.

Análisis SQL y a Nivel de Proceso

Para problemas de rendimiento SQL, examine planes de ejecución de consultas usando EXPLAIN o estadísticas de consulta SQL para identificar consultas ineficientes, índices faltantes u optimización pobre. La página Process Details ayuda a identificar procesos específicos que consumen recursos - ordenar por tiempo de CPU, uso de memoria o referencias globales para encontrar procesos problemáticos. Una vez identificados, examine qué rutina está ejecutando el proceso y su patrón de actividad.

Enfoque Iterativo de Solución de Problemas

La solución de problemas de rendimiento es iterativa: identificar cuello de botella, formar hipótesis sobre la causa, probar hipótesis a través de monitoreo o cambios controlados, implementar resolución y verificar mejora. La documentación de líneas base de rendimiento ayuda a reconocer cuándo el rendimiento se degrada desde niveles normales.

Referencias de Documentación

8. Ejecutar herramientas de diagnóstico (IRISHung/Diagnostic Report)

Puntos Clave

El script IRISHung recopila datos de diagnóstico cuando el sistema no responde
La tarea Diagnostic Report genera análisis completo del sistema
irisstat proporciona estadísticas detalladas de tiempo de ejecución e instantáneas
Configurar Diagnostic Report vía Management Portal
Usar para casos de soporte WRC (Worldwide Response Center)

Notas Detalladas

Script IRISHung

InterSystems IRIS proporciona varias herramientas de diagnóstico para recopilar información del sistema durante solución de problemas, particularmente cuando el sistema está colgado o no responde. El script IRISHung (irishung.sh en UNIX/Linux, IRISHung.bat en Windows) está específicamente diseñado para recopilar información de diagnóstico cuando el sistema parece estar colgado o no responde. Este script recopila instantáneas de irisstat, información de proceso, estadísticas del sistema operativo y otros datos de diagnóstico críticos sin requerir que el Management Portal o interfaces normales del sistema sean funcionales. Los datos recopilados son esenciales para el InterSystems Worldwide Response Center (WRC) al diagnosticar problemas complejos del sistema.

Tarea Diagnostic Report

La tarea Diagnostic Report proporciona generación automatizada de información de diagnóstico completa del sistema. Acceda a esto a través del Management Portal en System Operations > Diagnostic Reports. Las opciones de configuración incluyen especificar el directorio de archivo para reportes, configurar notificación por correo electrónico para disponibilidad de reporte y seleccionar qué categorías de información incluir. El reporte incluye información básica (estado del sistema, detalles de licencia, logs de error) e información avanzada (múltiples instantáneas de irisstat, diagnósticos de red, detalles de configuración).

La Utilidad irisstat

La utilidad irisstat es una herramienta de diagnóstico de bajo nivel que proporciona estadísticas detalladas sobre la instancia IRIS en ejecución. Ejecute irisstat desde la línea de comandos del sistema operativo usando procedimientos específicos de plataforma: en Windows, navegue al directorio bin y ejecute "irisstat"; en UNIX/Linux, use "iris stat " o ejecute irisstat directamente desde el directorio bin. Las opciones comunes de irisstat controlan el formato y nivel de detalle de salida. La salida puede dirigirse a archivos de texto para análisis posterior o incluirse automáticamente en Diagnostic Reports.

Mejores Prácticas para Herramientas de Diagnóstico

Para situaciones urgentes de soporte, el WRC típicamente solicita salida de irisstat junto con archivos de log y Diagnostic Reports. Tener estas herramientas de diagnóstico fácilmente disponibles y comprender cómo ejecutarlas asegura respuesta rápida a problemas del sistema. Las mejores prácticas incluyen ejecutar Diagnostic Reports periódicos para documentación de línea base, probar el procedimiento de ejecución del script IRISHung antes de emergencias y documentar procedimientos locales para recopilar información de diagnóstico.

Referencias de Documentación

9. Gestionar restricciones de acceso y acceso de emergencia

Puntos Clave

La autenticación basada en SO habilita acceso de emergencia cuando está bloqueado
El acceso por Terminal proporciona acceso directo al sistema evitando interfaces web
La utilidad ^SECURITY gestiona usuarios y contraseñas desde línea de comandos
Los servicios pueden habilitarse/deshabilitarse para controlar puntos de acceso
Documentar procedimientos de acceso de emergencia antes de que se necesiten

Notas Detalladas

Escenarios de Acceso de Emergencia

Gestionar restricciones de acceso y procedimientos de acceso de emergencia es crítico para mantener la disponibilidad del sistema mientras se preserva la seguridad. Los escenarios de acceso de emergencia típicamente ocurren cuando los administradores están bloqueados debido a problemas de contraseña, fallos del sistema de autenticación o configuraciones incorrectas de seguridad.

Autenticación Basada en SO

La autenticación basada en SO proporciona uno de los mecanismos primarios de acceso de emergencia. Cuando está habilitada para el servicio Terminal, los usuarios que están autenticados a nivel del sistema operativo pueden acceder a IRIS sin indicaciones de contraseña adicionales. Esto permite a administradores de sistema con acceso local al SO alcanzar Terminal incluso cuando otros mecanismos de autenticación fallan. Para habilitar esto, navegue a System Administration > Security > Services y modifique los ajustes de %Service_Terminal para permitir autenticación de SO.

La Utilidad ^SECURITY

La utilidad ^SECURITY proporciona acceso de línea de comandos a funciones de gestión de seguridad, habilitando a administradores crear o modificar cuentas de usuario, restablecer contraseñas y ajustar roles directamente desde Terminal. Esto es particularmente valioso cuando el Management Portal es inaccesible. Ejecute "do ^SECURITY" desde un prompt de Terminal para acceder a la interfaz basada en menú para gestión de usuarios, asignación de roles, configuración de servicios y otras funciones de seguridad.

Gestión de Servicios y Procedimientos de Emergencia

La gestión de servicios permite controlar qué puntos de acceso están disponibles. Los servicios pueden habilitarse o deshabilitarse a través del Management Portal (System Administration > Security > Services) o usando la utilidad ^SECURITY. Deshabilitar temporalmente servicios no esenciales puede aislar el acceso durante incidentes de seguridad, mientras se asegura que los servicios críticos permanezcan disponibles para acceso administrativo legítimo. Para situaciones de emergencia, prepare procedimientos documentados incluyendo: credenciales de SO para acceso local al sistema, procedimientos para acceder a Terminal con autenticación de SO, comandos de utilidad ^SECURITY para restablecimiento de contraseña, pasos para rehabilitar servicios deshabilitados y contactos de escalación para soporte WRC de InterSystems. Las restricciones en el acceso deben aplicarse cuidadosamente - configuraciones excesivamente restrictivas pueden prevenir recuperación de emergencia. La mejor práctica es mantener siempre al menos una ruta para acceso administrativo autorizado (típicamente Terminal con autenticación de SO) mientras se aseguran otros puntos de acceso apropiadamente.

Referencias de Documentación

Resumen de Preparación para el Examen

Conceptos Críticos a Dominar:

Archivos de Log: Comprender cconsole.log (inicio/apagado), messages.log (tiempo de ejecución) y sus ubicaciones
Secuencia de Inicio: Conocer puntos comunes de fallo de inicio (licencia, montaje de base de datos, enlace de puerto)
Análisis de Locks: Comprender cómo identificar contención de locks usando Process Details
Verificaciones de Integridad: Reconocer cuándo y cómo ejecutar verificaciones de integridad
Problemas de Journal: Comprender impacto del agotamiento de espacio de journal y "freeze on error"
Herramientas de Rendimiento: Saber cómo usar ^PERFMON, Process Details y utilidades de Terminal
Interpretación de Errores: Capacidad de leer e interpretar mensajes de error de logs

Escenarios Comunes de Examen:

Diagnosticar por qué una instancia no inicia usando cconsole.log
Identificar y resolver contención de locks entre procesos
Responder al agotamiento de espacio de journal
Interpretar fallos de verificación de integridad de base de datos
Usar utilidades de Terminal cuando el Management Portal no está disponible
Identificar cuellos de botella de rendimiento desde síntomas

Recomendaciones de Práctica Práctica:

Revisar cconsole.log y messages.log durante inicios normales y fallidos
Practicar uso de ^PERFMON para monitorear rendimiento del sistema
Usar utilidades de Terminal (^JOURNAL, ^DATABASE, ^SYSLOG) para diagnósticos
Examinar Process Details para analizar retención de locks
Ejecutar verificaciones de integridad e interpretar salida
Simular y resolver problemas de espacio de journal en entorno de prueba
Practicar solución de problemas de fallos de inicio
Usar EXPLAIN para analizar rendimiento de consultas SQL

1. Interpretar entradas de cconsole.log Report Issue

Puntos Clave

Notas Detalladas

Propósito y Ubicación

Qué se Captura

Solución de Problemas con cconsole.log

Mejores Prácticas

Referencias de Documentación

2. Reconocer y solucionar problemas comunes de inicio Report Issue

Puntos Clave

Notas Detalladas

Fallos Relacionados con Licencia

Fallos de Montaje de Base de Datos

Conflictos de Puerto y Restricciones de Recursos

Errores de Archivo de Configuración

Metodología Sistemática de Solución de Problemas

Referencias de Documentación

3. Usar Terminal para examinar el estado del sistema Report Issue

Puntos Clave

Notas Detalladas

Cuándo Usar Acceso por Terminal

Utilidades de Diagnóstico Clave

Examen de Globales del Sistema

Comandos de Diagnóstico Comunes

Referencias de Documentación

4. Analizar contención de locks Report Issue

Puntos Clave

Notas Detalladas

Comprensión de la Contención de Locks

Identificación de Contención de Locks

Síntomas y Causas

Resolución y Mejores Prácticas

Referencias de Documentación

5. Revisar problemas de integridad de base de datos Report Issue

Puntos Clave

Notas Detalladas

Ejecución de Verificaciones de Integridad

Interpretación de Resultados

Causas Raíz

Respuesta y Prevención

Referencias de Documentación

6. Identificar y resolver problemas de journal Report Issue

Puntos Clave

Notas Detalladas

Agotamiento de Espacio de Journal

Problemas de Rendimiento y Corrupción

Directorio Alternativo y Fallos de Cambio

Mejores Prácticas

Referencias de Documentación

7. Abordar cuellos de botella de rendimiento Report Issue

Puntos Clave

Notas Detalladas

Tipos de Cuellos de Botella de Rendimiento

Uso de ^PERFMON para Diagnóstico

Diagnóstico de Cuellos de Botella Específicos

Análisis SQL y a Nivel de Proceso

Enfoque Iterativo de Solución de Problemas

Referencias de Documentación

8. Ejecutar herramientas de diagnóstico (IRISHung/Diagnostic Report) Report Issue

Puntos Clave

Notas Detalladas

Script IRISHung

Tarea Diagnostic Report

La Utilidad irisstat

Mejores Prácticas para Herramientas de Diagnóstico

Referencias de Documentación

9. Gestionar restricciones de acceso y acceso de emergencia Report Issue

Puntos Clave

Notas Detalladas

Escenarios de Acceso de Emergencia

Autenticación Basada en SO

La Utilidad ^SECURITY

Gestión de Servicios y Procedimientos de Emergencia

Referencias de Documentación

Resumen de Preparación para el Examen

Conceptos Críticos a Dominar:

Escenarios Comunes de Examen:

Recomendaciones de Práctica Práctica:

Report an Issue

1. Interpretar entradas de cconsole.log

2. Reconocer y solucionar problemas comunes de inicio

3. Usar Terminal para examinar el estado del sistema

4. Analizar contención de locks

5. Revisar problemas de integridad de base de datos

6. Identificar y resolver problemas de journal

7. Abordar cuellos de botella de rendimiento

8. Ejecutar herramientas de diagnóstico (IRISHung/Diagnostic Report)

9. Gestionar restricciones de acceso y acceso de emergencia