Antel analiza causas del colapso del jueves
Un desperfecto en una máquina de una central de Antel provocó la caída del servicio en 17.000 líneas fijas, centenares de celulares, enlaces empresariales y conexiones ADSL. Roberto Mourelle, gerente de la División Explotación, Operación y Mantenimiento de Redes, afirmó que aún no se conoce las causas del problema. Agregó que "puede haber redes más seguras". Sin embargo, "este equipo está funcionando desde hace diez años y es la primera vez que sucede algo de esta magnitud", explicó.
(Emitido a las 7.40)
EMILIANO COTELO:
Ayer durante buena parte de la tarde nos dimos cuenta de cuán dependientes nos hemos hecho de la tecnología, sobre todo de las tecnologías de las comunicaciones. Sobre las 14 horas una central importante de Antel cayó y el país ingresó en una suerte de caos en materia de telecomunicaciones: celulares que no funcionaron durante horas, barrios que se quedaron sin teléfono, servicios de emergencia móvil a los cuales no se podía acceder e incluso Zonamérica se vio afectada, generándose problemas serios con los call centers allí instalados. En resumen: un gran dolor de cabeza para Antel y, en especial, para sus clientes.
¿Qué fue lo que pasó? Es la pregunta que hasta ahora sigue convocándonos. Y, fundamentalmente, ¿está solucionado el problema? Vamos a averiguarlo.
El diálogo es con el ingeniero Roberto Mourelle, gerente de División de Explotación, Operación y Mantenimiento de Redes de Antel.
***
Ingeniero Mourelle, la primera pregunta es a propósito de la dimensión que tuvo esta crisis de ayer. Por ejemplo, el diario El País habla de 17.000 servicios telefónicos afectados, 300 servicios de conexión a Internet vía ADSL, 150 enlaces empresariales y un número indeterminado de teléfonos celulares. ¿Fue esa la dimensión?
ROBERTO MOURELLE:
Fue muy importante porque el equipo que está instalado en la Unión, que no es una central telefónica, es un equipo que maneja flujos de entrada y salida, sufrió una avería alrededor de las 14 horas. Cronológicamente se presenta una falla de sincronismo que se detecta en el Centro de Control, se concurre a la central Unión a ver qué sucede y se verifica que hay una alarma de sincronismo en la tarjeta que distribuye el sincronismo de esa máquina.
EC - ¿Qué es una "tarjeta"?
RM - Es una tarjeta electrónica, un circuito. Estos equipos de alta generación vienen con cada vez menos cantidad de tarjetas y las tarjetas son de mayor complejidad.
EC - Una tarjeta dio alarma.
RM - Una tarjeta dio alarma y cuando se la intenta sustituir por el repuesto, que se había llevado porque se sabía cuál era la tarjeta que estaba con alarma, se produce la caída de todas las funciones de la máquina, que se refieren a interconectar flujos de entrada y enrutarlos hacia las salidas, como está previsto en el programa de almacenado.
EC - O sea que falló la tarjeta original y cuando se la sustituyó por el repuesto, el mismo provoca todo la caída en catarata de los servicios.
RM - No podemos decir exactamente que haya sido el repuesto, en todo caso fue a partir de la maniobra en sí todavía se está estudiando de cambio por el repuesto que caen lo que en el lenguaje técnico llamamos "cross-conexiones". Eso no debería suceder normalmente si la tarjeta está alarmada porque ese es el procedimiento para cambiarla, o sea que internamente el circuito no se comportó como debería comportarse en el ínterin entre que usted saca la tarjeta principal y pone el repuesto.
La caída de todos esos flujos que pasan por ese cross-conector, que se denomina de unión, hizo que algunos abonados de algunas centrales de telefonía fija, como el caso de Ituzaingó, de Manga, de Punta de Rieles, de Pinar, de Solymar Este quedaran sin servicio. Eso en lo que tiene que ver con la telefonía fija. En lo que tiene que ver con las radiobases celulares también fueron afectadas, porque pasan por allí los flujos de comunicaciones con los controladores de las centrales.
EC Ciento treinta radiobases fueron afectadas.
RM Ciento treinta radiobases en todo el país fueron afectadas; en el orden de 35 GSM en Montevideo y 80 de TDMA.
EC - ¿Eso qué porcentaje representa de las radiobases de Ancel?
RM - Es un porcentaje bajo de las radiobases de GSM de Montevideo; en TDMA fue total. En el interior determinadas zonas también se vieron afectadas por la caída de radiobases porque perdieron la comunicación con su central celular en Montevideo.
EC - También se vieron afectados servicios de ADSL.
RM - Se vieron afectados flujos de datos entre los cuales se encuentran el servicio dataexpress, para usuarios empresariales generalmente, y el frame relay. Eso afectó Zonamérica, que tiene además algunos servicios de banda ancha generalmente empresariales.
EC - A esta altura de los acontecimientos, 7.46, ¿todos los servicios se han restablecido?
RM - Empezaron a levantarse radiobases sobre las 22 horas de ayer, se fueron recuperando prácticamente todas. En este momento podemos hablar de dos cosas, del equipo que falló, que en este momento está estable desde el punto de vista del sincronismo, que fue lo que empezó a dar problemas, y de la red, porque todavía algunas radiobases pocas no han vuelto a entrar en servicio.
EC - Y en particular en esos servicios críticos de call centers o llamadas de emergencia a servicios médicos, ¿el servicio ya se ha restablecido?
RM - Sí; incluso allí hubo un servicio parcial, porque lo que falló en la Unidad Coronaria Móvil (UCM) fue el número abreviado, la UCM no quedó sin servicio telefónico, falló la parte de la inteligencia de la red que asocia con el número de tres o de cuatro cifras, por eso fue que hizo avisos en la televisión informándoles a sus clientes que se dirigieran a la numeración normal de siete cifras.
EC - Falló una tarjeta y cuando se colocó el repuesto el resultado fue peor. ¿No había un plan de contingencia para una situación como esa? ¿No se podía salir más rápido de lo que se terminó saliendo?
RM - No. El equipo internamente está duplicado, la duplicación falló el Murphy funcionó correctamente, internamente no debería haber pasado nada grave y pasó. La duplicación de un equipo como este... Usted me podrá decir: si el coche se me rompe tengo otro, mando a arreglar uno y me quedo con el segundo. Pero no es lo normal.
EC - Se lo pregunto porque la ingeniera María Simón, presidenta del Directorio de Antel, dijo ayer en declaraciones a Radio Sarandí que esto se debía, entre otras razones, a falta de inversiones en los años anteriores.
RM - Por eso le digo lo de los coches. La red puede tener otro tipo de estructura, pero como todos los entes públicos estamos sujetos a restricciones presupuestales y se trata de hacer una red lo más confiable posible dentro de determinados parámetros. Siempre se puede mejorar.
EC - ¿Pero estuvieron previstas inversiones que habrían permitido sortear más rápido una crisis como la de ayer y que no pudieron llevarse adelante?
RM - No tengo conocimiento de ese tema porque yo soy el gerente de la parte de mantenimiento y no manejo las compras nuevas ni los diseños de las redes. Recibo las redes después de compradas y las tengo que mantener.
EC - Usted se dedica a mantenimiento específicamente.
RM - Específicamente al mantenimiento de todas las redes de Antel.
EC - Sí puede contestar a propósito de la responsabilidad del proveedor, de la empresa que les suministró a ustedes esas tarjetas, la que primero dio alarma y el repuesto que no funcionó. ¿Qué pasa con ese proveedor? ¿Quién es?
RM - Tenemos un régimen mixto, tenemos el mantenimiento de todos esos equipos, que son de Marconi, de los mejores en el mundo, y tenemos un contrato de lo que se denomina soporte, que tiene dos escalamientos, un soporte local para toda variación de software que haya en esos equipos que se venden a todo el mundo, entonces cuando en alguna parte descubren que en una determinada circunstancia ocurre tal cosa, se hace una corrección de software que se distribuye a todos los que están afiliados a ese seguro. Eso se llama soporte, es el soporte local que soluciona el problema de software localmente. Cuando el soporte local se ve desbordado por el problema apela al soporte de segundo nivel, que es en el exterior. Ayer de tarde concurrió la gente de la compañía proveedora, estuvo trabajando con nuestra gente y como no se pudo levantar el equipo se recurrió al escalamiento correspondiente al soporte en Inglaterra.
EC - ¿Pero ese proveedor se hace responsable? Porque incluso cabe la posibilidad de que Antel tenga que enfrentar juicios de algunos de los clientes afectados.
RM - Las responsabilidades no se pueden eludir, hay un contrato que especifica que tenemos derecho a esa asistencia, y tuvimos la asistencia de Inglaterra y de Australia hasta la noche, dando determinado tipo de indicaciones de cambios a hacer, que no dieron resultado en principio, hasta que se logró resolver el problema y recuperar el sincronismo. Otros van a determinar las responsabilidades en las que se pueda haber incurrido, yo le estoy diciendo cómo se trabajó desde el punto de vista técnico.
EC - ¿Queda algún detalle más por agregar?
RM - Seguimos y vamos a seguir trabajando en ver por qué sucedió esto.
EC - En definitiva la causa no se conoce todavía.
RM - La causa no se conoce, lo primero que hay que hacer es restablecer los servicios, primero está el cliente, y después veremos técnicamente y haremos un estudio con los expertos del exterior, porque quedó todo grabado, todos los pasos que se dieron, se va a estudiar todo el historial para ver si se puede deducir si se pudo haber evitado y qué fue lo que causó el problema.
EC - ¿El diseño de la red es el adecuado? Carlos, que nos llama desde El Pinar, dice que el problema no es por qué se rompió el equipo de Antel sino que exista una red en la que un equipo que se rompe cause este problema.
RM - Es correcta la apreciación.
EC - ¿Puede haber un defecto en el diseño de la red?
RM - Podría haberlo, pero hay que analizar qué tipo de equipos se están utilizando, porque la red se configura según el equipo. Yo no estoy en la parte de proyectos y diseño de redes, no voy a emitir un juicio sobre si la red es la correcta o no, puede haber redes más seguras, no lo puedo negar, pero este equipo está funcionando desde hace diez años y es la primera vez que sucede algo de esta magnitud.
-----------
Edición: Mauricio Erramuspe