Memo

Operativita' e assistenza

Segui le novità su Telegram
16.03.2020

Eravamo pronti, continuiamo a lavorare con ritmi rallentati; relazione sul 12 marzo 2020

Produrre una scarpa a mano in laboratorio o in fabbrica richiede tempi diversi.

In questo momento gli interventi di manutenzione vengono tutti svolti con tempistiche piu' lente, ma costanti.

I server invece si monitorano continuamente prendendo le decisioni (comuni) necessarie ogni pochi minuti, mi avvisano di eventuali malfunzionamenti comuni entro 7-15 minuti.

L'assistenza telefonica in questo periodo non e' possibile se non per vere emergenze, le altre saranno fatturate.

Ricordo i canali:

- Su Twitter - utente iusondemand: segnalazioni di problemi o interventi ai server seguendo l'hashtag #iusondemand

- Via email: info@iusondemand.com ogni comunicazione

- Via Telegram, t.me/iusondemand potete inviare messaggi urgenti.

Grazie

---

Relazione intervento iniziato ill 12.03.2020 15:57:06

Riceviamo a pochi minuti dal problema un alert dal server253 che ospita i siti: e' irraggiungibile.

Proviamo l'accesso in remoto, verifichiamo una lentezza irrisolvibile e chiamiamo la webfarm che fornisce supporto con tempi lenti (siamo ai tempi del coronavirus)

Confidando un po' di esperienza ripetiamo ugualmente i comandi all'infrastruttura del fornitore, e alla fine la macchina si riavvia, ma si riferma subito.

Temendo il peggio abbiamo preparato quanto necessario per mangiare e dormire in ufficio per riattivare tutto,. nel caso peggiore, su un nuovo server.

Dopo ore di intervento (a lentezze esasperanti) siamo riusciti a entrare nel server, a trovare il problema, isolarlo e risolverlo.

Si trattava di un aggiornamento di Microsoft che lavorava per 36 secondi invece che qualche decimo di secondo PER OGNI scrittura del sistema operativo.

Poiche' monitoriamo gli alert mondiali abbiamo potuto visto che il difetto era uno secondario non comunicato, ma collegato ad uno degli update sbagliati.

On line abbiamo trovato altri nella stessa situazione.

Risolto il problema l'invervento si e' concluso verso le 19.00 e siamo tornati online.

Tutti i dati non hanno mai corso rischi, la macchina era solo lenta.

Abbiamo risolto in poche ore e siamo tornati online.

Come sempre abbiamo avvisato tutti via twitter e alcuni via email prima e dopo l'intervento.

Attualmente abbiamo due server windows e due linux. Ovvio che passeremo a tre linux a breve, compatibilmente con il momento.

Tutto questo imporra' un grosso lavoro che ritardera' gli interventi non convenzionati.


Segui le novità su Telegram oppure segui il Podcast

Approfondimenti:

Condividi su Facebook







menu