Companhias precisam mudar o foco de suas operações, priorizando a melhoria contínua de seus processos
O Gartner Inc., líder mundial em pesquisa e aconselhamento para empresas, anuncia que, independentemente do tipo de ambiente em que as organizações trabalham, os líderes de Infraestrutura & Operações (I&O) precisam estar atentos para possíveis perdas ou instabilidade de serviços de TI durante alguns momentos de seus dias de trabalho. Afinal de contas, apesar de frustrantes, as interrupções e problemas são inevitáveis. A questão é entender que, em um mundo digital 24/7, qualquer tempo de inatividade se torna mais crítico do que nunca.
Por isso, o Gartner recomenda que as empresas invistam em uma cultura de resiliência de TI, onde a base de dados pode ser definida por padrões de desempenho e restauração de sua estrutura ou, ainda, pela sua capacidade de adaptação rápida. As pessoas e a cultura de uma organização são alguns dos componentes mais vitais para o fornecimento de uma infraestrutura digital resiliente.
“Os líderes de I&O que estão planejando ou implementando uma infraestrutura digital resiliente devem entender que as pessoas da empresa são tão importantes quanto a infraestrutura e os processos”, afirma Mark Jaggers, Analista Sênior do Gartner.
Para definir a melhor estratégia de formação de uma cultura de resiliência, Jaggers indica atenção em quatro áreas nas quais os líderes de TI precisam observar em suas organizações:
Concentre-se na melhoria contínua
Atualmente, os times de TI estão acostumados a adotarem as mentalidades de “bombeiros” ou de “heróis”, com a principal missão de agir rapidamente quando surge algum problema – ao invés de planejar constantemente o conceito geral necessário para reduzir as interrupções. O herói nem sempre é aquele que resolve o problema. Em vez disso, os verdadeiros heróis são aqueles que impedem que uma crise aconteça em primeiro lugar.
Embora haja valor em salvar um edifício em chamas, a verdade é que há ainda mais importância em pensar como proteger toda a cidade. Uma maneira de fazer essa proteção é realizar uma análise para prever falhas e aprender a responder esses incidentes antes mesmo que aconteça algum problema. Dessa forma, os líderes terão condições para reduzir as ocorrências de interrupções imprevistas e, ao mesmo tempo, para encontrarem novas maneiras de preparar e adaptar os sistemas internos para futuro. Focar em reduzir o tempo de detecção (TTD), o tempo de reparo (TTR) e inserir ferramentas automatizadas que ajudem a evitar as interrupções também são ações importantes e que devem constar na rotina dos líderes de TI.
Coloque os princípios de engenharia de confiabilidade (SRE) para funcionar
Uma equipe de SRE inclui pessoas com habilidades em desenvolvimento de software, redes e engenharia de sistemas. Essa equipe gastará cerca de 50% ou mais de seu tempo criando correções automatizadas, incluindo a detecção de incidentes. É tudo sobre aprender e melhorar com esses incidentes e, em seguida, transferir esse conhecimento para outras pessoas para impulsionar um ecossistema de TI mais resiliente e forte. “A equipe de engenharia de conformidade é desafiada exclusivamente para não apenas encontrar problemas no código-fonte das aplicações ou erros nos elementos operacionais de um sistema de TI, mas também para trabalhar, treinar e influenciar outras equipes com práticas adequadas”, diz Jaggers.
Crie uma cultura de responsabilidade compartilhada
Um dos grandes desafios dos líderes de TI é conviver com o fato de que, em qualquer interrupção, existirá o jogo da culpa, que é contraproducente e não resolve o problema ocorrido. Por isso, embora os seres humanos sejam geralmente os primeiros culpados por interrupções do sistema, as organizações devem entender que as falhas muitas vezes acontecem devido a condições sistêmicas específicas, que podem ter sido originadas por uma grande combinação de processos, infraestrutura e fatores humanos.
Nesse sentido, o Gartner indica que a melhor estratégia para lidar com essas situações é adotar uma abordagem positiva, onde uma interrupção serve como uma oportunidade de aprendizado capaz de resolver uma lacuna entre o modo como as coisas são e o modo como elas devem ser. Ao fazer isso, as organizações podem configurar suas operações para saber mais sobre o que deu errado no passado e o que mudar para que isso não aconteça novamente no futuro. Além disso, a realização de uma revisão pós-incidente específica pode ajudá-lo a compreender os vários fatores que contribuem para o incidente.
Implantar equipes distribuídas geograficamente
Manter a atividade e a disponibilidade das redes 24 horas por dia, sete dias por semana é uma das principais expectativas para o ambiente de negócios na Era Digital. O problema é que as infraestruturas de TI não estão, necessariamente, acompanhando essa demanda. Não por acaso, o Gartner prevê que, nos próximos cinco anos, haverá uma grande interrupção na Internet que afetará mais de 100 milhões de usuários por mais de 24 horas. Para ajudar a preparar e mitigar a possibilidade de uma interrupção importante, a presença da equipe de operações e infraestrutura de TI é essencial. Dessa forma, os líderes de I&O precisam ponderar a necessidade de terem funcionários representando sua empresa em diferentes fusos horários, com equipes locais espalhadas por todas as diferentes regiões da operação.
Criar uma cultura que priorize a resiliência sobre a correção, enfatizando a melhoria contínua do processo é o caminho para maximizar a continuidade da entrega e minimizar o tempo de inatividade das companhias no ambiente digital. Ao focar e priorizar opções para aumentar o tempo de atividade e diminuir o tempo para detectar e automatizar as respostas de solução, sua organização estará no caminho para prevenir possíveis problemas e fazer bons negócios.
Pesquisas adicionais sobre o tema serão apresentadas durante a Conferência Gartner Infraestrutura de TI, Operações & Estratégia de Cloud, que acontece nos dias 24 e 25 de abril, em São Paulo. No evento, analistas brasileiros e internacionais vão apresentar conexões vitais entre tecnologias, gestão e cultura com um foco especial na liderança de cada função de Infraestrutura e Operações (I&O).
Interessados em participar do evento devem contatar o Gartner pelo e-mail brasil.inscricoes@gartner.com, pelos telefones (11) 5632-3109 e 0800 774 1440, ou pelo site www.gartner.com/pt-br/conferences/la/infrastructure-operations-cloud-brazil.