Conversas sobre segurança de dados costumam se dividir em três tópicos principais:
Como podemos proteger os dados armazenados em nossa infraestrutura local ou na nuvem?
Quais estratégias, ferramentas ou plataformas podem fazer backup e restaurar dados de forma confiável?
Quanto nos custaria perder todos esses dados e quanto tempo levaríamos para recuperá-los?
Todos são conversas válidas e necessárias para organizações de tecnologia de todos os tipos e tamanhos. Ainda assim, a empresa média utiliza mais de 400 aplicativos SaaS. O mesmo relatório também descobriu que 56% dos profissionais de TI não estão cientes de suas responsabilidades de backup de dados. Isso é alarmante, considerando que 84% dos entrevistados disseram que pelo menos 30% dos dados críticos de negócios estão dentro de aplicativos SaaS.
Os dados SaaS não são como os dados locais ou em nuvem porque você não tem propriedade sobre o ambiente operacional e muito menos sobre os dados em si. Devido a essas restrições, criar backups automatizados, armazená-los em ambientes seguros e possuir o processo de restauração é uma tarefa de engenharia muito mais complicada.
Essa inflexibilidade leva as organizações a desenvolver soluções alternativas e processos manuais para fazer backup de dados SaaS, deixando-os em ambientes muito menos seguros – uma pena, porque seus backups são quase tão valiosos para os atacantes quanto seus dados de produção. Organizações que tratam os dados SaaS com menos cuidado, mesmo diante do crescimento de dois dígitos no uso de aplicativos SaaS, estão entregando as chaves de seu reino de maneiras mais óbvias do que poderiam esperar. Com a ameaça de perda de dados iminente, qual é o custo para o seu negócio se você não agir rapidamente para construir um plano de recuperação de dados SaaS?
Os segredos valiosos escondidos à vista
Vamos ilustrar um cenário comum: sua equipe tem uma única organização do GitHub onde toda a equipe de engenharia colabora em projetos de desenvolvimento e implantação em vários repositórios privados.
Agora, vamos ajustar essa ilustração com uma adição menos comum: você tem backups de todos os seus dados do GitHub, que incluem não apenas o código em cada um desses repositórios, mas também metadados como revisões de pull request, problemas, gerenciamento de projeto e muito mais.
Neste caso, seus dados de backup do GitHub não conterão senhas ou informações pessoalmente identificáveis sobre seus funcionários, além do que eles já tornaram público em seus perfis do GitHub. Também não permitiria que um invasor se movimentasse lateralmente para seus servidores ou serviços de produção porque ainda não encontraram seu vetor de ataque ou ponto de intrusão. Mesmo assim, você ainda não está fora de perigo – backups de todos os tipos contêm informações que os invasores podem aprender, criando uma inferência de como seu ambiente de produção opera.
Cada backup inseguro e clone de seu código privado é incrivelmente valioso se o invasor tiver como objetivo apenas roubar propriedade intelectual ou vazar informações confidenciais sobre recursos futuros, parcerias ou atividades de fusões e aquisições para concorrentes ou para fraudes financeiras.
Seus arquivos de infraestrutura como código (IaC) e configuração de CI/CD também seriam de interesse especial, pois eles identificam a topologia de sua infraestrutura, expõem sua infraestrutura de teste e estágios de implantação e revelam todos os provedores de nuvem ou serviços de terceiros nos quais seus serviços de produção dependem. Esses arquivos de configuração dependem de segredos como senhas ou tokens de autenticação. Mesmo que você esteja usando uma ferramenta de gerenciamento de segredos para ofuscar o conteúdo real desses segredos de ser versionado no GitHub, um invasor será capaz de identificar rapidamente onde procurar a seguir, seja Hashicorp Vault, AWS Secrets Manager, Cloud KMS ou uma das muitas alternativas.
Porque você também está fazendo backup de seus metadados nesta ilustração, uma implementação insegura deixa seus pull requests e comentários de problemas, que você ocultou dentro de seus repositórios privados do GitHub, disponíveis para um invasor explorar. Eles rapidamente aprenderão quem tem privilégios para aprovar e mesclar código em cada repositório e explorarão listas de verificação para implantação ou remediação para identificar vulnerabilidades.
Com essas informações, eles podem criar um ataque muito mais direcionado, seja diretamente contra sua infraestrutura ou usando métodos de engenharia social, como pretexto, em funcionários que agora entendem ter privilégios de nível administrativo.
Por que backups seguros – especialmente de dados SaaS – são mais críticos do que nunca?
Em resumo, os dados SaaS nunca foram tão críticos para as operações de hora em hora de sua organização. Se você estiver usando uma plataforma de colaboração de código como o GitHub, ferramentas de produtividade como o Jira ou mesmo aproveitar o Confluence como o provedor principal (e dependência) de uma marca inteira, você está sujeito a ambientes que não possui, com práticas de gerenciamento de dados que não pode controlar totalmente, apenas para manter as luzes acesas.
Os dados do SaaS são unicamente vulneráveis porque, ao contrário dos dados locais, existem dois interessados: seu provedor e você. Seu provedor pode experimentar perda de dados, como quando o GitLab perdeu 300GB de dados de usuário em questão de segundos, quando um engenheiro sobrescreveu seu banco de dados de produção. Você pode cometer um erro honesto, como excluir acidentalmente sua instância ou fazer upload de um CSV que corrompe instantaneamente todos os aspectos de seus dados.
A conscientização é uma grande preocupação. Em um relatório de 2023 da AppOmni, 85% dos especialistas em TI e segurança cibernética que eles pesquisaram afirmaram que não há problema de segurança em torno do SaaS. No entanto, 79% dessas mesmas pessoas admitiram que sua organização identificou pelo menos uma ameaça de segurança cibernética baseada em SaaS nos últimos 12 meses. Os incidentes mais comuns foram vulnerabilidades em permissões de usuário, exposição de dados, um ataque cibernético específico e erro humano.
Ao mesmo tempo, um relatório da Oracle e da empresa de análise ESG descobriu que apenas 7% dos diretores de segurança da informação (CISOs) disseram que entendem completamente o Modelo de Responsabilidade Compartilhada, que coloca a responsabilidade da segurança dos dados no usuário e não no provedor de SaaS. 49% dos entrevistados também afirmaram que a confusão em torno desse modelo resultou em perda de dados, acesso não autorizado a dados e até sistemas comprometidos.
A resposta para quaisquer temores sobre a segurança dos dados de backup não é ignorar os backups completamente.
O que procurar em um provedor de backup de dados SaaS seguro
Conforme você explora o cenário de plataformas que permitem fazer backup e restaurar dados desses aplicativos SaaS essenciais, você deve validar cuidadosamente esses elementos imprescindíveis:
Automação: Nenhum backup à prova de falhas envolve processos manuais – o processo de backup deve criar automaticamente backups diários incrementais usando um algoritmo delta ou de diferenciação. Cada processo manual, como usar um script de backup de código aberto que não foi atualizado há anos ou até mesmo uma tarefa simples como escrever um cron job para executar um script de backup toda terça-feira às 23h59, cria potenciais pontos de falha.
Abrangência: O exemplo do GitHub é especialmente bom para ilustrar a diferença entre dados (seu código) e metadados (as conversas que seus engenheiros têm sobre o seu código), mas muitos aplicativos SaaS têm hierarquias de dados semelhantes. Se uma solução de backup não pode proteger todos os seus dados, então, em caso de um desastre de perda de dados, você terá apenas um plano de recuperação pela metade e muito trabalho manual para se recuperar.
Criptografia: Insista na criptografia AES-256 bits, em repouso e em trânsito, para todos os seus backups de dados SaaS. O provedor também deve oferecer suporte a SSO para que você possa gerenciar usuários e seus privilégios usando um provedor de identidade centralizado.
Conformidade de dados: Detalhes como relatórios SOC 2 Tipo 2, que detalham os controles de segurança de uma plataforma de backup, podem lhe dar garantias sobre o quão seriamente eles levam a proteção dos dados sensíveis em seus backups. Embora você não precise atualmente, recursos como residência de dados demonstram que eles projetaram uma infraestrutura sofisticada com as políticas corretas para várias regiões.
Observabilidade: Você não pode controlar totalmente o que acontece com os dados de sua organização. A melhor alternativa é saber exatamente quem, quando e o quê foi acessado ou alterado em seus dados de backup no momento em que acontece. Um log de auditoria em tempo real ajudará você a detectar intrusões rapidamente e tomar as medidas corretas antes que um ataque tenha tempo de violar seus dados.
As ameaças únicas aos dados SaaS estão se expandindo rapidamente. Até as ferramentas que pensamos estar projetadas para descobrir ineficiências ou automatizar o trabalho que preferiríamos não fazer, como agentes de IA de terceiros, podem ser incidentes maciços de perda de dados disfarçados – aqueles que certamente ouviremos nos meses e anos vindouros.
Quando você dá a um AI acesso de escrita a suas plataformas SaaS, ele pode corromper inocentemente todos os seus dados críticos em uma velocidade acelerada por GPU. Quando relatos dessas situações começarem a aparecer em massa, você ficará feliz por ter guardado seus dados SaaS onde ninguém – um invasor ou uma IA perdida – possa lê-los. Você ficará ainda mais feliz por saber que também estão seguros e protegidos quando mais precisar deles.