Um vasto novo conjunto de dados pode impulsionar a caça da IA por lavagem de dinheiro em criptomoedas.

Como teste de sua ferramenta de IA resultante, os pesquisadores verificaram suas saídas com uma bolsa de criptomoedas – que o artigo não menciona – identificando 52 cadeias suspeitas de transações que haviam fluído para essa bolsa. A bolsa, verificou-se, já havia sinalizado 14 das contas que haviam recebido esses fundos por atividade ilícita suspeita, incluindo oito marcadas como associadas à lavagem de dinheiro ou fraude, com base em parte nas informações de conheça seu cliente solicitadas aos donos das contas. Apesar de não ter acesso a esses dados de conheça seu cliente ou qualquer informação sobre a origem dos fundos, o modelo de IA dos pesquisadores havia coincidido com as conclusões dos próprios investigadores da bolsa.

Identificar corretamente 14 de 52 dessas contas de clientes suspeitas pode não parecer uma taxa de sucesso alta, mas os pesquisadores apontam que apenas 0,1 por cento das contas da bolsa são marcadas como potencial lavagem de dinheiro no geral. Sua ferramenta automatizada, argumentam, efetivamente reduziu a busca por contas suspeitas para mais de uma em quatro. “Passar de ‘um em mil coisas que olhamos vão ser ilícitos’ para 14 de 52 é uma mudança louca”, diz Mark Weber, um dos coautores do artigo e pesquisador do MIT Media Lab. “E agora os investigadores vão realmente analisar o restante para ver, esperem, será que perdemos algo?”

A Elliptic diz que já está usando o modelo de IA privadamente em seu próprio trabalho. Como mais evidência de que o modelo de IA está produzindo resultados úteis, os pesquisadores escrevem que analisar a origem dos fundos de algumas cadeias de transações suspeitas identificadas pelo modelo os ajudou a descobrir endereços do Bitcoin controlados por um mercado dark-web russo, um “misturador” de criptomoedas projetado para obscurecer o rastro dos bitcoins na blockchain e um esquema Ponzi sediado no Panamá. (A Elliptic se recusou a identificar qualquer um desses supostos criminosos ou serviços por nome, dizendo à WIRED que não identifica os alvos de investigações em curso.)

Talvez mais importante do que o uso prático do próprio modelo de IA dos pesquisadores, no entanto, seja o potencial dos dados de treinamento da Elliptic, que os pesquisadores publicaram no site da comunidade de aprendizado de máquinas e ciência de dados pertencente ao Google, Kaggle. “A Elliptic poderia ter mantido isso para si”, diz Weber, do MIT. “Em vez disso, houve muito um ethos de código aberto aqui de contribuir algo para a comunidade que permitirá a todos, até seus concorrentes, serem melhores em combater a lavagem de dinheiro.” A Elliptic observa que os dados que foram disponibilizados são anonimizados e não contêm quaisquer identificadores dos donos dos endereços do Bitcoin ou até mesmo os próprios endereços, apenas os dados estruturais dos “subgráficos” de transações marcados com suas classificações de suspeita de lavagem de dinheiro.

Essa enorme reserva de dados certamente inspirará e possibilitará muito mais pesquisas focadas em IA sobre lavagem de dinheiro em Bitcoin, diz Stefan Savage, professor de ciência da computação na Universidade da Califórnia em San Diego, que atuou como conselheiro do autor principal de um artigo seminal de rastreamento de Bitcoin publicado em 2013. No entanto, ele argumenta que a ferramenta atual não parece provável de revolucionar os esforços de combate à lavagem de dinheiro em criptomoedas em sua forma atual, mas sim servir como uma prova de conceito. “Um analista, penso eu, terá dificuldade com uma ferramenta que está certa algumas vezes”, diz Savage. “Vejo isso como um avanço que diz, ‘Ei, há algo aqui. Mais pessoas deveriam trabalhar nisso’.”