Pesquisadores da Microsoft e da Universidade de Washington (UW) demonstraram o primeiro sistema totalmente automatizado para armazenar e recuperar dados em DNA manufaturado – um passo fundamental na transferência da tecnologia do laboratório de pesquisa para os datacenters comerciais.
Em um teste simples de prova de conceito, a equipe codificou com sucesso a palavra “olá” em fragmentos de DNA fabricado e converteu-a de volta para dados digitais usando um sistema totalmente automatizado de ponta a ponta, descrito em um novo documento publicado. 21 de março na Nature Scientific Reports.
O DNA pode armazenar informações digitais em um espaço com ordens de magnitude menores do que os datacenters usam atualmente. É uma solução promissora para armazenar a quantidade explosiva de dados que o mundo gera todos os dias, de registros de negócios e vídeos de animais fofos a exames médicos e imagens do espaço sideral.
A Microsoft está explorando maneiras de fechar uma lacuna iminente entre a quantidade de dados que estamos produzindo que precisa ser preservada e nossa capacidade de armazená-la. Isso inclui o desenvolvimento de algoritmos e tecnologias de computação molecular para codificar e recuperar dados em DNA fabricado, o que poderia caber todas as informações atualmente armazenadas em um datacenter do tamanho de um depósito em um espaço aproximadamente do tamanho de alguns dados de jogos de tabuleiro.
“Nosso objetivo final é colocar um sistema em produção que, para o usuário final, se parece muito com qualquer outro serviço de armazenamento na nuvem – bits são enviados para um datacenter e armazenados lá e então eles só aparecem quando o cliente os quer”, disse a principal pesquisadora da Microsoft, Karin Strauss . “Para fazer isso, precisamos provar que isso é prático de uma perspectiva de automação.”
As informações são armazenadas em moléculas de DNA sintético criadas em laboratório, não em DNA de seres humanos ou outros seres vivos, e podem ser criptografadas antes de serem enviadas ao sistema. Enquanto máquinas sofisticadas, como sintetizadores e sequenciadores, já executam partes fundamentais do processo, muitas das etapas intermediárias até agora exigiam trabalho manual no laboratório de pesquisa. Mas isso não seria viável em um cenário comercial, disse Chris Takahashi, cientista sênior de pesquisa da Escola de Ciência da Computação e Engenharia de Computadores da UW, Paul G. Allen.
“Você não pode ter um monte de pessoas correndo em torno de um datacenter com pipetas – é muito propenso a erros humanos, é muito caro e a pegada seria muito grande”, disse Takahashi.
Para que a técnica faça sentido como uma solução de armazenamento comercial, os custos precisam diminuir tanto para sintetizar DNA – basicamente sequências personalizadas de construção com sequências significativas – quanto para o processo de sequenciamento que extrai as informações armazenadas. As tendências estão se movendo rapidamente nessa direção, dizem os pesquisadores.
A automação é outra peça fundamental desse quebra-cabeça, pois permitiria o armazenamento em escala comercial e torná-lo mais acessível, dizem os pesquisadores da Microsoft.
Sob as condições certas, o DNA pode durar muito mais do que as tecnologias atuais de armazenamento de arquivos que se degradam em questão de décadas. Alguns DNA conseguiram persistir em condições de armazenamento menos que ideais por dezenas de milhares de anos em presas gigantescas e ossos de humanos primitivos, e deve ter relevância enquanto as pessoas estiverem vivas.
O sistema automatizado de armazenamento de dados de DNA usa software desenvolvido pela equipe da Microsoft e da UW que converte os zeros e uns dos dados digitais em As, Ts, Cs e Gs, que formam os blocos de construção do DNA. Em seguida, ele usa equipamentos de laboratório baratos, em grande parte disponíveis na prateleira, para transportar os líquidos e produtos químicos necessários para um sintetizador que constrói fragmentos fabricados de DNA e os empurra para um recipiente de armazenamento.
Quando o sistema precisa recuperar as informações, ele adiciona outras substâncias químicas para preparar adequadamente o DNA e usa bombas microfluídicas para empurrar os líquidos para outras partes do sistema que “leem” as sequências de DNA e as convertem de volta a informações que um computador pode entender . O objetivo do projeto não era provar quão rápido ou barato o sistema poderia funcionar, dizem os pesquisadores, mas simplesmente demonstrar que a automação é possível.
Um benefício imediato de ter um sistema automatizado de armazenamento de DNA é que ele libera os pesquisadores para investigar questões mais profundas, em vez de gastar tempo procurando frascos de reagentes ou espremendo repetidamente gotas de líquidos em tubos de ensaio.
“Ter um sistema automatizado para fazer o trabalho repetitivo permite que aqueles de nós que trabalham no laboratório tenham uma visão mais elevada e comecem a montar novas estratégias – essencialmente inovar muito mais rápido”, disse o pesquisador da Microsoft, Bichlien Nguyen.
A equipe do Laboratório de Sistemas de Informação Molecular já demonstrou que pode armazenar fotografias de gatos, grandes obras literárias, vídeos pop e gravações de arquivos no DNA, e recuperar esses arquivos sem erros em um ambiente de pesquisa. Até o momento, eles conseguiram armazenar 1 gigabyte de dados no DNA, superando seu recorde mundial anterior de 200 MB.
Para armazenar dados no DNA, algoritmos convertem os 1s e 0s em dados digitais em sequências ACTG no DNA. Pesquisadores da Microsoft e da Universidade de Washington armazenaram e recuperaram a palavra “olá” usando o primeiro sistema totalmente automatizado para armazenamento de DNA.
Os pesquisadores também desenvolveram técnicas para realizar cálculos significativos – como procurar e recuperar apenas imagens que contêm uma maçã ou uma bicicleta verde – usando as próprias moléculas e sem precisar converter os arquivos de volta para um formato digital.
“Estamos definitivamente vendo um novo tipo de sistema de computador nascendo aqui onde você está usando moléculas para armazenar dados e eletrônicos para controle e processamento. Colocá-los juntos tem algumas possibilidades realmente interessantes para o futuro”, disse Luis Ceze, professor da UW Allen School.
Ao contrário dos sistemas de computação baseados em silício, os sistemas de computação e armazenamento baseados em DNA precisam usar líquidos para movimentar as moléculas. Mas os fluidos são inerentemente diferentes dos elétrons e exigem soluções de engenharia inteiramente novas.
A equipe da UW, em colaboração com a Microsoft, também está desenvolvendo um sistema programável que automatiza os experimentos de laboratório, aproveitando as propriedades da eletricidade e da água para mover gotículas ao redor de uma grade de eletrodos. A pilha completa de software e hardware, apelidada de “Puddle” e “PurpleDrop”, pode misturar, separar, aquecer ou resfriar diferentes líquidos e executar protocolos de laboratório.
O objetivo é automatizar experimentos de laboratório que estão sendo feitos manualmente ou por robôs caros de manipulação de líquidos – mas por uma fração do custo.
As próximas etapas da equipe do MISL incluem a integração do sistema automatizado de ponta a ponta simples com tecnologias como a PurpleDrop e aquelas que permitem pesquisar com moléculas de DNA. Os pesquisadores projetaram especificamente o sistema automatizado para ser modular, permitindo que ele evolua à medida que surgem novas tecnologias para sintetizar, sequenciar ou trabalhar com o DNA.
“O que é ótimo sobre esse sistema é que, se quisermos substituir uma das peças por algo novo, melhor ou mais rápido, podemos ligar isso”, disse Nguyen. “Isso nos dá muita flexibilidade para o futuro”.
Podcast: Play in new window | Download
Subscribe: RSS