Com o desenvolvimento da informatização e da internet, empresas, governos e os sistemas de saúde vêm tornando-se muito bons em coletar e acumular informações sobre seus clientes e usuários. Mas isso apenas não é o bastante. É preciso converter essa massa de dados em informações aplicáveis e que façam sentido.
O termo “big data” é amplamente utilizado para se referir a grandes bases de dados captadas eletronicamente pela internet ou diretamente nos processos de empresas, governos e também dos sistemas de saúde. A revolução do emprego dos grandes bancos de dados está no fato de se traduzir uma quantidade gigantesca de dados brutos, obtidos por múltiplas fontes, em informação coerente e interpretável, aplicada à tomada de decisões nas empresas e nos sistemas de saúde.
Mas afinal, qual a diferença entre “big data” e decisões administrativas baseadas em análises de dados convencionais? Apresentamos a seguir as 4 principais características das análises de big data.
1. Volume de informações
Em 2012, estimou-se que 2,5 exabytes (=2,5 bilhões de gigabytes) em dados são gerados a cada dia na internet, e estima-se que esse valor duplique a cada 40 meses. Bancos de dados de big data são muitas vezes tão extensos que excedem as capacidades dos softwares estatísticos mais comuns, exigindo softwares e soluções especiais.
2. Velocidade das informações
É possível de obter gigantescos bancos de dados que monitoram as atividades de um determinado “público-alvo” em tempo real, ou quase real. Isso possibilita que as organizações detectem mudanças de padrões e fenômenos comportamentais (ou naturais, como epidemias) com uma agilidade sem precedentes.
3. Variedade das informações
A integração de múltiplas fontes de informação relacionadas a um mesmo indivíduo ou grupo de indivíduos ocorre cada vez mais frequentemente. Sabe-se a localização das pessoas por GPS dos smartphone. Sabe-se a velocidade com que se deslocam, o que pode fornecer pistas sobre seus hábitos ao volante e risco de acidentes de trânsito, por exemplo. Sabe-se o comportamento desse mesmo indivíduo nas redes sociais. O mosaico de dados sobre um mesmo indivíduo ou grupo pode permitir o desenvolvimento de instrumentos preditores (de doenças ou de consumo, por exemplo) mais confiáveis do que aqueles disponíveis anteriormente a era dos grandes bancos de dados.
4. Veracidade das informações
Até que ponto as informações obtidas pela análise de big data são confiáveis? Não há dúvidas que o aumento do poder estatístico advindo do uso de bases de dados tão volumosas aumenta a precisão das estimativas, mas deve-se estar atendo para a plausibilidade de possíveis correlações. A análise de grandes bases de dados aumenta a responsabilidades sobre as conclusões obtidas. Por essa razão, a quantificação das incertezas por métodos estatísticos e análises de sensibilidade torna-se especialmente importante no processamento desse tipo de informação.
O emprego de grandes bases de dados já está melhorando o desempenho de empresas em muitas atividades econômicas. Companhias aéreas podem melhor predizer o tempo estimado para a chegada dos voos e para a preparação da aeronave para o voo seguinte. Websites de comércio eletrônico amplamente aplicam técnicas de “re-marketing” para apresentar aos usuários anúncios com base em preferências prévias ou em informações provenientes de websites parceiros. Canais de filmes por streaming, como a Netflix, sugerem filmes baseados no comportamento do usuário e de pessoas semelhantes a ele.
Na área de avaliação de tecnologias da saúde, a principal aplicação da análise de big data parece estar no processamento de volumosos bancos de dados para avaliação da eficácia e da segurança de intervenções diagnósticas e terapêuticas em condições reais de uso. Essas “evidências de mundo real” podem oferecer informações complementares às obtidas em ensaios clínicos randomizados controlados. Além disso, a elaboração de preditores prognósticos a partir de robustos bancos de dados pode contribuir para a implementação de praticas terapêuticas mais individualizadas. Por fim, com a capacidade de confrontar a efetividade real aos custos aferidos em um volumoso grupo de pacientes, será possível se obter um melhor entendimento das razões de custo-efetividades “reais” entre 2 ou mais opções terapêuticas aplicadas em condições verdadeiras de utilização.
O setor saúde parece não ter ainda se beneficiado plenamente da análise de grandes bancos de dados. Não há preditores confiáveis e validados para a duração de uma hospitalização, por exemplo. Ou para o risco de reinternação. Existem alguns preditores, mas são embasados em análise de bancos de dados convencionais, sendo que o benefício integral do uso de bases de dados massivas ainda está para acontecer nesse setor.
Deixe uma resposta