Ciência de dados e o perfil do cientista de dados

Por Débora Morales*

Nunca se gerou tanta informação como nos dias atuais – e essa informação é originada a partir de dados. Dados produzidos por sistemas, celulares, sensores, câmeras, dispositivos de segurança, tudo isso em grande volume e velocidade.

Nesse contexto, entra o papel da ciência de dados, trazendo ferramentas, métodos e tecnologias para analisar, visualizar e tomar decisões a partir dos dados. A ciência de dados é um processo, não um evento. É o processo de usar dados para entender o mundo, é a arte de descobrir os insights e tendências que estão escondidos atrás dessas informações.

A ciência de dados em si é uma área interdisciplinar que envolve várias áreas de conhecimento, tais como: estatística, matemática, programação, computação e conhecimento de negócios. Essas áreas corroboram com técnicas e teorias como a modelagem, análise preditiva, mineração e visualização de dados.

A ciência de dados se baseia em três pilares. O primeiro pilar é base, que se vale da matemática e da estatística, utilizando as regras de Machine Learning, necessárias para a criação de modelos preditivos de análise de dados. O segundo pilar refere-se à área de negócio. É daqui que surgem os problemas específicos que necessitam da ciência de dados para serem resolvidos. Marketing, vendas, finanças, saúde, entre outras áreas, são o ponto de partida para os projetos em que os dados serão coletados e analisados com objetivo de responder perguntas formuladas pelas áreas de negócio.

O terceiro pilar é a ciência da computação. Neste caso, estamos falando da programação de computadores, infraestrutura de banco de dados, armazenamento e segurança. Essa área de conhecimento vai oferecer as ferramentas necessárias para análise, além de permitir a automatização do processo. Novas tecnologias de banco de dados, como NoSQL, começam a ganhar cada vez mais espaço no mercado, uma vez que o volume, variedade e velocidade de dadosexige novas formas de armazenamento.

As empresas estão cada vez mais cientes que precisam tomar decisões baseadas em informações, principalmente aquelas que pensam sobre Big Data. Sendo assim, nunca houve um melhor momento para ser um cientista de dados.

Um cientista de dados precisa de alguma familiaridade com plataformas de análise, mas esse ponto dispõe apenas suas habilidades técnicas. Além do conhecimento técnico, há outras características que até podem ser apontadas como mais importantes. O perfil do cientista de dados é ser curioso, extremamente argumentativo e julgador. Curiosidade é absolutamente necessária. Se você não é curioso, não sabe o que fazer com os dados. Julgador porque, se você não tiver noções preconcebidas, não sabe por onde começar. Argumentativo porque, se você pode argumentar, então pode defender um caso ou, pelo menos, começar em algum lugar. Então, aprende com os dados e poderá modificar suas suposições e hipóteses.

E a última coisa que um cientista de dados precisa ter é a capacidade de contar uma história. Uma vez que você tem sua análise e suas tabulações, deve ser capaz de contar uma grande história a partir delas.

Lembre-se: comunicação é um dos requisitos principais de um cientista de dados. Afinal, de nada adianta realizar um excelente trabalho de análise se você não for capaz de mostrá-lo e contar uma história por meio das informações.

*Débora Morales é mestra em Engenharia de Produção (UFPR) na área de Pesquisa Operacional com ênfase a métodos estatísticos aplicados à engenharia e inovação e tecnologia, especialista em Engenharia de Confiabilidade (UTFPR), graduada em Estatística e em Economia. Atua como Estatística no Instituto das Cidades Inteligentes (ICI).