Data Science (Ciência dos Dados)

09 15De forma geral, o termo Data Science (Ciência dos Dados) está se tornando crescentemente comum, como está o de Big Data.  Mas o que ele significa? Há algo exclusivo sobre ele? Que habilidades os “cientistas de dados” precisam para serem produtivos em um mundo inundado por dados?  Quais são as implicações para a pesquisa científica?

Estas são algumas das questões colocadas por Vasant Dhar em um artigo na conceituada revista tecnológica Communications of the ACM (1).  O termo “ciência” implica conhecimento ganho através de estudo sistemático.  Em uma definição, é o empreendimento sistemático que constrói e organiza o conhecimento na forma de explicações testáveis e previsões. 

A Data Science deve, portanto, implicar um foco envolvendo dados, e, por extensão, estatística, ou o sistemático estudo da organização, propriedades, e análise de dados e seu papel na inferência, incluindo nossa confiança na inferência.  E por que, então, nós precisamos um termo novo como Data Science quando nós temos a estatística há séculos?  Ao responder sua própria pergunta Dhar afirma que o fato de que agora nós temos grandes volumes de dados não deve, por si só, justificar a necessidade de um novo termo.

A resposta breve, de acordo com Dhar, é que Data Science é diferente de estatística e outras disciplinas em diversas maneiras importantes.  Para começar, a matéria prima, os “dados” (parte da ciência dos dados), é crescentemente heterogênea e não-estruturada – textos, imagens, vídeos – frequentemente emanando de redes com complexas relações entre suas entidades.

A Figura 1 à frente mostra o relativo esperado volume de dados não-estruturados e estruturados entre 2008 e 2015 em todo mundo, projetando uma diferença de quase 200 petabytes (PB) em 2015, comparado com a diferença de 50 PB em 2012.  A análise, incluindo a combinação de dois tipos de dados, requer integração, interpretação, e geração de senso que está crescentemente sendo derivado através de ferramentas da ciência da computação, linguística, econometria, sociologia, e outras disciplinas. 

De uma perspectiva de engenharia, a escala envolvida neste novo contexto importa porque ela torna os tradicionais modelos de bancos de dados inadequados para descoberta de conhecimento.  Os métodos tradicionais de bancos de dados não são adequados para descoberta de conhecimento porque eles são otimizados para rápido acesso e sumarização de dados, levando em conta o que o usuário deseja perguntar, e não a descoberta de padrões em massivos lotes de dados quando usuários não apresentam um inquérito bem formulado. 

E o que torna os discernimentos acionáveis neste novo contexto? Muito além de razões de domínio-específico, é o poder preditivo das ferramentas usadas neste novo contexto.  A ênfase na previsão é particularmente forte em áreas como Machine Learning (Aprendizado de Máquina) e descoberta de conhecimento em bancos de dados.  E aqui também estamos lidando no que hoje de denomina por Analítica, a descoberta (e comunicação) de padrões, com significado, em dados.

A Data Science tem fortes implicações para os negócios e para a pesquisa científica. Primeiro pela necessidade de novas habilidades, ou para o que as pessoas precisam saber e porque.  Que novos programas educacionais são necessários para atendem ao crescimento deste novo campo?  E que tipos de habilidades em processos de tomadas de decisão são requeridos nesta era do Big Data, e como elas diferem do passado?

Eis aí um desafio que precisamos enfrentar como nação, para que não tenhamos que depender de outras nações (e suas empresas), como aconteceu na era dos computadores, que foi fundamental para a geração desta nova Era dos Dados!  Como se diz popularmente nos dias de hoje: Data is the New Oil! (Dados são o Novo Petróleo)!

Se sua empresa, organização ou instituição deseja saber mais sobre Data Science, fique a vontade para nos contatar!

----------------------------------------------------------------------

Dhar, V. (2013)."Data science and prediction".Communications of the ACM, 56(12): 64.

 

n9 fig1

 

 

 banner

Creativante 2017 - Todos os direitos reservados