top of page

O que é Data Science?

Não é nenhuma novidade toda a transformação em que o mundo vive passando em termos de evolução tecnológica, principalmente no que tange a ciência e o modelo de consumo por serviços e produtos. A isso temos atrelado uma geração de dados. Entretanto, o que significa o verbete “DADO”?





Sua definição de acordo com os dicionários pode ser descrita como um conjunto de valores e fatos, qualitativos ou quantitativos, no seu estado bruto, obtidos ou adquiridos através de uma quantificação pelo intermédio de uma observação que foi documentada com o objetivo de gerar algum tipo de informação para ser utilizado depois (CRUZ, 2018).


Se pararmos para pensar que há pelo menos 10 anos atrás eram criados equipamentos com mecanismos físicos e de funcionamento mecânico, agora é em grande parte digital e até virtual. Antes as correspondências e compras eram todos processos físicos, agora são processos virtuais.


No passado armazenávamos dados apenas em livros ou nas mídias esquecidas, disquetes, CD-ROM e DVD-ROM, agora temos as nuvens e neblinas, cloud e fog. Essas informações digitais criadas geram volumes de dados e esses dados precisam ser captados e tratados. Já parou para imaginar o quanto de dados são utilizados apenas ao acessar um e-mail do seu celular?


De acordo com o cientista Bernanrd Marr, escritor e consultor em big data, no período de 2017-2019 (Revista Forbes) o volume de dados gerados foi o maior registrado em toda a nossa história. Esse crescimento é assustador, foi estimado para 2020, que antes do problema da pandemia, uma geração de dados em torno de 1,7 megabytes por segundo. Isso significa que em um único dia serão gerados aproximadamente 143 gigabytes. Bernanrd também informou que foram armazenados, nos últimos 5 anos, aproximadamente 4,4 zettabyetes (ZiB) e que esse volume de dados provavelmente passará a casa de 44 zettabytes (ZiB) ou 44 trilhões de gigabytes (Revista Forbes).


A partir dessa quantidade de valores numéricos absurdos, podemos refletir que é necessária uma organização e formas de medir e classificar esses dados, tantos os dados estruturados quanto os não estruturados e nesse contexto temos como ciência emergente a ciência de dados, mundialmente conhecida como Data Science, ou Ciência de Dados, o que não é de se espantar de ser muito requisitada nesses últimos anos (CURTY, 2016).


Apenas como nível de curiosidade, além da quantidade de dados gerados, como é que esses dados são processados e armazenados? Para entendermos a estruturação de dados é importante conhecer, além de entender o que venha a ser Data Science é preciso também saber onde armazenar e como processar. Esse avanço de geração de dados só foi possível ter um controle e um armazenamento mais eficiente com o avanço na capacidade de processamento em nuvem, utilizando processamento horizontal com clusters. Como armazenar dados é caro, diversas soluções por grandes empresas do ramo foram criadas e com isso facilitaram a existência desse fluxo de informações (dados).


Esse tópico é importante porque a ciência orientada a dados precisa de ciberinfraestruturas de informação e comunicação que possuem o objetivo de sustentar a heterogeneidade de dados em suas diferentes fases em armazenamentos para utilização e estudos futuros.


O Data Science como uma ciência, possui alguns pilares que a sustentam e a desenvolvem, são a matemática e estatística como a base, pois é por intermédio dessas duas que são criados modelos e scripts para as análises e tratamento dos dados. Seguindo essas bases temos alguns pilares como computação, programação e suas subsequências, as áreas de negócios, mineração e a visualização de dados.


Importante atentar que o Data Science trabalha atua principalmente com os conhecimentos gerados e a partir das análises das informações que foram processadas, dessa forma pode ser entendido que quanto maior a disponibilidade desses dados, tão maiores serão as informações adquiridas que irão agregar valor absorção do conhecimento para a geração de insigths.


Essa ciência é muito próxima ao BIG DATA, importante perceber que existem diferenças entre essas duas áreas, o que pode ser atribuído à Ciência de Dados é a possibilidade de extração de informação, sendo útil ou não, a depender da aplicação e até em seus valores depreciados ou não, a partir bases de dados gigantescas, complexas, heterogêneas, extremamente dinâmicas e distribuídas. Enquanto que o BIG DATA está relacionado ao grande volume de dados, gerados em alta velocidade e variedade, que necessitam de uma análise para transformá-los em informações que possam utilizar em atividades inovadoras e econômicas com a capacidade de processar, organizar e armazenar para serem aplicados em processos de automação e tomadas de decisão. Em suma o BIG DATA gera valor para o negócio através da avaliação dos dados (GALDINO, 2016).


Outro ponto de importância e atenção são as profissões que essa ciência oportunizou. De acordo com a revista Exame, através de sua publicação utilizando as principais previsões do relatório The Future of Jobs, divulgado pelo Fórum Econômico Mundial em setembro de 2018, algumas profissões deixarão de existir e consequentemente novas surgirão. Dentre as que já são realidades temos: Analistas de Marketing, Cientistas de Dados, Engenheiro de Dados, Arquiteto de Dados, Analista de Dados, Analista de Negócio, Estatístico são profissões que estão totalmente em consonância com o Data Science.


Dessa forma podemos relatar de maneira simples que a Data Science foi criada pelo entendimento da necessidade de obter conteúdos de relevâncias e que possam ser utilizados e traduzidos de forma que agregue algum valor, e com isso possibilite criar soluções a partir destas informações (dados) e assim, possam ser aplicados em forma de conhecimento.





Referências

Revista Forbes digital. Disponível em: https://forbes.com.br/fotos/2015/10/20-fatos-sobre-a-internet-que-voce-provavelmente-nao-sabe/ Acessado em: 23/05/2020.

CURTY, R. G.; CERVANTES, B. M. N. DATA SCIENCE: CIÊNCIA ORIENTADA A DADOS. Inf. Inf., Londrina, v. 21, n. 2, p. 1 – 4, maio/ago, 2016. Disponível em: www.uel.br/revistas/informacao/

GALDINO, N. Big Data: Ferramentas e Aplicabilidade. O XIII Simpósio de Excelência em Gestão e Tecnologia – SEGeT, Resende, RJ, 2016.

CRUZ, L. C. Data Science: Desenvolvimento de aplicação para análise de dados Trabalho de Conclusão de Curso (Ciência da Computação) - Fundação Educacional do Município de Assis – FEMA, 2018.




Químico, Especialista em Educação, Master Business Innovation em Indústria 4.0 e Mestre em Química. Atualmente, Docente na Faculdade Senai Cetiqt e grande entusiasta do modelo em educação 4.0. Idealizador do @e-dutech 4.0


Lattes: http://lattes.cnpq.br/8548317382926592


30 visualizações0 comentário
bottom of page