Um Projeto: Fundação Estudar
cientista de dados

O que um cientista de dados faz, de acordo com 35 profissionais

Por Suria Barbosa

PhD, cientista de dados e apresentador de podcast temático relata o que aprendeu sobre a profissão de cientista de dados, que emergiu com o avanço tecnológico. Desde o que fazem esses profissionais, até os principais desafios da área.

Uma das profissões que surgiu com o avanço da tecnologia é a de cientista de dados (data scientist). Ainda que venha se popularizando, há bastante dúvida acerca do seu significado, que, inclusive, é bem amplo: o termo é utilizado para descrever diversos trabalhos relacionados a dados.

Se inicialmente o foco desse campo do conhecimento se restringia a produtos digitais, atualmente a ciência de dados “está preparada para transformar todos os setores, do varejo, telecomunicações e agricultura à saúde, transporte e sistema penal”. Essa opinião é de Hugo Bowne-Anderson, PhD, cientista de dados e educador na plataforma DataCamp.

Leia também: 8 e-books gratuitos sobre carreira em tecnologia

Como apresentador do podcast temático “DataFramed”, Bowne-Anderson entrevistou cerca de 35 cientistas de dados, atuantes em uma gama de indústrias e estudantes de várias disciplinas acadêmicas. “A revolução da ciência de dados entre as indústrias e a sociedade em geral está apenas começando”, destaca ele, que acrescenta que o futuro da profissão, no entanto, ainda não é claro.

Cientista de dados pode continuar sendo uma das ocupações mais “quentes” do século ou amornar, até seu título “sumir”. Isso aconteceria se as habilidades forem tão necessárias e difundidas, que permeiem muitas outras funções. Algo similar aconteceu com os antigos “webmasters”, responsáveis por web design e desenvolvimento. Confira as descobertas de Bowne-Anderson ao entrevistar os profissionais, relatadas em artigo no site Harvard Business Review.

O que um cientista de dados faz

É verdade que o campo da ciência de dados é bem variado, afirma o apresentador do podcast. Seus entrevistados descrevem ampla gama de trabalho, incluindo estruturas experimentais em sites como Etsy e Booking.com, otimização de manchetes do Buzzfeed e até investigação sobre o impacto de machine learning na tomada de decisões. Esse último, realizado na plataforma Airbnb.

“A ciência de dados pode ser usada em um número de maneiras diferentes, dependendo não só da indústria, mas do negócio e seus objetivos”, resume o PhD. Porém, de forma geral, ele conta que a primeira parte do trabalho dos cientistas de dados é de estabelecer uma base sólida de dados para executar análises robustas. Então, eles utilizam experimentos, entre outros métodos, para alcançar crescimento sustentável.

Por fim, automatizam processos de machine learning e constroem produtos de dados personalidades para melhor entender o negócio e os consumidores e utilizar essas informações na tomada de decisões. “Em outras palavras, em tech, ciência de dados é sobre infraestrutura, testar, machine learning, tomada de decisões e produtos de dados”, completa Bowne-Anderson.

Avanços fora da indústria de tecnologia

Entre os ramos em que os entrevistados do podcast “DataFramed” atuam – e em que a ciência de dados tem (ou começa a ter) impacto -, estão a de caminhões, de pesquisa da cura do câncer, de operações industriais, sistemas em geral, etc. “Essa lista não exaustiva ilustra as revoluções da ciência de dados em várias verticais.”

As habilidades requeridas mudam

As competências tão procuradas nesses profissionais estão mudando ao longo do tempo, conta Bowne-Anderson. “Estamos vendo desenvolvimentos rápidos tanto no ecossistema de código aberto de ferramentas disponíveis para ciência de dados quanto nas ferramentas de ciência de dados comercializadas, e também estamos vendo uma automação cada vez maior de muito do trabalho penoso, como limpeza e preparação de dados”, explica ele.

Uma mudança bem-vinda, já que cerca de 80% do tempo útil dos cientistas de dados é gasto com as tarefas de achar, limpar e organizar dados. Sobrando, assim, apenas 20% do tempo para análise, de acordo com a IBM.

Como resultado dessa mudança, a maioria dos convidados do podcast afirmou que as habilidades-chave para a profissão são de aprender rápido e se comunicar bem.

“Então, os aspirantes a cientistas de dados, devem se concentrar menos nas técnicas do que nas perguntas. Novas técnicas vêm e vão, mas o pensamento crítico, as habilidades quantitativas e específicas do domínio permanecerão em demanda.”

Especializações estão surgindo

Segundo o PhD, ainda que não exista plano de carreira bem definido para os cientistas de dados, já existem algumas formas de especialização. Um dos seus entrevistados, Jonathan Nolis, quebra essa ciência em três componentes:

    1. Business intelligence: ou “pegar dados que a empresa tem e colocar na frente das pessoas certas” em e-mails, relatórios, etc.;
    2. Ciência da decisão: que é sobre “pegar dados e usá-los para ajudar uma empresa a tomar uma decisão” e
    3. Machine learning: “como podemos pegar modelos de ciência de dados e colocá-los continuamente em produção”.

Embora muitos cientistas de dados em atuação atualmente sejam generalistas e façam as três coisas, estamos vendo caminhos de carreira distintos surgindo, como no caso dos engenheiros de machine learning”, destaca o apresentador.

Leia também: 21 (possíveis) profissões do futuro para conhecer hoje

Ética está entre os principais desafios da área

Quando entrevistou a cientista de dados Hilary Mason sobre os desafios da área em que atua, Bowne-Anderson conta que ela respondeu:

“Você acha que ética imprecisa, sem padrões de prática e a falta de vocabulário consistente não são desafios suficientes para nós hoje?”

“Todos os três são pontos essenciais, e os dois primeiros, em particular, estão na visão de frente de quase todos os convidados do DataFramed. No momento em que muitas de nossas interações com o mundo são ditadas por algoritmos desenvolvidos pelos cientistas de dados, que papel a ética desempenha?”, destaca o apresentador do podcast.

Para outro entrevistado, o cientista de dados Omoju Miller, que trabalha no GitHub, é preciso difundir o entendimento da ética como classe, o que inclui treinamentos e até um tipo de “juramento”. “E precisamos realmente ter licenças de verdade para que, se você realmente fizer algo antiético, talvez tenha algum tipo de penalidade, ou algum tipo de recurso, algo que diga que isso não é o que queremos fazer como indústria.”

O que achou do post? Deixe um comentário ou marque seu amigo