top of page
logo brasil data science.png

Mantenha-se atualizado diariamente com conteúdos sobre Data Science.

  • Foto do escritorGustavo Costanti Lara

O atual cenário de Data Science no Brasil

Atualizado: 21 de fev. de 2021


Quando perguntados sobre o cenário de Data Science no Brasil, os cientistas de dados costumam apresentar opiniões muito divergentes. Isso porque, as opiniões de cada profissional são baseadas nas suas experiências e vivências pessoais no mercado de trabalho. A consequência é uma resposta pautada em puro “achismo”.

Pensando nisso, a comunidade Data Hackers resolveu aplicar a própria ciência de dados para interpretar o cenário atual de Data Science no Brasil.

A pesquisa do Data Hackers foi respondida por mais de 1.700 pessoas, de modo a coletar dados sobre a faixa salarial, formação acadêmica, linguagens de programação utilizadas, entre outros dados (no total, 36 perguntas).

Data Hackers Survey 2019

A pesquisa foi realizada em novembro de 2019 pela comunidade Data Hackers.

O resultado foi anonimizado, ou seja, não foi disponibilizado nenhum dado pessoal dos participantes da pesquisa que pudesse levar à identificação destes.

As 36 perguntas foram:

  1. Pergunta_1 (P1) = Idade?

  2. Pergunta_2 (P2) = Gênero?

  3. Pergunta_3 (P3) = Atualmente você vive no Brasil?

  4. Pergunta_4 (P4) = Em que país você vive hoje?

  5. Pergunta_5 (P5) = Em que estado você vive hoje?

  6. Pergunta6 (P6) = Na questão anterior você disse que vive em . Esse é seu estado de origem (onde nasceu ou se formou)?

  7. Pergunta_7 (P7) = Qual seu estado de origem?

  8. Pergunta_8 (P8) = Qual seu nível de ensino?

  9. Pergunta_9 (P9) = Qual sua área de formação?

  10. Pergunta_10 (P10) = Qual sua situação atual de trabalho?

  11. Pergunta_11 (P11) = A empresa em que você trabalha pertence a qual setor?

  12. Pergunta_12 (P12) = A empresa em que você trabalha possui quantos funcionários atualmente?

  13. Pergunta_13 (P13) = Você atua como gestor?

  14. Pergunta_14 (P14) = Qual das opções abaixo definem melhor seu cargo de trabalho atual como gestor?

  15. Pergunta_15 (P15) = Qual das opções abaixo definem melhor seu cargo de trabalho atual?

  16. Pergunta_16 (P16) = Qual sua faixa salarial atual? [Mascarada]

  17. Pergunta_17 (P17) = Quanto tempo de experiência na área de dados você tem?

  18. Pergunta_18 (P18) = Quanto tempo de experiência na área de TI/Engenharia de Software você teve antes de começar a trabalhar na área de dados?

  19. Pergunta_19 (P19) = Você se considera um profissional que atua na área de Data Science?

  20. Pergunta_20 (P20) = Quais dos métodos listados abaixo você costuma utilizar no trabalho?

  21. Pergunta_21 (P21) = Quais das linguagens de programação listadas abaixo você utiliza no trabalho?

  22. Pergunta_22 (P22) = Entre as linguagens de programação listadas abaixo, qual é a que você mais utiliza no trabalho? [Mascarada]

  23. Pergunta_23 (P23) = Quais das fontes de dados listadas você já analisou no trabalho?

  24. Pergunta_24 (P24) = Entre as fontes de dados listadas, quais você utiliza na maior parte do tempo? Selecione no máximo duas opções que você mais utiliza.

  25. Pergunta_25 (P25) = Quais das opções de Cloud listadas abaixo você utiliza no trabalho?

  26. Pergunta_26 (P26) = Quais dos bancos de dados/fontes de dados listados abaixo você utiliza para consultar informações, e posteriormente analisar, no trabalho?

  27. Pergunta_27 (P27) = Quais as Ferramentas de Business Intelligence você utiliza no trabalho?

  28. Pergunta_28 (P28) = Quais as tecnologias são utilizadas como ferramenta de ETL no seu trabalho?

  29. Pergunta_29 (P29) = Sua organização possui um Data Warehouse?

  30. Pergunta_30 (P30) = Qual tecnologia utilizada como plataforma do Data Warehouse?

  31. Pergunta_31 (P31) = Quais das iniciativas do Data Hackers que você já acessou/acompanhou?

  32. Pergunta_32 (P32) = Entre as iniciativas do Data Hackers qual a sua preferida?

  33. Pergunta_33 (P33) = De quais outras formas que você costuma se atualizar no mundo dos dados?

  34. Pergunta_34 (P34) = Em quais dessas plataformas listadas abaixo você já iniciou/completou cursos na área de Data Science?

  35. Pergunta_35 (P35) = Dentre as plataformas listadas abaixo qual foi a sua preferida para cursos de Data Science?

  36. Pergunta_36 (P36) = Você deseja participar do sorteio?

O primeiro passo para podermos analisar os resultados da pesquisa é fazer o download do dataset (link).

No código em Python abaixo, foram importadas as bibliotecas necessárias e o dataset foi transformado em um DataFrame.

Feito isso, está na hora de começar a responder algumas perguntas importantes.


Em que estados vivem os cientistas de dados de dados no Brasil?

Para responder essa pergunta, devemos separar o grupo de pessoas que responderam “sim” para a pergunta de número 19: “Você se considera um profissional que atua na área de Data Science?”.

Após selecionadas as pessoas que se consideram profissionais que atuam na área de Data Science, é necessário comparar essas pessoas com a resposta que elas deram para a pergunta de número 5: “Em que estado você vive hoje?”.

A partir do gráfico extraído, podemos observar que a imensa maioria dos cientistas de dados residentes no Brasil vivem no Estado de São Paulo.

Importa destacar que, os Estados de São Paulo, Minas Gerais e Rio de Janeiro representam juntos 62% dos profissionais de Data Science no Brasil.


Como é a relação de gêneros no mercado de trabalho de Data Science no Brasil? Qual gênero é mais predominante no mercado? Em que proporção?

Antes de respondermos a essa pergunta, cabe aqui uma observação. A pesquisa foi feita considerando a visão binária de gêneros masculino e feminino. Na pergunta número 2: “Gênero?”, os participantes da pesquisa deveriam escolher apenas entre masculino e feminino.

Superada essa questão, vamos organizar os dados. Para isso, basta plotar o gráfico de gêneros, e separar o grupo que respondeu “sim” para a pergunta de número 19: “Você se considera um profissional que atua na área de Data Science?”.

Dentre os participantes que se consideram profissionais atuantes em Data Science, apenas 17% se declararam mulheres, contra 83% que se declararam homens.

É de conhecimento público que as mulheres representam uma minoria no mercado de T.I. Contudo, a partir dessa análise conseguimos observar e quantificar essa disparidade quando tratamos especificamente do mercado de ciência de dados.


Qual é o grau de escolaridade dos cientistas de dados no Brasil?

Para responder essa pergunta, novamente separamos os participantes que responderam “sim” para a pergunta de número 19: “Você se considera um profissional que atua na área de Data Science?”, e plotamos o gráfico com relação às respostas da pergunta de número 8: “Qual seu nível de ensino?”.

A análise desses dados nos mostra que um mestrado, doutorado ou phd não é algo extremamente necessário para ingressar no mercado em Data Science, visto que as pessoas com esses níveis de escolaridade representam, somadas, apenas 13% do total de participantes que atuam como cientista de dados.

No entanto, ao analisarmos o gráfico que relaciona o nível educacional e a média salarial, percebemos que os profissionais com um maior grau de escolaridade costumam receber maiores salários.

Qual é a média de idade dos Cientistas de Dados no Brasil?

Para responder essa pergunta, basta plotar o histograma de idade.

A média de idade dos profissionais de Data Science no Brasil é de aproximadamente 30 anos.


Quanto ganha um cientista de dados?

Essa talvez seja a pergunta mais frequente entre as pessoas que estão pretendendo ingressar na carreira de ciência de dados.

Todos nós sabemos que os cientistas de dados nos Estados Unidos ou no Canadá costumam receber excelentes salário. Mas será que essa é a realidade brasileira?

Vamos conferir!

Dentre as faixas salariais analisadas, temos que a maioria dos cientistas de dados no Brasil recebem um salário entre 4 a 6 mil reais mensais. No entanto, é importante destacar que a faixa salarial entre 8 a 12 mil reais é a segunda faixa com um maior número de cientistas de dados.

Importa destacar que esta pesquisa envolve desde estagiários até os mais altos níveis de cientistas de dados. Esse fato justifica a existência de valores abaixo dos 3 mil reais mensais, bem como dos valores acima de 20 mil reais mensais.


Qual é a linguagem de programação mais utilizada por profissionais de Data Science?

Nesse quesito, a linguagem campeã é Python, com uma diferença imensa para as demais linguagens.

Ao meu ver, não haveria a menor necessidade de colocar a linguagem SQL no gráfico, isso porque SQL está mais para uma linguagem de pesquisa declarativa para bancos de dados relacionais do que para uma linguagem de programação propriamente dita. Contudo, para manter fidelidade ao dataset decidi manter esta linguagem no gráfico.


100 visualizações

Comments


bottom of page