top of page
logo brasil data science.png

Mantenha-se atualizado diariamente com conteúdos sobre Data Science.

  • Foto do escritorGustavo Costanti Lara

Análise de dados sobre suicídio no Brasil

Atualizado: 21 de fev. de 2021


Todos os anos, mais de 12 mil pessoas tiram suas próprias vidas no Brasil. Em um cenário mundial, esse número ultrapassa 1 milhão de pessoas, levando o suicídio a ser considerado um problema de saúde pública.

Segundo a Organização Mundial da Saúde (OMS), o Brasil ocupa o oitavo lugar no número de suicídios no mundo: São 32 brasileiros por dia.

Este artigo de Ciência de Dados é uma pequena contribuição que visa entender a extensão desse problema no Brasil.

O objetivo deste projeto é responder 4 perguntas:

  • Qual é a tendência da taxa de suicídio no Brasil em relação ao resto do mundo?

  • Qual é a faixa etária com o maior índice de suicídio no Brasil?

  • Como está distribuída a taxa de suicídio entre homens e mulheres?

  • Há alguma correlação entre o PIB e a taxa de suicídio?

Importa destacar que o objetivo deste artigo é responder as perguntas supracitadas e trazer à tona um tema de grande importância.

Conforme as respostas forem apresentadas, surgirão muitas perguntas, normalmente relacionadas aos “porquês” dos dados apontarem em uma direção ou em outra. A reflexão sobre isso deixarei para a conclusão do artigo. Não procurei me adentrar nos porquês, mas apenas provocar a reflexão.

1. Aquisição dos dados

O conjunto de dados utilizado neste artigo é um compilado de 4 datasets sobre os índices de suicídio em diversos países entre os anos de 1985 e 2016:

Os 4 datasets acima foram compilados em um único conjunto de dados hospedado nesta página.

Desde já, deixo meu agradecimento à pessoa que realizou a limpeza e padronização dos dados, bem como a disponibilização destes no link supracitado.

Primeiramente devemos importar os pacotes necessários, transformar o dataset em um DataFrame e exibir suas primeiras 5 linhas para nos auxiliar na visualização dos dados e compreensão das variáveis.

2. Manipulação dos dados

Visualizadas as 5 linhas do dataframe, podemos compreender o significado de cada variável (coluna). Com isso em mente, é importante criarmos um dicionário de variáveis para nos auxiliar no entendimento de como os dados estão estruturados.

Dicionário de Variáveis

Esse arquivo csv possui 12 colunas. São elas:

Feito o dicionário de variáveis, é importante termos uma ideia do formato do DataFrame em análise, ou seja, devemos descobrir o número de linhas e colunas contidas na tabela.

O conjunto de dados contém 27.820 linhas e 12 colunas.


Filtrando os dados sobre o Brasil

Já que a maioria das nossas análises envolve o Brasil, vamos criar um DataFrame contendo apenas as informações relacionadas ao Brasil com o intuito de facilitar a manipulação da estrutura de dados.

Ademais, vamos analisar o formato do DataFrame criado e exibir suas primeiras 5 linhas.

Conforme supramencionado, a pessoa que disponibilizou o dataset compilado fez um ótimo trabalho na limpeza e padronização dos dados, nos poupando bastante tempo e esforço.

Entretanto, já que vamos comparar dados do Brasil com os do resto do Mundo, devemos verificar isoladamente os DataFrames do Brasil e o mundial para termos uma noção da integridade dos dados. Isso porque, quando queremos comparar dois conjuntos de dados é necessário que os DataFrames sejam similares e estatisticamente representativos.

Portanto, nossa primeira tarefa é analisar a quantidade de valores ausentes na tabela.

A partir da análise do resultado acima, a porcentagem de valores ausentes referentes ao IDH torna inviável o uso dessa variável. Caso se desejasse realmente usar, seria necessária uma etapa de coleta de dados a partir de outras fontes. Contudo, não existem valores ausentes nas demais variáveis, provavelmente fruto do trabalho da pessoa que compilou os dados dos 4 datasets.


4. Análise de Dados (respondendo perguntas)

Qual é a tendência da taxa de suicídio no Brasil com relação ao resto do mundo?

Uma primeira comparação que farei diz respeito ao número de suicídios cometidos no Brasil por 100 mil habitantes, e a tendência do gráfico em relação à taxa mundial.

Para ver a tendência, é melhor sempre usar essa relação por 100 mil habitantes, pois a população do país cresceu muito de 1985 para 2015. Se formos comparar em termos absolutos, poderemos tirar conclusões erradas ou distorcidas.

Uma coisa que é facilmente percebida no gráfico acima é que apesar da taxa de suicídios no Brasil ser menor que a média mundial, ela vem crescendo constantemente nos últimos 30 anos.

A linha laranja teve um pico por volta de 1995, porém vem caindo ano após ano. Já a linha azul (Brasil) tem um slope positivo praticamente ao longo de todo o período analisado.

No entanto, mesmo que exista uma tendência de crescimento na taxa de suicídio no Brasil, essa taxa ainda é bem menor se comparada ao resto do mundo.


Qual é a faixa etária com maior índice de suicídio no Brasil?

Para responder essa pergunta, vamos criar uma tabela dinâmica (pivot table) contendo 6 faixas etárias em função do ano e do número de suicídios por 100 mil habitantes.

Meu principal objetivo aqui é identificar qual a faixa etária que tem a maior representatividade entre aqueles que tiram a própria vida, e identificar se houve alguma mudança no perfil ao longo de 30 anos.

Mesmo visualmente, é fácil identificar que o grupo de pessoas que mais cometem suicídio está entre 35–54 anos. Em segundo lugar, estão pessoas entre 25–34 anos de idade.

Juntos, esses dois grupos correspondem a quase 60% dos registros do banco de dados.

Vamos melhorar a visualização das porcentagens.


Um outro ponto que vale a pena ressaltar é o aumento de casos entre pessoas acima de 55 anos. Em 1985, as pessoas com mais idade representavam uma pequena fatia do número total.

Entretanto, em 2015 é nítido que mesmo para pessoas acima de 75 anos houve um acréscimo significativo no número de suicídios.


Como está distribuída a taxa de suicídio entre homens e mulheres?

Analisando-se todo o período, o dataset utilizado mostrou que aproximadamente 78% dos casos foram cometidos por homens e 22% deles por mulheres. Optou-se por pegar a média dos 30 anos, pois não houve mudança significativa desse comportamento durante o período.



Há alguma correlação entre o PIB dos países com suas respectivas taxas de suicídio?

Criando uma matriz de correlação e plotando um heatmap, infere-se que o aumento no PIB per capita não diminuiu o número de suicídios por 100 mil habitantes. Na verdade, ele se manteve estável, contrariando o senso comum de que quanto maior o PIB menor é a taxa de suicídio.

Conforme anteriormente mencionado, analisar o IDH neste dataset poderia nos levar a uma interpretação distorcida da realidade, visto que há muitos valores ausentes nas células referentes ao IDH.



Conclusão

O real objetivo desse projeto foi trazer à tona um assunto de extrema importância que é negligenciado ou ignorado por boa parte das pessoas.

O conjunto de dados utilizado é simplificado, porém ideal para uma abordagem inicial de conscientização situacional sobre suicídio e saúde mental.

Espero que este artigo tenha te alertado sobre um problema real que muitas vezes está muito mais próximo de nós do que podemos imaginar.

Apresentei respostas para 4 perguntas, no entanto, não adentrei nos “porquês”.

  • Porque a taxa de suicídio tem subido no Brasil?

  • Porque os homens cometem mais suicídio que as mulheres?

  • Porque as faixas etárias que mais cometem suicídio se situam entre 25–34 anos e entre 35–54 anos de idade?

  • Porque o PIB não influencia significativamente as taxas de suicídio?

Acredito haver pessoas muito mais habilitadas e com muito mais experiência para adentrar nos “porquês” (psicólogos, psiquiatras, cientistas sociais, entre outros). Sinta-se à vontade para deixar sua contribuição neste artigo.

Lembre-se que não é frescura e que ninguém está querendo aparecer. Na verdade, a gente nunca tem a mínima ideia do que a outra pessoa está passando. Qualquer atitude que você tenha que possa contribuir para a prevenção do suicídio, pode significar uma vida a mais :)

136 visualizações

Posts recentes

Ver tudo

Σχόλια


bottom of page