TCC de Inteligencia Artificla e Feminicidio

Oi, me chamo Thiago, Noda pros intimos, e cara estou naquela época terrivel de fim de faculdade, o maldito TCC. Eu estou escrevendo meu TCC sobre como a Inteligencia Artificial poderia indentificar casos de feminicio em potencial. Eu acho um tema fascinante e recebo muitos elogios, mas infelizmente eu to empacando e não estou conseguindo avançar muito na parte prática, que é desenvolver o algoritmo.

Quais dados usar e onde encontrá-los

Ando bastante preocupado com isso, pois simplesmente esses tipos de dados são horriveis de encontrar, por serem sensiveis. Já tentei contatar ONGs para me ajudar porém sem sucesso. Minha professora já foi pedir para uma colega do doutorado dela se conseguia esses dados mas não obtive retorno, ou seja, está bem dificil essa minha procura. Encontrei algum dado disso? Sim, porém não são padronizados, que vai deixar minha aplicação mais inconstante e mal treinada.

Conclusão

Esse post é um post de ajuda mesmo pois estou a um passo de mudar de tema e jogar tudo que já fiz da parte escrita fora.

Boa tarde, Thiago ! É um tema complexo de fato na minha opinião, porém eu sugiro de início você limitar o termo a cenários específicos, Feminicídio tem várias definições até mesmo na legislação se você for usar a Lei Maria da Penha como critério e usar o termo como quando o Feminicídio ocorre em ambiente doméstico por exemplo morte pelo cônjuge. Eu sugiro você dar uma olhada nos dados do IPEA (Instituto de Pesquisa Econômica aplicada) lá tem algumas análise sobre violência e dividida em grupos e os dados utilizados como base.

Tem o Sistema de Informação sobre Mortalidade – SIM no openDatasus esse tem um arquivo com a estrutura dos dados facilitando como você vai organizar. São dados mais brutos mais tem que validar como é feito a descrição dos óbitos, assim você poderia limitar os óbitos a grupos específicos.

O conselho nacional de justiça tem alguns dados que podem auxiliar sobre medidas protetivas no caso de crimes contra mulher se você conseguir estabelecer um ponto em comum nesses dados a partir do que é disponibilizado acho que ajudaria bastante.

Acredito que você passara um bom tempo tratando e analisando os dados já que não deve ter tudo junto num lugar só. Se você encontrar algum artigo ou trabalho acadêmico sobre o tema pode encontrar mais fontes de dados até mesmo tratadas.

Acredito que a dificuldade maior é encontrar dados sobre denúncias já que você quer tentar encontrar Feminicídios em potencial pode partir do princípio que ouve denúncias ou vai ter que usar algum estudo sobre violência contra mulher para retirar algumas métricas.

Você pode tentar encontrar mais informações em alguma delegacia da mulher, eles podem te informar sobre uma fonte com dados mais específicos.

Não tenho muito conhecimento a respeito do tema mais tentei caminhar por onde eu penso que seria um caminho espero ter ajudado ao menos um pouco também estou nessa fase de criação do TCC. Boa sorte no seu trabalho.

Cara é realmente um tema complicado, mas eu tenho um sentimento dentro de mim que grita para fazer aplicações que ajudem o social, mesmo sendo contrário ao mercado que estamos infelizmente. Obrigado pelas dicas :)

A questão de dados sensíveis nesse assunto é realmente muito importante, pois o ideal é que não haja meios de identificar as vitimas, pois isso poderia piorar a situação delas.

Entretanto, existem bastante dados e estatisticas sobre violência disponíveis no Brasil, todos anonimizados. O caminho ideal pra você, seria utilizar esses dados, e tentar encontrar uma correlação entre eles, que possibilite identificar os casos em potêncial. E nesse caso, de identificar casos potênciais, acredito que o melhor que poderia fazer seria identificar regiões/bairros que aprensentam maior risco, pois chegar diretamente na pessoa em risco através de uma IA poderia gerar muitos outros problemas, enquanto que se conseguir indicar localidades com esse potêncial, poderia ser direcionado ações para a localidade em questão, na expectativa de aumentar a prevenção.

Com relação aos dados, esse site possui bastante coisa: https://www.ipea.gov.br/atlasviolencia/ Você deve encontrar informações no https://dados.gov.br/home também... E se você entrar nos sites da Secretaria de Segurança Publica (SSP) ou Instituto de Segurança Publica (ISP) de cada estado, você deve encontrar dados também.

No geral, os dados não seguirão um padrão ou formato específico, então caberá a você identificar as informações importantes, tratar isso e montar a massa de dados que você usará para treinar e testar o teu modelo. E se você tratar esses dados corretamente, isso não deixará teu modelo pior ou inconsistente, inclusive, o tratamento dos dados é um passo fundamental para que você possa criar um modelo bom.

Nessa questão de tratamento de dados, acredito que o mais fácil seria, primeiramente, conseguir a maior quantidade de dados possível. Feito isso, você deve verificar o que esses dados possuem em comum, tendo isso, o ideal seria você utilizar apenas as informações presentes em todas as tuas fontes e, obviamente, que façam sentido a sua utilização. Por exemplo, todas as tuas fontes possuem: cidade, bairro, tipo de crime, quantidade de crimes, genero da vitima, indicador social da vitima, indicador social do criminoso. Nesse caso, você poderia unificar todos esses dados em um dataframe, e utilizar ele para encontrar a correlação entre os crimes que acontecem numa região e o quanto isso impacta ou aumenta na probabilidade de ocorrer um feminicidio...

Enfim, são muitas possibilidades, e exige um trabalho razoável para você alcançar um resultado que represente a realidade...

Boa sorte, e bom trabalho!

Cara muito obrigado por compartilhar esses links. Já comecei a dar uma olhada e embora não tenha precisamente os dados que eu quero, é mais dados para a conta então, muito obrigado mesmo :)

Olá, Acredito que a falta de dados venha exatamente pela falta de interesse em reunir eles e divulga-los.

Mas volta e meia aparecem notícias que postam números de feminicídio, e provavelmente deve ter uma fonte ou uma bibliografia para isso, que pode ter esses dados.

Outra coisa é quem sabe as instituições internacionais, seja américa latina ou da europa e etc. Quem sabe a ONU não tem alguns desses dados?

Imagino que caso não tenha dados diretamente por uma API, pode ser realizado um webscrapping. E ir pesquisando em sites de notícias ou que apresentam esses dados mas de forma não tão organizada.

Quem sabe podes talvez moldar teu TCC a outras coisas. Como criar uma API que integra esses dados sobre feminicídio e possibilite que outras pessoas possam colaborar com pesquisas voltadas ao tema.

Enfim, apenas algumas ideias. Mas é um tema extremamente interessante e que bom que tem pessoas te incentivando e ajudando, fica com elas.

Irmão, o meu TCC foi nessa pegada. Mas na verdade é na produção jornalistica usando IA

Esse é o link para meu tcc: https://sauloferromaciel.onlyoffice.com/s/4d69zKzfTG_BgX8

Fico meio repartido com essa ideia.

De um lado pode dar muito certo e proteger contra casos de feminicídio, mas dependendo de como for pode também acarretar uma correlação espúria fazendo com que diversas pessoas sejam previamente presas por umapossível falsa ocorrência.

Dependendo de como a IA está configurada e sobre qual temperatura está sendo executada, isso tirando o caso citado pelo @PG2699 que é complicado definir claramente o que é feminicídio e sobre quais termos a IA vai ser modelada.

Levando em conta dados das vítimas e o nível de exposição que as mesmas poderiam ter, mas se conseguir passar por todos esses problemas eu vejo um grande futuro nesse projeto.

Instrui a AI a relacionar termos chaves, como: O traficante; O cara que tem 1000 passagens; O noiado do bairro; O que tem comportamento agressivo; O que tem tatuagem de palhaço; Etc.

Em cima de relatos reais, como:

O traficante;

  • Deixa a dondoca careca
  • Se trair, caixão fechado e vela preta
  • Se o garanhão for preso tem que ir na cadeia
  • Se terminar, caixão fechado e vela preta

O cara que tem 1000 passagens;

  • Se olhar pro lado vira dummy pra treino de UFC
  • ...

O noiado do bairro;

  • Vai assinar de brinde uma passagem no Art. 33 da Lei 11.343/06
  • ...

Não é muito difícil, são fatos óbvios. É possível até utilizar um graph database para enriquecer ainda mais a pesquisa.