Quando fui informado que mais de um milhão de animais são atropelados por dia no Brasil, não acreditei. É isso mesmo. Um milhão de animais! Por dia! Confesso que, para ter certeza que era verdade, fui buscar fontes científicas que abordassem essa questão e, infelizmente, comprovei a veracidade do fato. Além da grave questão ambiental, devido à morte de espécies, muitas vezes em situação de ameaça, não podemos esquecer os riscos provocados a nós, humanos. Inúmeros atropelamentos de animais, especialmente os de grande porte, geram acidentes com vítimas fatais.
Há diversas ações que podem ser desenvolvidas para dirimir esse problema: colocação de placas de aviso, construção de passagens subterrâneas, criação de viadutos para passagem dos animais (os chamados viadutos verdes), ou a instalação de cercas de proteção, entre outras iniciativas. Essas ações possuem custos evidentemente. Imagine, por exemplo, cercar toda uma rodovia. Além disso, alguns empreendimentos podem gerar efeitos sobre algumas espécies de animais, mas não surtir efeito sobre outras. Por exemplo, viadutos verdes podem não fazer sentido quando se trata do atropelamento de aves.
Considerando essas diversas questões, imagine o potencial de utilizar a ciência de dados para responder a questões como: Quais são os locais com maior ocorrência de atropelamentos? E para determinada espécie, onde há mais incidentes? Em quais horários do dia? Em quais situações (por exemplo, ocorrência de chuva, vazamento de carga de caminhões)? Em que períodos do ano? Quais as características dos locais com maior tendência (número de pistas, pavimento, velocidade máxima, …) e em seu entorno (tipo de vegetação, existência de rios, …)?
Pensando nisso, sob a liderança da professora Cecília Bueno, grande especialista no tema, venho participando de algumas iniciativas visando à geração de informações que possam apoiar à tomada de decisão quanto a ações a serem desenvolvidas em algumas rodovias. Em um primeiro momento estamos trabalhando com o trecho Rio de Janeiro – Juiz de Fora da BR-040, uma vez que a professora Cecilia já faz um trabalho robusto de coleta de dados de atropelamento lá. A ideia é criar modelos de Aprendizagem de Máquina (Machine Learning) para identificação de tendências ligadas ao atropelamento de fauna e que possam responder às questões anteriormente apresentadas. Escolhemos, a princípio, trabalhar com a espécie capivara, devido ao seu porte e às consequências geradas pelos acidentes as envolvendo. A estratégia usada foi consolidar todos os registros de atropelamento, de todos os animais, em uma base única e, dentro dessa base, criar uma nova variável (alvo) que identificasse se o animal era ou não uma capivara. A partir daí, foram construídos alguns modelos classificatórios (Naive Bayes, Árvore de Decisão e Redes Neurais, além de alguns modelos usando Métodos de Grupo – Ensemble Methods). Os resultados em termos de precisão desses modelos foram avaliados, com a escolha do modelo mais preciso para apresentação das tendências observadas.
Entre diversas tendências ligadas aos atropelamentos, foram identificados alguns trechos específicos da rodovia, o limite máximo de velocidade, a não existência de florestas perto desses locais e a existência de água (rios ou córregos) em regiões próximas. Essas informações poderão apoiar a definição de ações a serem realizadas, no intuito de dirimir o problema no futuro.
Mais uma vez podemos constatar o potencial de uso da ciência de dados para apoiar a solução de problemas ligados ao meio ambiente. Meu próximo artigo falará sobre cidades inteligentes, com foco na gestão de resíduos, mais especificamente os resíduos orgânicos. Até lá!!

Anderson Namen é cofundador e cientista de dados da Digital Innovation Consulting Group, empresa focada em ajudar outras empresas a habilitar o digital como um importante impulsionador de negócios em vários setores da economia. Doutor em Engenharia de Sistemas e Computação pela COPPE/UFRJ, possui experiência de mais de 30 anos, tendo liderado projetos inovadores em diferentes organizações. Seu foco se concentra primordialmente em projetos englobando ciência de dados e sistemas de suporte à decisão. Atua também como professor de graduação e programas de pós-graduação na Universidade do Estado do Rio de Janeiro e na Universidade Veiga de Almeida.
Desenvolve há mais de 10 anos projetos ligados ao meio ambiente, envolvendo a análise da biodiversidade e suas relações com o clima, além da gestão e monitoramento de fauna. Na área de gestão de resíduos sólidos, teve projeto de rastreabilidade de resíduos perigosos selecionado entre os 3 melhores projetos ligados ao meio ambiente, sendo premiado no RFID Journal Green Awards, evento patrocinado pelo mais conhecido jornal focado em tecnologia RFID no mundo. Atualmente coordena projeto de aplicação de Inteligência Artificial para gestão de resíduos orgânicos, patrocinado pela Faperj, que envolve 8 diferentes organizações públicas e privadas, entre elas Embrapa, UFF, UERJ e Universidade Veiga de Almeida.
Liderou diversos projetos na área de educação, utilizando dados do INEP/MEC para previsão de resultados relacionados ao processo ensino-aprendizagem de estudantes do ensino básico. Também atou no planejamento e elaboração de currículos para o ensino superior e na criação de sistemas de apoio à decisão focados na experiência do aluno. Ainda na área de educação, liderou equipe transdisciplinar para criação de recursos de on-line focados nos diferentes estilos de aprendizagem dos estudantes, sendo agraciado com premiação pelo desenvolvimento de melhor disciplina on-line entre 15 diferentes instituições de ensino superior na América Latina.
Atuou durante 25 anos como diretor da empresa E3A Educação e Assessoria, tendo desenvolvido projetos de consultoria para empresas como Furnas Centrais Elétricas, Fundação Getúlio Vargas e Universidade Veiga de Almeida. Anteriormente, trabalhou nas empresas Mesbla Lojas de Departamentos e IBM Brasil, sendo reconhecido nessa última com 3 prêmios de contribuição significativa ao negócio.