Desafios para o Desafio da Natureza Urbana
Pra quem não conhece. O Desafio da Natureza Urbana (City Nature Challenge em inglês) é o evento que mais mobiliza o site do iNaturalist. O efeito dele é tamanho que ele é visível no gráfico anual do iNat ali em cima. O objetivo inicial do evento foi uma competição entre as cidades de Los Angeles e San Francisco, mas logo se disseminou por todo o mundo, gerando centenas de milhares de observações em um curto período de tempo nos últimos suspiros de Abril e primeiros respiros de Maio todos os anos.
O evento tem uma duração de 4 dias para a etapa de registros e depois 6 mais dias para identificações. Passado esse prazo tirasse um retrato dos resultados e esse retrato é considerado o resultado final do evento para cada cidade.
Só que como agora fazem parte do iNat, esses registros continuam tendo seus IDs corrigidos e melhorados após esse período e indefinidamente. É sobre esse aspecto do CNC, ou DNU como ficou conhecido no Brasil, que eu vou falar aqui.
Há uma semana foi feita uma postagem no forum do iNat sobre um código que analisa as observações de projetos e monta uma página com registros notáveis (primeiros registros para iNat, país, região, cidade, ou registros de alguma coisa com poucos registros no local feitos durante o evento).
Aplicando tal código nos projetos do City Nature Challenge do Brasil encontrei muitos registros mal identificados e ele auxiliou bastante nas correções além de cumprir seu papel original de encontrar registros realmente notáveis durante aquele evento.
Ainda assim isso levanta uma certa preocupação acerca dos dados gerados por eventos desse tipo. O intuito deles é sempre atrair mais usuários para a plataforma, mas isso acaba gerando uma quantidade de dados muito grande que leva meses e até anos para serem suficientemente revisadas pelos identificadores como você vai ver a seguir.
Para fins de exemplo apliquei o código no projeto de Curitiba desse ano e encontrei 47 erros. A maioria de espécies não encontradas na américa do sul ou no Brasil. Resolvi aplicar o código em anos anteriores no mesmo local e continuei encontrando erros que ficaram todo esse tempo sem correção... A maioria desses erros eram de observações de plantas e fungos, que são os táxons mais observados em comparação com os demais e os que tem o menor numero de especialistas, especialmente aqui na América do Sul.
Minha planilha de controle para todos os CNC de Curitiba
Exemplo de mapa de distribuição de uma espécie de líquen do hemisfério norte comumente identificado por engano por projetos CNC no hemisfério sul.
Acredito que muitos desses erros poderiam ser facilmente evitados se a equipe que organiza cada projeto fizesse um esclarecimento sobre 3 pontos importantes:
- Sobre cuidados na hora da postagem das observações;
- Sobre o que observar durante o evento;
- Sobre repetições do mesmo organismo;
...entre outras coisas
Ajudando o Computer Vision a Te Ajudar
Os usuários, especialmente os mais novos, usam muito a Visão do Computador e concordam com a identificação fornecida por ele. Nessa etapa, ajudaria E MUITO se os usuários forem instruídos a primeiro colocar o local da observação e em seguida ver o que o computador sugere. As espécies sugeridas serão limitadas ao local e, na maioria das vezes, respeitarão a distribuição normal das espécies. Não quer dizer que estarão certas, mas já ajuda bastante e evita erros grosseiros de espécies que não deveriam estar ali.
Exemplo de como a Localização ajuda a inteligência artificial
Pode-se fazer também uma palestra curta sobre identificar a nível de família ou com identificações mais elevadas como "Planta", "Besouro", etc, quando não se tem certeza do que se está observando. Algumas pessoas acham que identificando com uma especie parecida, mesmo sabendo que nao ocorre ali, vai facilitar a identificação pois alguém vem logo em seguida e corrige. Mas nem sempre é o que ocorre. Sem falar que o seu ID ficará pesando para um lado, e serão necessários 3 IDs da espécie correta para se obter o Nível de Pesquisa almejado.
O que registrar
No ímpeto de obter o máximo de observadores eu vejo que as organizações desses projetos pecam um pouco na questão de explicar o que exatamente eles devem observar. O nome do evento sugere a natureza urbana, mas o que acabamos vendo são muitos registros em zoológicos, pets, animais de produção, e de plantas claramente cultivadas. Embora nada impeça que o usuário poste tais registros e as espécies no final acabam contando mesmo sendo cativas/cultivadas. Só que os participantes quase nunca marcam essas observações como tal, o que gera mais trabalho para o pessoal que identifica.
Enfim, na minha opinião vale mais a pena registrar plantas daninhas de um terreno baldio ou até mesmo às que crescem na calçada do que registrar o vasinho de flores da vovó. Muitos identificadores não se dão o trabalho de corrigir ou marcar o ID dessas observações até porque plantas e animais exóticos não fazem parte da sua rotina de IDs.
Repetição de registro de mesmo organismo
É normal em eventos como esse do pessoal ir junto aos parques ou fazer saídas em grupo e registrar as mesmas coisas. O resultado é uma profusão do mesmo cacto, inseto, etc, geralmente no mesmo ângulo. Embora isso não seja contra as regras e cada um acabou fazendo mesmo seu próprio registro, penso que poderíamos melhorar em dois sentidos:
Se é para tirar a foto do mesmo cacto, talvez cada pessoa fazendo isso poderia tentar um ângulo diferente para que a foto pelo menos não fique a mesma do colega. Isso pode até ajudar na identificação visto que na maioria das vezes as pessoas colocam apenas uma foto por observação. Então juntando todos os ângulos da galera podemos formar um belo booking to cacto que poderá ser identificado com mais facilidade.
A segunda abordagem seria dividir o grupo grande em grupos menores que irão cobrir uma área maior (ou até áreas específicas e diferentes dos outros grupos). A desvantagem desse método é que podem não haver veteranos suficientes para explicar e controlar os grupos.
Portanto, acredito que uma breve explicação sobre o que observar e como postar já seria de grande ajuda para que esses projetos gerem não só uma boa quantidade de dados, mas também dados que são realmente úteis e alinhados com o propósito da plataforma.
Queria também deixar registrado que sempre ocorrem casos lamentáveis de usuários novos que postam observações e as identificam a nivel de espécie com a ajuda de amigos ou contas falsas. Tudo para chegar a Nível de Pesquisa e ter mais espécies possíveis no evento. Isso geralmente acontece naqueles projetos que prometem um certificado ou prêmio para aquele usuário que fizer o maior número de registros.
Devemos lembrar que o iNaturalist é um site sério que que muitos pesquisadores o utilizam para pesquisas científicas. Nada contra o sistema de certificados, até porque é um bom atrativo para os jovens de universidades que precisam dos pontos. Só é preciso deixar claro que a participação deles gera dados importantes e duradouros, pois afinal o projeto segue sempre mudando com novas identificações sendo feitas com o passar do tempo.
Outras questões
Falando agora somente do CNC 2024; não entendi o porque de haverem três projetos no RJ que se sobrepõem em sua área. No fim os dados de um acabam refletidos no outro. Apesar de isso não afetar a contagem final, faz com que quem esteja revisando os projetos tenha que revisitar observações das outras áreas. Parece que em Brasília também temos a mesma situação. Dei uma olhada em outros projetos umbrella pelo mundo e não encontrei casos parecidos. Fica então o questionamento.
Como considerações finais só queria deixar claro que os problemas que listei não são exclusivos dos CNC do Brasil. Também não quero desmerecer todo o esforço que as equipes organizadoras fazem todos os anos para mobilizar o pessoal e fazer com que o Brasil seja notado lá fora com a grande participação que sempre temos. Espero que encarem minhas ressalvas levantadas aqui como criticas construtivas e que possamos todos usufruir de futuros CNCs de maneira mais agradável.
Para terminar deixo aqui o resultado daquele código de análise aplicado em cinco dos maiores projetos do CNC no Brasil (lembrando que é um retrato do momento atual e que os registros estão sempre mudando. O evento CNC acabou, mas ainda tem muita coisa para se consertar e aprimorar).
São Paulo
Curitiba
Vale do Itajaí - SC
Rio de Janeiro
Brasília