#existepesquisanobr: as narrativas na mobilização em prol da ciência brasileira

Atualização 06/08/2018: @felipebsoares e @raquelrecuero também fizeram redes sobre o tema – clique aqui e aqui para conferir!

A última semana foi bastante agitada no cenário político brasileiro. As duas entrevistas concedidas pelo candidato Jair Bolsonaro – uma na segunda-feira, 30, para o Roda Viva; e outra na sexta-feira, 3, para a Globo News – já deram um gostinho de como será o cenário de discussão sobre os debates para as eleições presidenciáveis este ano. No meio desse caos, a notícia sobre a possível suspensão das bolsas Capes agitou ainda mais a esfera pública (digital). Em resposta, milhares de pessoas se mobilizaram através das mídias sociais em luta pela pesquisa brasileira: no Facebook, organizaram eventos/manifestações e acionaram o tema em suas imagens de perfil; no Twitter, a hashtag #existepesquisanobr viralizou.

[1/2] Tweeps, o @jairbolsonaro afirmou no @rodaviva que não temos pesquisa no Brasil. Convido a todos que divulguem suas pesquisas usando a hashtag #existepesquisanobr, explicando também porque elas são importantes. Sem briga, lacração (…)

— Alexandre Jaguar (@alexdesiqueira) August 2, 2018

Curiosamente, ela “nasceu” não em resposta direta ao corte das bolsas Capes, mas devido a um comentário de Bolsonaro na primeira entrevista citada – o tweet acima foi o primeiro a registrar a hashtag na plataforma. Um levantamento realizado pelo DAPP-FGV apontou um pico de menções sobre a Capes na tarde/noite do dia 2 de agosto, mas foi somente no dia 3, sexta-feira, praticamente 24h após o primeiro tweet, que a hashtag ganhou volume no Twitter. Além do crescimento significativo da produção de tweets, houve também a mobilização técnica-ferramental dos usuários pela causa através de retweets para demonstrar apoio e ajudar na proliferação do manifesto. Os gráficos abaixo mostram a evolução do engajamento do público tanto de maneira autoral quanto referente à manifestação em rede.

Com o sucesso da hashtag, resolvi explorar os dados para descobrir quais foram as principais áreas, temáticas e assuntos citados pelos pesquisadores acadêmicos brasileiros (com Twitter). Utilizei o TwitterScraper em Python para fazer a coleta dos tweets e processei as 6.433 mensagens no WORDij para criar uma rede semântica que pudesse ajudar nesse desafio. É importante ratificar, antes de explorá-la mais a diante, duas coisas: o script só faz a coleta de tweets originais (sem retweets) – o que faz sentido nesta análise, já que a presença de retweets pesaria o volume para tweets mais populares, enviesando a rede (a coleta setada na Netlytic registra mais de 35.000 entradas, o que indica que mais de 80% são apenas retweets); e a análise é dedicada ao conteúdo das mensagens, não às dinâmicas interacionais entre usuários.

Imagem 1 – Rede de co-ocorrência de palavras em base de 6.433 tweets com a hashtag #existepesquisanobr – 3.125 nós (palavras) 10.227 arestas [CLIQUE NA IMAGEM PARA AMPLIAR]

O grafo acima representa a rede semântica criada a partir da co-ocorrência de termos identificados na base de tweets processada com a WORDij. Os clusters (grupos coloridos) foram calculados com Modularidade 1 no Gephi e representam os termos mais conectados entre si. Os tamanhos dos nós (círculos) e suas respectivas legendas são proporcionais ao grau de conexão, ou seja, à quantidade de ligações que o termo possui na rede (quanto maior, mais frequente).

Talvez o que mais chame atenção imediatamente é o ponto fora da curva, o cluster marrom: na imagem não ficou tão nítido (não a fiz maior para que o arquivo não ficasse muito pesado), mas é um grupo bem específico de palavras em inglês que narram alguns tweets feitos como uma espécia de “denúncia” à comunidade científica internacional. Seguindo pelas margens, o grupo verde musgo (à esquerda, abaixo), também é bastante autocentrado, a partir de tweets do que parece ser um bot que retuita notícias pró-Direita e publica aleatoriamente hashtags em alta no Twitter. Esses dois clusters já dão indícios que, para além do propósito original da hashtag (divulgar suas pesquisas), ela também incorpora outras narrativas.

O cluster verde, por exemplo, traz palavras que evidenciam a utilização da hashtag como demarcador discursivo para opinar sobre a manifestação – quase unanimemente de forma positiva (elogiosa), o que pode de certa forma ser visto como um indicativo de sucesso para o propósito de divulgação das pesquisas. Situação semelhante ocorre com os clusters laranja e azul claro, quando a tag é utilizada para demarcar a discussão em críticas ao governo. É possível perceber narrativas mais abrangentes, que enquadram o assunto de maneira mais generalista (o Brasil não investe em ciência/educação); e críticas específicas, mencionando as bolsas Capes, o auxílio moradia de juízes e o corte de verbas no ensino público superior, por exemplo.

Imagem 2 – Rede de co-ocorrência de palavras em base de 6.433 tweets com a hashtag #existepesquisanobr – cluster “Meta” em destaque, representa 14,78% da rede [CLIQUE NA IMAGEM PARA AMPLIAR]

Imagem 3 – Rede de co-ocorrência de palavras em base de 6.433 tweets com a hashtag #existepesquisanobr – clusters “Governo” em destaque, representam 25,98% da rede [CLIQUE NA IMAGEM PARA AMPLIAR]

Imagem 4 – Rede de co-ocorrência de palavras em base de 6.433 tweets com a hashtag #existepesquisanobr – clusters temáticos em destaque, representam 53,5% [CLIQUE NA IMAGEM PARA AMPLIAR]

É, portanto, nos demais clusters que se encontram as informações necessárias para finalmente descobrirmos quais foram as áreas/temáticas mais frequentes na hashtag. Antes de avançar, acho importante trazer à tona, principalmente para aqueles interessados na metodologia, as condições técnicas da análise de redes como me propus a fazer. Se prestarmos atenção no cluster azul e laranja, na parte superior, há vários termos referentes aos projetos e pesquisas citados pelos usuários. Por isso, em vez de simplesmente excluir esses três grupos (verde, azul e laranja), optei por fazer uma limpeza “visual”: filtrei cada um no próprio Gephi e excluí coletivamente os termos inapropriados; em seguida, removi também os termos dos demais clusters sem muita carga informacional relevante (“pesquiso”, “estudo”, “entender”, etc.).

O resultado final você confere logo abaixo (após a limpeza, nova aplicação do layout ForceAtlas 2 e do cálculo de modularidade). Nesse cenário, vários termos aparecem às margens devido à falta de conexão com os demais – mesmo assim, preferi mantê-los no grafo para não perdermos conteúdo. No componente mais conectado, é possível (e mais fácil “de fora para dentro”) identificar algumas áreas predominantes: Ciências da Saúde, Ciências Biológicas, Ciências Sociais Aplicadas e Ciências Humanas. Quanto mais ao centro, mais difuso se tornam as conexões, o que dificulta a interpretação, mas indica também como alguns objetos e temas são interpretados em diferentes perspectivas e áreas de conhecimento. Fique à vontade para explorar a rede e descobrir mais padrões interessantes!

Imagem 5 – Rede de co-ocorrência de palavras em base de 6.433 tweets com a hashtag #existepesquisanobr após trabalho de filtragem e adequação [CLIQUE NA IMAGEM PARA AMPLIAR]

Antes de finalizar, deixo aqui as minhas (humildes) considerações sobre isso tudo: a academia está longe de ser perfeita. Muito longe. Há diversos problemas, estruturais, específicos e cotidianos. No entanto, é obrigação de todos – que, assim como eu, tiveram o privilégio de garantir uma formação numa instituição pública superior de qualidade – denunciar o desmonte que acontece há anos, quando a “cara” da academia estava, finalmente, começando minimamente a mudar. Se já mencionei em outras ocasiões aqui no blog que é preciso “derrubar” o muro da academia com o restante da sociedade, precisamos ficar atentos também à derrubada que acontece dentro desses muros.

Quanto à análise, ratifico que foi uma proposta extremamente exploratória. A minha intenção era mais trazer a pauta do debate para o blog e (finalmente) apresentar oficialmente o WORDij aqui (já que até artigo já publiquei o utilizando). Reconheço que muito provavelmente há alguns deslizes metodológicos e estou mais do que aberto à discussão e aprendizado, basta deixar um comentário aqui embaixo ou me mandar por e-mail. Tenho trabalhado bastante com redes semânticas e estou buscando estudar cada vez mais sobre o assunto para ter uma base teórica bastante sólida que sustente a metodologia adequadamente. Em breve farei outros posts de análises semelhantes para propagar conhecimento – espero – continuar aprendendo.

**Agradeço especialmente ao Toth, do Data7, pelo constante aprendizado sobre análise de redes.

Um comentário

A minha saga com Python (ou como aprendi o básico do básico) – insightee 2 de outubro de 2018

[…] O Discurso Brasileiro no Twitter sobre o Evento da Monarquia Britânica” (no prelo), que auxiliei na análise com o Wordij, teve coleta feita manualmente simplesmente porque não podíamos retornar mais de sete dias na […]

Responder

Deixe um comentário Cancelar resposta

Este site utiliza o Akismet para reduzir spam. Saiba como seus dados em comentários são processados.