Atualização 06/08/2018: @felipebsoares e @raquelrecuero também fizeram redes sobre o tema – clique aqui e aqui para conferir!
A última semana foi bastante agitada no cenário político brasileiro. As duas entrevistas concedidas pelo candidato Jair Bolsonaro – uma na segunda-feira, 30, para o Roda Viva; e outra na sexta-feira, 3, para a Globo News – já deram um gostinho de como será o cenário de discussão sobre os debates para as eleições presidenciáveis este ano. No meio desse caos, a notícia sobre a possível suspensão das bolsas Capes agitou ainda mais a esfera pública (digital). Em resposta, milhares de pessoas se mobilizaram através das mídias sociais em luta pela pesquisa brasileira: no Facebook, organizaram eventos/manifestações e acionaram o tema em suas imagens de perfil; no Twitter, a hashtag #existepesquisanobr viralizou.
[1/2] Tweeps, o @jairbolsonaro afirmou no @rodaviva que não temos pesquisa no Brasil. Convido a todos que divulguem suas pesquisas usando a hashtag #existepesquisanobr, explicando também porque elas são importantes. Sem briga, lacração (…)
— Alexandre Jaguar (@alexdesiqueira) August 2, 2018
Curiosamente, ela “nasceu” não em resposta direta ao corte das bolsas Capes, mas devido a um comentário de Bolsonaro na primeira entrevista citada – o tweet acima foi o primeiro a registrar a hashtag na plataforma. Um levantamento realizado pelo DAPP-FGV apontou um pico de menções sobre a Capes na tarde/noite do dia 2 de agosto, mas foi somente no dia 3, sexta-feira, praticamente 24h após o primeiro tweet, que a hashtag ganhou volume no Twitter. Além do crescimento significativo da produção de tweets, houve também a mobilização técnica-ferramental dos usuários pela causa através de retweets para demonstrar apoio e ajudar na proliferação do manifesto. Os gráficos abaixo mostram a evolução do engajamento do público tanto de maneira autoral quanto referente à manifestação em rede.
Com o sucesso da hashtag, resolvi explorar os dados para descobrir quais foram as principais áreas, temáticas e assuntos citados pelos pesquisadores acadêmicos brasileiros (com Twitter). Utilizei o TwitterScraper em Python para fazer a coleta dos tweets e processei as 6.433 mensagens no WORDij para criar uma rede semântica que pudesse ajudar nesse desafio. É importante ratificar, antes de explorá-la mais a diante, duas coisas: o script só faz a coleta de tweets originais (sem retweets) – o que faz sentido nesta análise, já que a presença de retweets pesaria o volume para tweets mais populares, enviesando a rede (a coleta setada na Netlytic registra mais de 35.000 entradas, o que indica que mais de 80% são apenas retweets); e a análise é dedicada ao conteúdo das mensagens, não às dinâmicas interacionais entre usuários.

O grafo acima representa a rede semântica criada a partir da co-ocorrência de termos identificados na base de tweets processada com a WORDij. Os clusters (grupos coloridos) foram calculados com Modularidade 1 no Gephi e representam os termos mais conectados entre si. Os tamanhos dos nós (círculos) e suas respectivas legendas são proporcionais ao grau de conexão, ou seja, à quantidade de ligações que o termo possui na rede (quanto maior, mais frequente).
Talvez o que mais chame atenção imediatamente é o ponto fora da curva, o cluster marrom: na imagem não ficou tão nítido (não a fiz maior para que o arquivo não ficasse muito pesado), mas é um grupo bem específico de palavras em inglês que narram alguns tweets feitos como uma espécia de “denúncia” à comunidade científica internacional. Seguindo pelas margens, o grupo verde musgo (à esquerda, abaixo), também é bastante autocentrado, a partir de tweets do que parece ser um bot que retuita notícias pró-Direita e publica aleatoriamente hashtags em alta no Twitter. Esses dois clusters já dão indícios que, para além do propósito original da hashtag (divulgar suas pesquisas), ela também incorpora outras narrativas.
O cluster verde, por exemplo, traz palavras que evidenciam a utilização da hashtag como demarcador discursivo para opinar sobre a manifestação – quase unanimemente de forma positiva (elogiosa), o que pode de certa forma ser visto como um indicativo de sucesso para o propósito de divulgação das pesquisas. Situação semelhante ocorre com os clusters laranja e azul claro, quando a tag é utilizada para demarcar a discussão em críticas ao governo. É possível perceber narrativas mais abrangentes, que enquadram o assunto de maneira mais generalista (o Brasil não investe em ciência/educação); e críticas específicas, mencionando as bolsas Capes, o auxílio moradia de juízes e o corte de verbas no ensino público superior, por exemplo.



O resultado final você confere logo abaixo (após a limpeza, nova aplicação do layout ForceAtlas 2 e do cálculo de modularidade). Nesse cenário, vários termos aparecem às margens devido à falta de conexão com os demais – mesmo assim, preferi mantê-los no grafo para não perdermos conteúdo. No componente mais conectado, é possível (e mais fácil “de fora para dentro”) identificar algumas áreas predominantes: Ciências da Saúde, Ciências Biológicas, Ciências Sociais Aplicadas e Ciências Humanas. Quanto mais ao centro, mais difuso se tornam as conexões, o que dificulta a interpretação, mas indica também como alguns objetos e temas são interpretados em diferentes perspectivas e áreas de conhecimento. Fique à vontade para explorar a rede e descobrir mais padrões interessantes!

Quanto à análise, ratifico que foi uma proposta extremamente exploratória. A minha intenção era mais trazer a pauta do debate para o blog e (finalmente) apresentar oficialmente o WORDij aqui (já que até artigo já publiquei o utilizando). Reconheço que muito provavelmente há alguns deslizes metodológicos e estou mais do que aberto à discussão e aprendizado, basta deixar um comentário aqui embaixo ou me mandar por e-mail. Tenho trabalhado bastante com redes semânticas e estou buscando estudar cada vez mais sobre o assunto para ter uma base teórica bastante sólida que sustente a metodologia adequadamente. Em breve farei outros posts de análises semelhantes para propagar conhecimento – espero – continuar aprendendo.
**Agradeço especialmente ao Toth, do Data7, pelo constante aprendizado sobre análise de redes.
[…] O Discurso Brasileiro no Twitter sobre o Evento da Monarquia Britânica” (no prelo), que auxiliei na análise com o Wordij, teve coleta feita manualmente simplesmente porque não podíamos retornar mais de sete dias na […]