De tempos em tempos, usuários do Twitter aderem a novas tendências ou piadinhas “internas” que, na maioria das vezes, acaba se proliferando para outros espaços da web. No final de maio deste ano, o site foi tomado pela seguinte frase: “this represents Brazil more than soccer and samba” (isso representa o Brasil mas do que futebol e samba, em tradução livre) – que vinha sempre acompanhada de uma ou mais imagens. Tudo começou com o seguinte tweet (pelo menos foi o mais antigo que consegui encontrar) do usuário @Celso_Piazzi10 que rapidamente viralizou:
Rapidamente milhares de usuários entraram na onda e começaram também a publicar imagens que, de alguma forma e/ou por algum motivo, representavam o Brasil melhor do que futebol e samba. Como era de se esperar, alguns portais de notícia/entretenimento – como o Buzzfeed, JC, Vix, Atlântida – começaram também a fazer suas próprias matérias sobre o assunto, através de curadorias que muito provavelmente levavam (apenas) em conta o número de engajamento daquelas mensagens – ou seja, quem tinha mais retweet tinha maior visibilidade.
Na época, cheguei a conversar com Toth, do Data7, que seria legal fazer algum tipo de análise que fosse além dos tweets mais engajados e olhasse aquele movimento como um todo. Ele chegou a coletar uma base para mim (e deixo aqui meu agradecimento público!), mas acabei não levando para frente. Algumas semanas atrás, relembrei dessa ideia ao descobrir o twintproject – uma ferramenta em Python para raspar tweets sem utilizar a API – e resolvi retomar esse projeto. Com a ajuda de Carol, coletamos +5.000 tweets entre maio e outubro deste ano.
Esses tweets somaram cerca de 6.000 imagens (já que alguns tweets continham mais de uma imagem em sua composição), ainda que alguns deles fossem gifs e não fossem facilmente indexado pelo script que utilizamos. Com essa base relativamente robusta, utilizamos a metodologia de análise de imagens do IBPAD a partir de uma versão adaptada do script memespector (André Mintz/Bernhard Rieder) que utiliza a Vision API do Google para fazer a leitura das imagens com inteligência artificial. A rede de imagens, produzida no Gephi, segue abaixo:
O agrupamento, como já expliquei em outro post, é feito através da correlação entre as imagens (estabelecida pelo processo de computação visual associado à aplicação de técnicas de análise de redes). Ou seja, de modo simples, imagens “semelhantes” – conforme identificadas pela inteligência artificial – ficam próximas umas das outras, resultando em agrupamentos específicos. Os 11 clusters identificados, desta vez, não foram delimitados pelo Gephi (como de costume), mas por nós mesmos. Uma breve descrição de cada um, de cima para baixo:
- Comidas: aqui, há todo o tipo de comida comum ao brasileiro – desde os famosos “PFs” até alimentos específicos, como coxinha, brigadeiro, pastel com caldo de cana, e comidas mais regionais, como açaí, cuscuz e tacacá, além de algumas bebidas (como caipirinha, corote, etc.);
- Casa & Lar: este agrupamento é composto por peças, móveis, aparelhos e decorações em geral comuns às casas brasileiras, como tipos específicos de filtro d’água, jogos de café e bordados decorativos, além de mesas de bar;
- Jeitinho Brasileiro: este foi talvez o grupo mais difícil de identificar/classificar, pois apresenta imagens que não explicitamente significam algo em comum além do famoso jeitinho brasileiro – ou seja, são gambiarras, puxadinhos, improvisações, etc.
- Animais: embora tenha rotulado de maneira generalista, este grupo é formado principalmente por cachorros (doguinhos) – com destaque para pinchers e vira-latas (e o caramelo, que acabou indo pro outro cluster);
- Natureza: aqui encontramos imagens num tom mais político/de denúncia, com fotografias de queimadas em florestas e animais mortos;
- Política/Futebol: não por coincidência logo abaixo do cluster de Natureza, este agrupamento traz imagens de políticos e – provavelmente devido à associação verde e amarela – também de futebol;
- Notícias/Cotidiano: assim como Jeitinho Brasileiro, este também foi um agrupamento bem difícil de ser identificado, mas que chegamos ao consenso de que se trata de imagens de notícias/acontecimentos e cotidiano geral da realidade brasileira conforme narrada midiaticamente;
- Textos: este agrupamento é formado principalmente por imagens com textos (como prints), o que dificulta sua compreensão, mas direciona se relaciona com Notícias/Cotidiano e abre alas para o cluster seguinte;
- Memes: este é possivelmente o cluster mais diverso/confuso de toda a rede, no entanto, assim como o Jeitinho Brasileiro e Notícias/Cotidiano, temos aqui um exemplo de o quão a inteligência artificial pode ser eficaz para esse tipo de análise, visto que esse agrupamento corresponde às atribuições específicas de “internet meme” – onde temos Gretchen, Inês Brasil, Faustão e Selena Gomez, etc.;
- Música: outro exemplo de eficácia da IA, visto que agrupou as imagens não pela sua composição de objetos (pessoas, por exemplo), mas pela sua classificação mais geral – são capas de álbuns de música ou outras associações a cantores/bandas;
- TV/Cinema: o mesmo acontece neste grupo, com imagens de produções audiovisuais como filmes (Bacurau, O Auto da Compadecida, Minha Mãe É Uma Peça), novelas (Avenida Brasil, Vale Tudo) e programas em geral (Caldeirão do Huck, A Grande Família, Malhação).
Vale muito a pena fazer o download de imagem completa para navegar por toda a rede com mais minúcia e descobrir (se divertir também, mas cuidado para não travar o computador pois são 25mb de arquivo) com a criatividade dos usuários do Twitter. Além do mais, por mais que esses agrupamentos sirvam de análise geral do que compôs esse movimento, a curiosidade de cada imagem é ainda mais rica e vale por si só todo um debate – aqui, se uma imagem vale mais que mil palavras, temos 6 milhões de palavras para discutir.
E é com esse gancho que pretendemos, eu e Carol, produzir alguns artigos sobre essa análise. Além de essa discussão geral com os próprios resultados apresentados aqui (com mais detalhes e todo aprofundamento teórico-conceitual exigido pela academia), há algumas discussões já pensadas e possíveis para adiante: como será que usuários de diferentes regiões publicaram sobre o “seu” Brasil? Levando em consideração engajamento, quais temáticas prevaleceram? Quais são os benefícios e limitações da computação visual nesse processo? Fica aberta toda a discussão.