Tag: análise de imagens

O Brasil segundo o Twitter em 6 mil imagens

De tempos em tempos, usuários do Twitter aderem a novas tendências ou piadinhas “internas” que, na maioria das vezes, acaba se proliferando para outros espaços da web. No final de maio deste ano, o site foi tomado pela seguinte frase: “this represents Brazil more than soccer and samba” (isso representa o Brasil mas do que futebol e samba, em tradução livre) – que vinha sempre acompanhada de uma ou mais imagens. Tudo começou com o seguinte tweet (pelo menos foi o mais antigo que consegui encontrar) do usuário @Celso_Piazzi10 que rapidamente viralizou:

Rapidamente milhares de usuários entraram na onda e começaram também a publicar imagens que, de alguma forma e/ou por algum motivo, representavam o Brasil melhor do que futebol e samba. Como era de se esperar, alguns portais de notícia/entretenimento – como o Buzzfeed, JC, Vix, Atlântida – começaram também a fazer suas próprias matérias sobre o assunto, através de curadorias que muito provavelmente levavam (apenas) em conta o número de engajamento daquelas mensagens – ou seja, quem tinha mais retweet tinha maior visibilidade.

Na época, cheguei a conversar com Toth, do Data7, que seria legal fazer algum tipo de análise que fosse além dos tweets mais engajados e olhasse aquele movimento como um todo. Ele chegou a coletar uma base para mim (e deixo aqui meu agradecimento público!), mas acabei não levando para frente. Algumas semanas atrás, relembrei dessa ideia ao descobrir o twintproject – uma ferramenta em Python para raspar tweets sem utilizar a API – e resolvi retomar esse projeto. Com a ajuda de Carol, coletamos +5.000 tweets entre maio e outubro deste ano.

Esses tweets somaram cerca de 6.000 imagens (já que alguns tweets continham mais de uma imagem em sua composição), ainda que alguns deles fossem gifs e não fossem facilmente indexado pelo script que utilizamos. Com essa base relativamente robusta, utilizamos a metodologia de análise de imagens do IBPAD a partir de uma versão adaptada do script memespector (André Mintz/Bernhard Rieder) que utiliza a Vision API do Google para fazer a leitura das imagens com inteligência artificial. A rede de imagens, produzida no Gephi, segue abaixo:

"this represents brazil more than soccer and samba"
Clique aqui para ver a imagem no tamanho original

O agrupamento, como já expliquei em outro post, é feito através da correlação entre as imagens (estabelecida pelo processo de computação visual associado à aplicação de técnicas de análise de redes). Ou seja, de modo simples, imagens “semelhantes” – conforme identificadas pela inteligência artificial – ficam próximas umas das outras, resultando em agrupamentos específicos. Os 11 clusters identificados, desta vez, não foram delimitados pelo Gephi (como de costume), mas por nós mesmos. Uma breve descrição de cada um, de cima para baixo:

  • Comidas: aqui, há todo o tipo de comida comum ao brasileiro – desde os famosos “PFs” até alimentos específicos, como coxinha, brigadeiro, pastel com caldo de cana, e comidas mais regionais, como açaí, cuscuz e tacacá, além de algumas bebidas (como caipirinha, corote, etc.);
  • Casa & Lar: este agrupamento é composto por peças, móveis, aparelhos e decorações em geral comuns às casas brasileiras, como tipos específicos de filtro d’água, jogos de café e bordados decorativos, além de mesas de bar;
  • Jeitinho Brasileiro: este foi talvez o grupo mais difícil de identificar/classificar, pois apresenta imagens que não explicitamente significam algo em comum além do famoso jeitinho brasileiro – ou seja, são gambiarras, puxadinhos, improvisações, etc.
  • Animais: embora tenha rotulado de maneira generalista, este grupo é formado principalmente por cachorros (doguinhos) – com destaque para pinchers e vira-latas (e o caramelo, que acabou indo pro outro cluster);
  • Natureza: aqui encontramos imagens num tom mais político/de denúncia, com fotografias de queimadas em florestas e animais mortos;
  • Política/Futebol: não por coincidência logo abaixo do cluster de Natureza, este agrupamento traz imagens de políticos e – provavelmente devido à associação verde e amarela – também de futebol;
  • Notícias/Cotidiano: assim como Jeitinho Brasileiro, este também foi um agrupamento bem difícil de ser identificado, mas que chegamos ao consenso de que se trata de imagens de notícias/acontecimentos e cotidiano geral da realidade brasileira conforme narrada midiaticamente;
  • Textos: este agrupamento é formado principalmente por imagens com textos (como prints), o que dificulta sua compreensão, mas direciona se relaciona com Notícias/Cotidiano e abre alas para o cluster seguinte;
  • Memes: este é possivelmente o cluster mais diverso/confuso de toda a rede, no entanto, assim como o Jeitinho Brasileiro e Notícias/Cotidiano, temos aqui um exemplo de o quão a inteligência artificial pode ser eficaz para esse tipo de análise, visto que esse agrupamento corresponde às atribuições específicas de “internet meme” – onde temos Gretchen, Inês Brasil, Faustão e Selena Gomez, etc.;
  • Música: outro exemplo de eficácia da IA, visto que agrupou as imagens não pela sua composição de objetos (pessoas, por exemplo), mas pela sua classificação mais geral – são capas de álbuns de música ou outras associações a cantores/bandas;
  • TV/Cinema: o mesmo acontece neste grupo, com imagens de produções audiovisuais como filmes (Bacurau, O Auto da Compadecida, Minha Mãe É Uma Peça), novelas (Avenida Brasil, Vale Tudo) e programas em geral (Caldeirão do Huck, A Grande Família, Malhação).

Vale muito a pena fazer o download de imagem completa para navegar por toda a rede com mais minúcia e descobrir (se divertir também, mas cuidado para não travar o computador pois são 25mb de arquivo) com a criatividade dos usuários do Twitter. Além do mais, por mais que esses agrupamentos sirvam de análise geral do que compôs esse movimento, a curiosidade de cada imagem é ainda mais rica e vale por si só todo um debate – aqui, se uma imagem vale mais que mil palavras, temos 6 milhões de palavras para discutir.

E é com esse gancho que pretendemos, eu e Carol, produzir alguns artigos sobre essa análise. Além de essa discussão geral com os próprios resultados apresentados aqui (com mais detalhes e todo aprofundamento teórico-conceitual exigido pela academia), há algumas discussões já pensadas e possíveis para adiante: como será que usuários de diferentes regiões publicaram sobre o “seu” Brasil? Levando em consideração engajamento, quais temáticas prevaleceram? Quais são os benefícios e limitações da computação visual nesse processo? Fica aberta toda a discussão.

A imagem dos nordestinos e do Nordeste segundo o Google

Quando você pensa em Nordeste e/ou em nordestinos, o que vêm à sua cabeça? Quais referências visuais primeiro vêm à mente? Como pessoas inseridas na cultura brasileira, temos no nosso imaginário social uma série de signos aos quais podemos associar o “ser nordestino”. Segundo Albuquerque Júnior (199, p. 307), o Nordeste “é uma cristalização de estereótipos que são subjetivados como característicos do ser nordestino […]”, através de verdades instituídas “repetidas ad nauseum, seja pelos meios de comunicação, pelas artes, seja pelos próprios habitantes de outras áreas do país e da própria região”.

Na obra “A invenção do Nordeste”, o historiador Durval Muniz de Albuquerque Jr. explora toda a complexidade e historicidade sob os quais se basearam a construção desse espaço inventado. Nessa citação específica, já adianta algumas constatações importantes: 1) o Nordeste e a “nordestinidade” é uma construção social e histórica; 2) criada em cima do apagamento das particularidades de cada estado; 3) cuja operação foi/é praticada através da repetição discursiva; 4) de produtos culturais-midiáticos e; 5) consequentemente, tanto por cidadãos da própria região quanto daqueles de outros lugares do Brasil.

No meu TCC, explorei principalmente as questões de número 1 – através de uma breve porém responsável revisão de literatura e fundamentação teórica – e 5 – com questionário respondido por pessoas cuja identidade nordestina era explorada com mais veemência no Facebook. Para o meu projeto de mestrado, pretendo seguir explorando a questão 1 e, desta vez, desenvolver melhor as questões 2, 3 e 4 – ou seja, para além de trabalhar diretamente com as pessoas e como elas enxergam essa associação identitária, tentar compreender como os discursos – de modo geral – estão em disputa e operam midiática e culturalmente.

Como um dos primeiros experimentos desse trabalho contínuo, decidi averiguar empiricamente o que Albuquerque Jr. chamou de “cristalização de estereótipos”. Alguns esforços acadêmicos foram produzidos nesse sentido, analisando, por exemplo, a representação do Nordeste em capas de revista; ou nas artes como na literatura, cinema e música. No entanto, esses trabalhos geralmente focam no discurso textual (pela facilidade de interpretação) e em produtos pré-digitais. Uma das minhas propostas para o mestrado é justamente trazer essa discussão para a era da internet, em que novas dinâmicas de poder estão em jogo.

A começar, por tanto, pelo site mais acessado do Brasil e do mundo: o Google. Achei que seria interessante explorar a representação do Nordeste a partir de imagens do Google. No entanto, antes de seguir para a análise, é importante entender como funciona, de modo simples, o mecanismo do Google para não partirmos da suposição errônea de que é a própria plataforma que ativa esses conteúdos ou que há profissionais selecionando/fazendo a curadoria dessas imagens. E ninguém melhor para explicar sobre como isso funciona do que o próprio CEO do Google, Sundar Pichai, em depoimento judicial:

Nesse vídeo, Pichai explica por que, quando a deputada Zoe Lofgren pesquisara no Google Images o termo “idiota”, aparecia a imagem de Donald Trump. Pichai explica que a ferramenta faz uma raspagem de bilhões de páginas da web indexadas na plataforma à procura do termo, para depois ranqueá-las com base em mais de 200 critérios, como relevância, ineditismo, popularidade, como as pessoas estão utilizando, etc. e apresentar os melhores resultados de acordo. Ou seja, há um esforço técnico-algorítmico do próprio Google, mas a essência (a fonte de dados, literalmente) são os próprios usuários de internet.

É óbvio que isso é extremamente complexo e não tão simples quanto a resposta (devido ao contexto) explicou. Vários pesquisadores já têm se debruçado sobre a imparcialidade dos algoritmos e das tecnologias de aprendizado de máquina e inteligência artificial, para principalmente não fugirmos da responsabilização das empresas de tecnologia quanto à manutenção de preconceitos de gênero e raça. Neste experimento específico, esse parênteses – importantíssimo – pode ser compreendido também na construção (e manutenção) dos estereótipos, que mesmo proferidos pelos próprios moradores da região, continuam sendo estereótipos.

Análise: +3.000 imagens sobre nordestinos no Google

Como o Google tem um limite de exibição de resultados para imagens, fiz a coleta com algumas pequenas alterações de termos: nordestino, nordestina, nordestinos, nordestinas e nordeste; ao total, foram 3.684 imagens coletadas (com o DownThemAll!) – após limpeza de URLs duplicados, finalizei com 3.135 imagens. Para fazer a análise das imagens, utilizei a mesma metodologia desenvolvida para este relatório, com a API de análise de conteúdo de imagens do próprio Google e os scripts em Python desenvolvidos por André Mintz para esforços de computação visual com auxílio de técnicas de análise de redes. Clique na imagem abaixo para ver o resultado em tamanho maior:

Ao todo, consegui identificar pelo menos 23 territórios imagéticos: culinária, bebidas, mercadinhos, denúncias, política, artesanato, produtos gráficos I e II, símbolos culturais, natureza, pessoas, cavalgada, vestimentas de couro, música I e II, mapas, apresentações artísticas, multidões/festejos, futebol, paisagens urbanas I e II, paisagens praianas e paisagens do sertão. Importante lembrar, no entanto, que essas divisões foram feitas a partir da minha interpretação; a disposição espacial das imagens se reúnem (e se afastam) pela semelhança identificada através da API de análise de imagens do Google, posteriormente organizada em rede.

Isso significa que não há – de nenhuma forma – imparcialidade na análise. Há recortes arbitrários feitos tanto pela ferramenta de inteligência artificial (e por isso é importante questioná-las, estressá-las, etc.), quanto do formato espacial que optei por dispor as imagens quanto pela minha própria leitura do produto resultante. Para comentar algumas questões possivelmente interessantes sobre o resultado, separei (novamente, do jeito que achei mais propício) os 23 territórios em oito categorias – que atravessam umas às outras de vários modos, cuja delimitação é exclusivamente didática:

Culinária e bebidas

Era de se esperar que a culinária nordestina fosse receber uma atenção considerável no Google. É possível identificar pratos típicos como cuscuz, macaxeira, bolo de rolo, caranguejo, moqueca, feijoada, carne do sol, acarajé, pamonha e até queijinho na brasa. Talvez o mais interessante nesse grupo, entretanto, são dois bolos decorativos com elementos “típicos” como dois bonequinhos de cangaceiros e um chapéu de couro, além de xilogravuras. Esse que também aparece nas bebidas, em propaganda da Brahman; mas cujo destaque são as cachaças e o famoso Guaraná Jesus.

Denúncias

Importante para lembrar que o “local” da análise interfere nos resultados é o grupo que chamei de Denúncias. Tratam-se de capturas de tela de mensagens preconceituosas feitas contra nordestinos nos últimos anos. Especialmente em época de eleições, é bastante comum que isso aconteça e alguns jornais/blogs noticiam o ocorrido (depois de as mensagens se proliferarem na rede em forma de denúncia geralmente por usuários comuns). Com a divulgação das notícias, as imagens acabam sendo indexadas pela plataforma.

Produtos gráficos,
símbolos culturais e mapas

E como nem só de fotos vive a internet, vale falar também desses grupos semelhantes. Com exceção dos Mapas (fruto provavelmente do termo “nordeste” na coleta), os outros três são produções gráficas digitais (banners, panfletos, montagens, etc.) que, em grande maioria, trazem alguma simbologia explícita já associada à cultura nordestina – como o chapéu de couro, por exemplo, presente em outros grupos. Ademais, os formatos de ilustração tipo xilogravura, o paisagismo do sertão e até alguns escolhas de tipografia.

Música, apresentações artísticas
e multidões/festejos

Outro grupo cujos signos ficam também em bastante evidência – e se complementam: em Música (I e II), instrumentos como zabumba, sanfona e triângulo; em Apresentações Artísticas, os figurinos do cangaço e roupas tradicionais; e em Multidões/Festejos, as imagens de festas juninas, do carnaval e de outros eventos folclóricos. Visualmente, chama a atenção principalmente as vestimentas, sempre inspirados na roupa do cangaço e/ou nas tradições de festas juninas. Em Multidões, é possível perceber também caravanas e passeatas políticas – um detalhe importante.

Pessoas, política e futebol

O detalhe é importante porque não tem como falar sobre Nordeste sem falar sobre política – em diversos sentidos. No grupo de Pessoas, são políticos que mais aparecem: Lula, Haddad, Bolsonaro, Alckmin, etc; alguns famosos também compõem o visual, como Caetano Veloso e Pitty, para citar alguns. O grupo Políticos deve ter sido tomado sua própria forma devido ao enquadramento das imagens, cuja API do Google já conseguiu identificar nos parâmetros de editoriais sobre política. Por fim, a paixão pelo futebol também vem em evidência: e ainda em tom político, com chapéu de palha e um “orgulho” refletido, por exemplo, na Lampions League.

Artesanato,
vestimentas de couro e mercadinhos

Em menor saliência, separei os grupos Artesanato, Vestimentas de Couro e Mercadinhos simplesmente pelo reforço à composição visual já percebida em outros grupos do que se refere aos nordestinos. São as famosas priquitinhas, o chapéu de couro (novamente), as peças de cerâmica/argila do famoso Pezão, e os mercadinhos – também confundido com restaurantes – tipo mercearia cuja própria paleta de cores significa alguma coisa. Detalhes simples, literalmente, mas que somam ao quadro geral que estamos montando.

Paisagens urbanas

O grupo Paisagens Urbanas divide-se em dois: um mais cotidiano, com imagens aparentemente mais corriqueiras; e outro mais “publicitário”, com imagens que remetem principalmente ao turismo. No primeiro, destaca-se a presença do Centro Luiz Gonzaga de Tradições Nordestinas, a famosa feira de São Cristóvão – localizada no Rio de Janeiro; no mais, algumas imagens avulsas de ruas das cidades. No segundo, fotografias profissionais destacam o Nordeste por uma lente mais mercadológica, como se estivesse vendendo-a como experiência (provavelmente fotos de sites de agências de turismo) – salvo algumas poucas exceções.

Natureza, cavalgada,
paisagens praianas
e paisagens do sertão

Por fim, o último grupo (talvez merecesse duas divisões distintas, mas achei melhor reunir tudo pois) traz basicamente fotos da natureza. Em Natureza vemos algumas espécies provavelmente mais comuns no Nordeste e, no grupo que chamei de Cavalgada, homens montando em cavalos refletem as histórias do sertão. Ao lado deles (literalmente), fotografias que provavelmente reforçam a seca que sofrem alguns municípios também ganham destaque. Por fim, o Nordeste paradisíaco é representado nas Paisagens Praianas – não coincidentemente ao lado das paisagens urbanas mais publicitárias.


Como discuti um pouco na monografia, não é porque as dinâmicas de poder se tornaram mais complexas que os estereótipos vão imediatamente sumir. O processo de transcodificação (Hall, 2016) é muito mais difícil de se por em prática do que imaginamos, e a própria reversão é ambivalentemente perigosa: “para transformarmos um estereótipo não precisamos necessariamente intervê-lo ou subvertê-lo. Escapar das garras de um dos extremos do estereótipo […] talvez signifique simplesmente estar preso em sua alteridade estereotípica” (id. ibid., p. 215).

O meu intuito aqui, entretanto, não é questionar nem tensionar os estereótipos construídos acerca da imagem (ou das imagens) dos nordestinos, mas dar um pontapé inicial para mostrar – empiricamente – que há um conjunto de símbolos e signos representativos do Nordeste e dos nordestinos. Quando argumentar sobre esse “imaginário social” sobre esses atores no contexto da cultura brasileira, posso mostrar – literalmente – do que se trata (talvez não em sua totalidade, mas em larga extensão – o que trabalhos focados em outras mídias não acompanham).

A problematização em cima do que essa representação envolve e quais são seus efeitos reais fica para outra ocasião mais propícia (e possivelmente acadêmica). Além disso, vale ainda refletir sobre não somente o que ficou de dentro, mas o que ficou de fora desse quadro – ou seja, a não-presença de alguns aspectos também comunica alguma coisa; e, no mais, uma comparação da generalização de Nordeste/nordestinos com cada um dos estados seria uma oportunidade riquíssima – que também vai ficar para outra oportunidade.

Referências bibliográficas

ALBUQUERQUE JR., Durval Muniz de. A invenção do Nordeste e outras artes. São Paulo: Cortez, 1999.
HALL, Stuart. Cultura e representação. Rio de Janeiro: Ed. PUC-Rio, 2016.

Dois artigos, um relatório e um poster: novos trabalhos publicados

Tela do relatório lançado com exclusividade pelo IBPAD

O ano passado foi um ano de muitas conquistas para mim. Principalmente aqui no blog, realizei e produzi muitas coisas legais das quais me orgulho bastante. O difícil, entretanto, é ter que lidar com “a queda” quando chegamos no topo. Não que eu tenha chegado no topo (longe disso), mas é inevitável comparar o que você já realizou com o que tem realizado atualmente. Por isso, em alguns momentos deste ano, fiquei frustrado com a baixa produtiva que tive no blog em 2018 – principalmente depois de um ano cheio como foi 2017. No entanto, mais recentemente, parei para refletir um pouco e percebi que a minha produção não diminuiu – só foi diluída em diferentes áreas da minha vida.

Este post, portanto, é somente para elencar e apresentar algumas produções que tive a sorte de fazer parte nos últimos meses – principalmente graças ao meu trabalho no IBPAD. Algumas participações mais incisivas, outras mais discretas, mas em todos esses projetos colaborei de alguma forma. Como o título já anuncia: são dois artigos, um relatório e um poster (acadêmico) nos quais utilizamos de diferentes métodos e metodologias de pesquisa – todos voltados ou a base de dados digitais – para análise. Quanto aos temas, bastante diversos: influenciadores de viagens no Facebook, comportamento de brasileiros de férias no Instagram, discursos de ódio na internet e os pré-candidatos à Presidência no Instagram.

Usando computação visual para analisar influenciadores de viagem no Facebook (Poster Acadêmico)

No IBPAD temos realizado vários trabalhos legais com computação visual e inteligência virtual. Este poster apresentado no IX Pró-Pesq PP – Encontro Nacional de Pesquisadores em Publicidade e Propaganda da USP foi resultado de um dos nossos trabalhos (mais denso, obviamente) utilizando esses métodos. Nele, eu e Tiago Menezes explicamos brevemente como técnicas de computação visual podem ser aplicadas para averiguar adequação de linguagem e conteúdo de um influenciador para com as marcas. Sublinhamos sobretudo, além da análise em si, a crescente de dados e aparato imagético disponíveis aos montes nas mídias sociais. Nesse contexto, a aplicação de técnicas e programas/scripts de computação visual e inteligência artificial são aliados cada vez mais importantes.

Visão Computacional nas Mídias Sociais: estudando imagens de #Férias no Instagram (Artigo Acadêmico)

Para uma explicação mais detalhada da metodologia que temos aplicado no IBPAD, esse artigo que submetemos para o ABCiber Nordeste traz tudo bem detalhadinho. Foi fruto de outra experiência nossa, o relatório Análise Automatizada de Imagens em Mídias Sociais: utilizando inteligência artificial para gerar novos insights em análise de imagens, no qual analisamos mais de 12.000 imagens com a hashtag #férias no Instagram para identificarmos padrões de comportamento, preferências culturais, momentos de consumo (oportunidade para marcas), etc. Fiquei muitíssimo feliz de ter colaborado em ambas as produções – e principalmente poder contabilizar, agora, duas entradas no Lattes (#projetomestrado2019).

Discursos de ódio na internet: uma análise sobre a marginalidade dos corpos negros (Artigo Acadêmico)

Nesse artigo, Huri Paz e eu analisamos os mais de 3.000 comentários de uma notícia do G1 sobre um caso de barbárie contra um adolescente negro na Zona Sul do Rio de Janeiro. A fundamentação teórica debate como a construção histórica, cultural e social do Brasil tornou possível os discursos encontrados nos comentários. Colaborei com a metodologia e análise: utilizei o WORDij para produzir uma rede semântica que identificou sete clusters discursivos predominantes nos milhares de comentários. Foi a primeira vez que utilizei a ferramenta academicamente e obtive resultados bem interessantes. Já rendeu aulas para os cursos do IBPAD e pretendo levá-la também para o meu projeto de mestrado sobre Nordeste/nordestinos.

EM BUSCA DO MELHOR ÂNGULO: A imagem dos presidenciáveis no Instagram – uma análise quanti-qualitativa com inteligência artificial (Relatório)

Por fim, e para não reclamarem que estou muito acadêmico, o relatório que deu o que falar: saiu no Congresso em Foco, Gazeta do Estado, Folha da Cidade e em vários outros sites/portais que replicaram a notícia. Nem eu sabia da proporção que iria tomar. Do início ao fim, foi um projeto bem legal: utilizei uma ferramenta de scraping em Python para coletar os dados dos pré-candidatos no Instagram, apliquei as técnicas de computação visual já citadas nos outros trabalhos, cruzei dados qualitativos com resultados quantitativos e mais um pouco. Fiquei realmente muito satisfeito com o produto final. Assim como os outros, se tudo der certo, esse também vira artigo!

Por enquanto, é só. Obviamente tenho mais algumas ideias borbulhando, porém tenho tentado me manter são e direcionar meus esforços (para além do trabalho 8h/dia) ao projeto de mestrado. Continuo aberto, entretanto, a convites para artigos e outros projetos quaisquer no qual eu possa ser útil com metodologia/coleta/análise de dados. Para fechar, compartilho aqui os slides da palestra que ministrei II Simpósio Regional Consumo em Foco da UNISUAM no final de maio (assista na íntegra a minha participação a partir de 1:06:00 neste link):