Cursos

Segunda semana do curso Social Media Analytics, da QUT: hashtags, Tableau e #BielExposedParty

Na semana passada dei início à “série” de posts sobre um novo curso que comecei a fazer no FutureLearn. Se você acabou de chegar, explico: realizado pela australiana Queensland University of Technology, no Digital Media Research Centre, trata-se de um ambiente virtual de aprendizado – ou MOOCs (Massive Open Online Course) – onde qualquer um com acesso a internet e conhecimento da língua inglesa pode participar. O curso em questão, Social Media Analytics: Using Data to Understand Public Conversations, comandado pelas pesquisadoras Jean Burgess, Axel Bruns e Tim Highfield, começou no dia 18 de julho – com duração de apenas três semanas – e continua com as inscrições abertas até dia 6 de agosto (creio eu, já que é quando termina a última semana). Caso tenha interesse, vale dar uma olhada no primeiro post que fiz sobre ele, onde descrevi a primeira etapa de aprendizado e apresentei mais informações institucionais.

SEMANA 2

A primeira atividade dessa segunda semana foi divulgada, na verdade, só na sexta-feira: a professora Jean Burgess e o professor Axel Bruns responderem algumas perguntas que os alunos fizeram durante os últimos dias nos “fóruns” de discussão. Eles explicaram o motivo da escolha das ferramentas que utilizamos no curso (com foco no Tableau), falaram um pouco sobre as limitações de pesquisa no Facebook (comparado ao Twitter) e comentaram sobre algumas questões específicas da prática das atividades que fizemos. Um ponto que eu gostaria de trazer à tona desse Q&A, retomando um tópico da última semana, é sobre a provocação de que o Twitter estaria ficando “menos sociável”. Em resposta a uma colega da turma, a profª. Jean explicou o que eu tinha pontuado no outro post – porém não tinha a base teórica para sustentar minha compreensão – sobre os embates de significados com relação à palavra “sociabilidade”:

Jean, there has been discussion in the first week about sociability and what we mean by social media, in response to your post on Medium. Could you tell us how you understand social and sociability?

Jean: Yeah, the term social is often used interchangeably with sociability. But they actually have two different meanings and in sociology, sociability has a specific meaning. So we can talk about social media in terms of something that brings people together and they interact without thinking about the value of that or whether it’s a positive or negative experience. Sociability carries with it the idea of playfulness and pleasure and cooperation. So the idea of a sociable social media environment is where people actually enjoy themselves, interact in a positive and constructive way with each other and contribute to building society through their interactions on the platform.

A conversa com os professores em vídeo foi importante para sentirmos as suas presenças no curso, mas não foi muito aprofundada em termos teóricos e/ou de discussão – foram apenas 7 perguntas respondidas e cerca de 10 minutos de vídeo. Acredito que esse formato se encaixe no modelo “rápido” do curso, uma vez que a discussão e o debate acadêmicos sobre alguns assuntos que já vimos na primeira semana seja extensa e mereça uma abordagem mais estruturada para dar conta de tamanha complexidade. Aliado a isso, tem o fato de que, diferentemente da primeira semana, essa segunda etapa do curso foi bem mais mão-na-massa – ou hands-on, para usar a expressão que eles usam – o que, a meu ver, mais uma vez reflete a proposta do curso: o objetivo é oferecer aos alunos conhecimento e habilidades práticas para começar o seu trajeto na análise de dados voltada para sites de redes sociais. Isso não diminui, em nenhum instante, a sua qualidade, apenas se adéqua ao formato disponibilizado pelo próprio FutureLearn. Dito isso, continuemos com o conteúdo programático.

socialmedianalaytics2Depois de conhecermos, na semana passada, o TAGS, fomos apresentado ao Tableau“um programa de análise e visualização de dados que te ajudará a analisar e compreender toda a informação coletada”. Muito do que aprendemos nas atividades desta semana – praticamente tudo, na verdade – foram ensinamentos iniciais sobre a utilização desse programa. Para o post não ficar muito grande (e até porque acredito que ainda não tenho conhecimento suficiente para escrever sobre o assunto, mesmo já tendo aprendido algumas coisas – mas não quero ensinar nada errado), vou compartilhar aqui somente o que nos foi proposto a executar na ferramenta com os dados que coletamos do TAGS. Quem tiver interesse em conhecer mais do Tableau (com mais detalhes práticos), há uma página específica de treinamento e tutoriais no site deles com vídeos que ensinam vários passo-a-passos para todos os níveis de conhecimento – que eu mesmo devo conferir com mais calma em breve e, se possível, compartilho alguns aprendizados também aqui no blog.

Antes de entrar nessa parte mais prática, no entanto, acho válido colocar em pauta um pouco da “breve” parte teórica que vimos nesta semana. Como eu já tinha mencionado antes: embora o FutureLearn indique a carga-horária de 3 horas necessárias para a conclusão das atividades semanais, se você quiser dar conta de todos os níveis de informação (atividades, artigos, comentários, etc.), você provavelmente precisará de mais tempo. Com isso em mente, tomei a consciente decisão de abrir mão da discussão com meus colegas de turma para conseguir ler alguns dos artigos propostos por Burgess e Bruns. O primeiro, Twitter Hashtags from Ad Hoc to Calculated Publics, de autoria dos próprios, traz um apanhado interessante sobre o contexto das hashtags no espaço e tempo – pensado em mudanças técnicas, reapropriações, etc. – que nos ajuda a pensar a análise prática mais pra frente. Eis alguns pontos que achei interessante ratificar e trazer para a discussão:

  • Sobre características de hashtags
  • A hashtag é como um mecanismo gerado por usuários para etiquetar e coletar tweets que são relacionados a algum tópico específico;
  • Ela foi decisiva na identidade do Twitter para ser reconhecido como plataforma da criação instantânea de audiências que são formadas, reformadas e coordenadas através de dinâmicas de redes comunicacionais e cuja conectividade social é organizada prioritariamente em volta de questões e eventos ao invés de grupos sociais pré-existente;
  • Elas nascem de dentro de comunidades do próprio Twitter, sejam através de planejamentos prévios ou consensos rápidos entre os usuários, ou até mesmo de disputas discursivas que acarretam na utilização de hashtags conflitantes;
  • A discussão em torno de hashtags atua num nível macro do Twitter (Bruns & Moe, 2014), comparado à estrutura mais definida de “personal publics” (Schmidt, 2014) que age dentro do nível meso de seguidores e também à conversação mediada através de replies, num nível micro.
  • Sobre a história de hashtags
  • Muitas das técnicas oferecidas e aplicações culturais do Twitter que define seu papel na comunicação pública tão significante foram originalmente inovações criadas por usuários, sendo somente incorporados à arquitetura da plataforma depois de um tempo;
  • O uso das hashtags nasceu numa proposta feita por Chris Messina, um tecnólogo de São Francisco, em 2007, quando fez um post no seu blog: ‘Groups for Twitter, or a Proposal for Twitter Tag Channels’. Sua sugestão para o uso de hashtags – como conhecemos hoje, criando um sistema de canais etiquetados utilizando o símbolo do jogo da velha para que as pessoas pudessem seguir e contribuir em conversações sobre assuntos de interesse particular – tinha o intuito de “melhorar a contextualização, o filtro de conteúdo e sensação de exploração satisfatória no Twitter”.
  • Sobre a dinâmica entre hashtags e publics
  • O que chamamos de “publics”, aqui, pode ser compreendido como audiência; a partir disso, podemos pontuar que a compreensão tradicional de audiência para os meios de comunicação de massa é traduzida num grande grupo de pessoas estranhas que acompanham um conteúdo editorialmente curado por uma instituição comunicacional;
  • Nos casos das hasgtags, esse cenário muda um pouco – em partes: embora os usuários possam, como um todo, contribuir para a comunicação e conversação entre si, há também uma curadoria da própria plataforma – seja por popularidade ou relevância, a depender das situações – que também norteia o consumo de informação dos tweets.
  • Sobre a “anatomia” de hashtags
  • Alguns aspectos podem ser observados em tweets com hashtags que envolvem “crises”: por terem um caráter mais voltado para a intensa e rápida propagação de conteúdo, esses tweets geralmente contêm mais URLs (links, imagens, etc.) e retweets;
  • Já tweets que envelopam, por exemplo, eventos televisivos, são mais “originais”: são menos URLs e retweets e mais menções originais, uma vez que os usuários já possuem um guia-condutor da conversa e desejam, majoritariamente, expressar uma opinião original/própria sobre o assunto.

A segunda leitura da semana, o artigo “Towards more systematic Twitter analysis: metrics for tweeting activities“, de Axel Bruns e Stefan Stieglitz, já traz um conteúdo mais voltado para a prática dos métodos digitais. Compreendendo métricas como “medidas quantificadas que nos permite analisar, comparar e contrapor dados [do Twitter, para o caso específico do curso]”, somos apresentados a três “níveis” de métricas propostos pelos autores do artigo: como os usuários contribuem para a conversação, como a atividade acontece e o padrão de certos usuários ao passar do tempo. O objetivo aqui é propor algumas métricas básicas que forneçam um suporte de análise que possa crescer e desenvolver outros indicadores mais complexos – ou seja, construir um terreno comum entre pesquisadores que sirva de base inicial. Não vou aprofundar aqui na discussão completa do artigo, pois ele traz tantas funcionalidades importantes para a análise de dados no Twitter que merecia um post sozinho, mas destaco esses principais níveis de métricas:

  • User Metrics: apresentam geralmente uma cauda longa com um grupo pequeno de usuários sendo mais ativos e tendo mais visibilidade do que o restante dos usuários*;
    • Atividade: a simples contagem de tweets enviados por cada usuário, o que fornece uma compreensão do seu envolvimento (e comprometimento) com a hashtag;
    • Visibilidade: o levantamento dos usuários mais mencionados na base de dados apresenta os que são, provavelmente, mais visíveis naquele contexto;
    • *Aqui é interessante fazer uma comparação, além de entre os indivíduos, também entre esses grupos – no modelo proposto por Tedjamulia, por exemplo, de três grupos: o top1%, top9% e top90%.
  • Temporal metrics: essa medida ajuda a ter uma visão temporal de como a hashtag foi incorporada pelos usuários ao passar do tempo, o que permite observar, por exemplo, picos de volume ou quedas bruscas de atividade – a partir daí, é possível identificar de maneira qualitativa alguns comportamentos dos usuários e da comunidade como um tempo para determinado período.
  • Combined metrics: essa métrica permite fazer uma extensão da análise ao assimilar descobertas sobre usuários com descobertas sobre atividade ao passar do tempo – isso pode revelar quem está dominando a conversação em momentos-chave.

Um benefício-chave de estabelecer uma caixa de ferramentas de métricas padrões para a análise de datasets de hashtag no Twitter são as oportunidades aprimoradas para comparação e correlação em torno de uma série diversa de caso de estudos. Tal comparação pode pontuar semelhanças e diferenças em padrões de uso do Twitter, e pode direcionar para a identificação de um número de gêneros comuns de comunicação baseada em hashtag no Twitter; conforme a plataforma e sua utilização evolui, e conforme a base de usuários geral se desenvolve, nós também podemos acompanhar essas mudanças ao passar do tempo. […] Isso demonstra como a abordagem quantitativa para análise de dados do Twitter em larga escala, cujos métodos e métricas que introduzimos aqui torna possível, pode gerar clara evidência de padrões comunicacionais no Twitter.

Outro artigo cuja leitura foi recomendada mas do qual eu não consegui dar conta de ler a tempo foi o “Tweet, Tweet, Retweet: Conversational Aspects of Retweeting on Twitter”, de danah boyd, Scott Golder e Gilad Lotan. A proposta desta etapa era trazer uma compreensão teórica da dinâmica dos retweets na plataforma, uma vez que eles demonstram “qual conteúdo carrega peso na conversação e na comunidade”. O argumento aqui é que essa prática do Twitter tem um valor bastante significativo no universo de interações da plataforma, pensando também como a informação se move com relação a um assunto ou a um problema dentro daquele contexto. No curso fomos apresentado à história de Jerry, um simples fabricante de lâmpadas residente da cidade de Nova York que ganhou uma visibilidade enorme no Twitter graças às fãs do One Direction – você pode conhecer e entender essa história nessa timeline dinâmica criada pelo pessoal da QUT.

Tendo destrinchado minimamente a parte teórica, podemos seguir para o restante da semana: Tableau na prática. Como já mencionei anteriormente, acho que não cabe trazer ao post o passo a passo de como realizei cada uma das atividades (esse acompanhamento foi disponibilizado no próprio curso), mas trago aqui o que criei com a ferramenta – quem tiver curiosidade em saber como foi feito pode deixar perguntas nos comentários que posso orientar mais minuciosamente. Portanto, o que eu fiz, num primeiro momento, no Tableau:

  1. Utilizei a coleta de dados que fiz com a TAGS;
  2. Desenvolvi um gráfico de evolução temporária da hashtag monitorada;
  3. Encontrei (e explorei) os retweets proeminentes da minha base de dados, comparando também esses retweets com tweets de maior “alcance”;
  4. Criei dois gráficos para descobrir quem foram os usuários mais ativos e mais visíveis;
  5. Encontrei os usuários mais “influentes” (com o maior número de seguidores) da minha base;

Já que na semana passada eu ainda não tinha definido exatamente qual seria o meu tópico de estudo para o curso, tive a sorte de “participar” de um movimento que aconteceu no Twitter esta semana em resposta a uma reportagem do cantor Biel. Numa entrevista ao TV Fama, ele proclamou que a repórter que a denunciou por assédio tinha prejudicado muito sua carreira – foi o suficiente para o Twitter entrar em turbilhão e colocá-lo mais uma vez em pauta. Usuários começaram a procurar tweets antigos do cantor com referências racistas, machistas, etc., expondo os absurdos através de retweets e prints que circularam a plataforma e culminou na hashtag: #BielExposedParty. Quando a encontrei nos Trending Topics, já eram mais de 10.000 menções utilizando a hashtag – achei que seria interessante, portanto, juntando a curiosidade à prática, fazer os exercícios do Tableau com essa base de dados que consegui coletar através do TAGS, ferramenta que foi apresentada na primeira semana do curso. Foram 11.149 tweets em 24h de hashtag e o resultado foi esse:

Para além de ter feito essa atividade na prática, acho válido – necessário, na verdade – pontuar algumas observações que podem ser feitas a partir desse simples cruzamento de dados. Podemos compreender, por exemplo, através da análise temporal, que o principal período de adesão à hashtag aconteceu entre às 21h e 23h; podemos também perceber que os retweets tiveram um papel essencial para a disseminação, propagação e viralização da mensagem que a hashtag queria passar (expor o cantor, basicamente) – o volume de tweets originais é muito menor do que o volume de retweets; quando você olha mais afundo para tentar descobrir a crescente exponencial do volume de tweets entre 21h e 22h, consegue encontrar a adesão de algumas contas (@forumpan, @gifboardbrasil e @bchartsbr, por exemplo) que foram essenciais na propagação da hashtag; ao mesmo tempo, os tweets originais também apresentam uma crescente nesse período uma vez que esse é o momento em que as pessoas entram na conversa para conseguir também sua porção de visibilidade na conversação.

Quando olhamos para as menções com o maior número de retweets, podemos fazer uma simples (e estaticamente incorreta, mas aqui vale) dedução que essas contas são bastante ligadas ao mundo pop – uma análise mais aprofundada poderia nos ajudar a compreender como a informação se moveu nessas conversações. Quando comparamos a visibilidade com a atividade dos usuários, percebemos que o uso frequente da hashtag não corresponde a um maior nível de atenção dos usuários; no entanto, vários dos usuários de maior visibilidade também se encontram dentre as menções com mais retweets – o que pode indicar, superficialmente, que estes foram essenciais na circulação da mensagem dentro do universo da hashtag; quando olhamos para alcance dos tweets e usuários mais seguidos, no entanto, observamos que vários dos tweets de maior alcance não necessariamente foram retweets, mas menções originais de usuários com uma grande leva de seguidores.

Vale ressaltar que essa é uma análise bem simples e inicial do cruzamento de dados que foi apresentado no curso. Caberia, sim, um aprofundamento nas discussões e no tema para que pudéssemos desenvolver hipóteses mais concretas e buscar uma compreensão sobre o tema. No entanto, por motivos de tempo, esse estudo mais aprofundado vai ter que ficar para um outro momento. Ainda houve, por fim, mais duas atividades práticas nessa segunda semana de aprendizado, entretanto, por se tratar de um cruzamento de dados um pouco mais complexo e que eu gostaria de tratar com outra abordagem, vou deixar essa parte final para o post da próxima semana – vai ser interessante também porque será possível cruzar com algumas aplicações que devemos fazer no Gephi e tal, então acredito que se encaixe mais na publicação da semana seguinte. Combinado? Novamente, quem estiver fazendo curso ou quem estiver interessado em fazer e queira saber mais, entra em contato comigo. Estou à disposição!

Tags:

Deixe uma resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *


Esse site utiliza o Akismet para reduzir spam. Aprenda como seus dados de comentários são processados.