Sobre o Observa

Observatório de Conflitos na Internet

O Observa tem por objetivo o desenvolvimento de ferramentas computacionais para coleta, processamento e análise de conflitos na Internet.

O projeto teve início em 01/03/2020.


Financiamento

Edital: Acordos de Cooperação / MCTI/MC/CGI – Cooperação Científica e Tecnológica entre FAPESP, MCTI e MC / MCTI/MC/CGI (2018/23022-3).

Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP)
Ministério da Ciência, Tecnologia e Inovação (MCTI)
Comitê Gestor de Internet no Brasil (CGI.BR)

Metodologia geral de coleta via API do Twitter

Os datasets disponíveis para visualização e download no site Observa foram coletados por meio da API v1.1 do Twitter, em tempo real, que fornece uma amostra de cerca de 1% dos tweets em um dado momento. Cada coleta foi realizada por um período aproximado de 24 horas, a partir de termos-chave. Para eventos de longa duração, como Eleições Municipais, Vacina contra Covid-19 e Queimadas na Amazônia e Pantanal, os datasets cobrem períodos de uma semana. Os termos-chave usados para coleta foram selecionados manualmente, após uma pesquisa exploratória na plataforma, de forma a capturar o contexto de possível conflito em andamento em postagens escritas em português.

Os gráficos e rankings foram gerados a partir de contagens e ordenações realizadas sobre cada dataset. No sumário da rede de retuítes, a quantidade de vértices representa o total de perfis do Twitter envolvidos em uma relação de retuíte. O grafo da rede de retuítes contém uma amostra dos 500 perfis mais retuitados que se envolveram em pelo menos uma interação de retuíte com algum dos 500 mais retuitados. Os agrupamentos identificados por cores diferentes na rede de retuítes foram determinados pelo algoritmo Clauset-Newman-Moore de maximização gulosa de modularização. No grafo, quanto maior a fonte para um perfil, maior é a quantidade de retuítes recebidos nessa amostra.
 
Para os gráficos de barra com os perfis que mais retuitaram e os de maior grau de centralidade, foi considerada toda a rede de retuítes associada à base. As medidas de centralidade indicam a relevância ou influência que o perfil teve no evento: a centralidade de grau é definida como o número de ligações incidentes (aponta os mais retuitados); nós com maior centralidade de proximidade são os com as menores distâncias para o total dos outros nós da rede de retuítes (uma mensagem tuitada ou retuitada por um perfil de grande centralidade de proximidade tende a alcançar mais rapidamente outros perfis); a centralidade de pagerank é uma variação da centralidade de grau que leva em conta não apenas a quantidade de ligações, mas a “qualidade” dos nós a ele ligados (perfis com maior pagerank são muito retuitados por perfis muito retuitados).

A nuvem de palavras e hashtags denominada “Assuntos das coletas” foi composta pelas 10 hashtags que mais ocorreram em cada coleta (eliminados termos e marcas que não estavam no centro do conflito, como “urgente”).


Parcerias

Núcleo Estratégico de Universos Virtuais, Entretenimento e Mobilidade (NUVEM) da UFABC
Laboratório de Tecnologias Livres (LabLivre) da UFABC
Centro de Pesquisas em Política e Internet (CEPPI) da UFMG
Grupo de pesquisa em Comunicação Política e Opinião Pública (CPOP) da UFPR

Pesquisadores