Na tarde desta sexta-feira (31), o Twitter abriu o código-fonte que determina como a plataforma escolhe quais conteúdos são recomendados na aba “For You” (Para você, em português). Além das linhas de código, a empresa também publicou uma explicação das bases orientadoras da recomendação de tuítes, anunciando uma nova fase de transparência.
No blog de engenharia, o Twitter explicou as bases de recomendações, que consistem no conjunto de modelos e recursos que buscam extrair informações dos próprios tuítes, mas também dos usuários e dos dados de engajamento.
O sistema parte de perguntas como: “Qual a probabilidade de um usuário interagir com outro usuário no futuro?” e “Quais são as comunidades no Twitter e quais são os tuítes em alta dentro delas?”. A partir disso, é construído uma espécie de funil de recomendação composto por três etapas:
- Busca dos melhores tuítes de diferentes fontes de recomendação (processo chamado de sourcing de candidatos);
- Classificação de cada tuíte com o uso de modelo de aprendizado de máquina;
- Aplicação de heurística e filtros (usuários bloqueados, conteúdos com violência ou sexualização e tuítes já vistos).
Com isso, é possível classificar não só as fontes que aparecerão na linha do tempo (segundo a plataforma, na aba For You aparecem 50% de perfis que o usuário já segue e outros 50% de perfis externos), mas também os conteúdos que podem ser considerados mais relevantes.
No GitHub, plataforma destinada para programadores, a rede social publicou os diretórios com os códigos, convidando a comunidade global para análise e envio de possíveis problemas ou melhorias no sistema de recomendação. Em comunicado, o Twitter disse que não foram expostos códigos que comprometam a segurança e a privacidade dos usuários ou que possam ser usados por “agentes mal intencionados”.
A abertura do algoritmo já era uma das promessas de Elon Musk enquanto negociava a compra da plataforma. Na época, pesquisadores e especialistas levantaram debates sobre os pontos positivos e negativos da medida.