Blog

API de Tópicos do Google: 11 coisas que aprendi com a documentação

Por John Koetsier 28 de janeiro de 2022

FLoC está morto. Vida longa à API de Tópicos do Google.

O Google substituiu sua proposta de segmentação de anúncios com segurança de privacidade, a Federated Learning of Crowds (Aprendizado Federado de Multidões), muito criticada, pela nova API Topics . Os Tópicos do Google visam permitir a publicidade relevante sem rastreamento invasivo.

Existem quatro tipos principais de dados que os profissionais de marketing usam para tentar veicular anúncios relevantes:

  1. Dados contextuais: um anúncio é semelhante ao conteúdo que o rodeia de alguma forma, portanto, pessoas que procuraram esse conteúdo provavelmente também se interessarão pelo anúncio. (Às vezes, insights tangenciais entram em jogo aqui, como mergulhadores que tendem a tirar férias na praia ou motociclistas que tendem a gostar de bares alternativos.)
  2. Dados de intenção: um anúncio é relevante para uma consulta de pesquisa que uma pessoa inseriu recentemente, o que significa que, teoricamente, deve ser algo em que ela esteja interessada.
  3. Dados comportamentais: um anúncio é relevante para coisas que uma pessoa fez recentemente e lugares (incluindo lugares virtuais como aplicativos e sites) que ela visitou, portanto, deve ser relevante para coisas que ela também possa gostar.
  4. Dados demográficos: um anúncio é amplamente relevante para um determinado grupo demográfico com base em localização, idade, fatores socioeconômicos e, portanto, espera-se que seja relevante para a pessoa que o visualiza.

A nova API Topics busca, essencialmente, obter dados comportamentais que respeitem a privacidade. Tradicionalmente, os dados comportamentais eram invasivos à privacidade por meio de identificadores de dispositivos como IDFA / GAID /cookies, que criavam grafos de terceiros para segmentação de anúncios. A API Topics, no entanto, é inerentemente probabilística e descentralizada: ela é executada no seu navegador e não agrega dados em um banco de dados massivo na nuvem.

Por que essa nova metodologia de segmentação de anúncios centrada na web é importante para os profissionais de marketing mobile que estão tentando criar aplicativos por meio da aquisição de usuários mobile ?

Simples: isso é importante para profissionais de marketing mobile porque a integração web-to-app está se tornando um vetor de aquisição de usuários cada vez mais válido, econômico e eficaz. E, quem sabe… algo como isso, ou desenvolvido em conjunto com isso, poderá se tornar uma versão de marketing de aplicativos mobile para Android que respeita a privacidade, caso seja bem-sucedido e implementado.

E é do Google.

Qualquer nova política ou proposta de marketing e publicidade do Google é inerentemente interessante e relevante para os profissionais de marketing, dada a posição de destaque do Google como um dos dois maiores players globais em tecnologia publicitária.

Então: vou analisar a API, e farei isso parte por parte: trechos da documentação da API com comentários. (Aliás, se eu disser alguma besteira, me avise ! Juntos somos mais inteligentes.)

A API de Tópicos é baseada em interesses

Com a iminente remoção dos cookies de terceiros na web, casos de uso importantes que os navegadores desejam suportar precisarão ser abordados com novas APIs. Um desses casos de uso é a publicidade baseada em interesses

O foco aqui é a publicidade baseada em interesses. Normalmente, isso era inferido do contexto ou elaborado por meio de rastreamento digital. Mas isso é melhor do que o contexto, porque o contexto é um instantâneo momentâneo com uma perspectiva limitada. Os interesses são de longo prazo, e a API de Tópicos oferecerá mais do que apenas um interesse ao longo do tempo.

Nota importante: isto não é intencional, e isso é muito sério.

A intenção de compra cresceu significativamente em 2021 em resposta à descontinuação do IDFA e à crescente preocupação com a privacidade, pois é altamente preditiva de atividades futuras, incluindo atividades econômicas. Essa ainda é a principal área de atuação dos mecanismos de busca.

Mas a API de Tópicos não é muito granular

“O objetivo da API de Tópicos é fornecer aos usuários (incluindo tecnologias de publicidade de terceiros ou provedores de publicidade na página que executam scripts) tópicos de publicidade genéricos que o visitante da página possa estar interessado no momento. Esses tópicos complementarão os sinais contextuais da página atual e podem ser combinados para ajudar a encontrar um anúncio apropriado para o visitante.”

Isso não é nada granular. Na verdade, é muito grosseiro.

Inicialmente, estamos falando de 350 tópicos, o que é muito pouco. Para referência, a Taxonomia da IAB tem 1500 termos, e mesmo isso é muito, muito limitado em comparação com uma taxonomia minimamente completa, que poderia ter centenas de milhares de termos.

Aqui está a comparação do Google entre cookies e tópicos:

Comparação do Google entre cookies e tópicos

Todos esses tópicos são mundos inteiros em si mesmos. Por exemplo, esportes: qual? ​​Beisebol, hóquei, rúgbi? Que tal luta de dedos (sim, existe)? Ou corrida de avestruzes? E mesmo que você consiga restringir um tópico esportivo ao beisebol, os profissionais de marketing precisam saber quais times são importantes para uma pessoa para serem realmente eficazes.

Resumindo: precisamos de muito mais refinamento para que isso seja útil para os profissionais de marketing. Curiosamente, o FLoC tinha mais opções e mais precisão…

Poderia haver um mapeamento público de sites por tópicos

“Os tópicos serão inferidos pelo navegador. O navegador utilizará um modelo de classificação para mapear os nomes de host dos sites aos tópicos. Os pesos do classificador serão públicos, possivelmente desenvolvidos por um parceiro externo, e serão aprimorados com o tempo. Pode ser interessante que os sites forneçam seus próprios tópicos…”

Existe um modelo de classificação, desenvolvido pelo Google ou por terceiros, que informa ao navegador, e consequentemente à API de Tópicos, sobre o que trata um site. Esses pesos são públicos, e alguns sites terão um peso maior no algoritmo de Tópicos

Mas... o fato dos pesos serem públicos não significa que o modelo também o seja.

Haverá aprendizado limitado

“document.browsingTopics() retorna um array com até três tópicos, um de cada uma das três épocas (semanas) anteriores. O array retornado está em ordem aleatória. Ao fornecer três tópicos, sites visitados com pouca frequência terão tópicos suficientes para encontrar anúncios relevantes, mas sites visitados semanalmente aprenderão, no máximo, um novo tópico por semana.”

Os cookies de terceiros estão desaparecendo, e por um bom motivo. Mas, da perspectiva de um profissional de marketing, eles poderiam fornecer uma quantidade significativa de dados para segmentação de anúncios. A API de Tópicos do Google, se implementada, não fornecerá uma série completa de interesses para um site, apenas um novo tópico por semana.

Aliás, os temas só ficam disponíveis por três semanas.

Além disso, o Google introduzirá ruído no sinal

“Para cada semana, os 5 principais tópicos do usuário são calculados usando informações de navegação locais do navegador. Um tópico adicional, escolhido aleatoriamente, é adicionado, totalizando 6 tópicos associados ao usuário para aquela semana/época. Quando document.browsingTopics() é chamado, o tópico para cada semana é escolhido entre os 6 tópicos disponíveis da seguinte forma: Há 5% de chance de que o tópico aleatório seja retornado.”

Agora existe a possibilidade de obter dados espúrios. Um em cada cinco dos cinco tópicos principais é gerado aleatoriamente e tem 5% de chance de ser o tópico que você obtém ao chamar a API de Tópicos. Em outras palavras, se você estiver criando seu próprio gráfico de dispositivos, ele não terá dados totalmente precisos.

Dito isso… uma probabilidade de 5% de dados aleatórios não representa muita aleatoriedade.

Os dados de segmentação serão repetitivos

“Qualquer que seja o tópico retornado, continuará sendo retornado para qualquer pessoa que ligar para esse site durante as três semanas restantes.”

Você teve "esportes" no primeiro dia? Você terá "esportes" no 21º dia.

É meio que no estilo Henry Ford: você pode escolher qualquer cor que quiser, contanto que seja a mesma que você tinha antes.

Redes de sites não serão muito eficazes na identificação de usuários

“O motivo pelo qual cada site recebe um de vários tópicos é para garantir que sites diferentes frequentemente recebam tópicos diferentes, dificultando a correlação entre os sites em relação ao mesmo usuário.”

Você não conseguirá possuir 35 sites diferentes e construir um gráfico de identidade determinístico dos seus visitantes em todos eles. Ter a possibilidade de possuir 35 sites não é, obviamente, a realidade da maioria das marcas ou sites, mas isso significa essencialmente que plugins de terceiros projetados para criar gráficos de dispositivos ou identidade em milhares ou até milhões de sites falharão.

Ou pelo menos ter um trabalho significativamente mais difícil.

Ai: você só pode aprender o que já sabe (a menos que seja uma rede de publicidade)

Nem todos os usuários que chamam a API receberão um tópico. Apenas os usuários que observaram a visita do usuário a um site sobre o tópico em questão nas últimas três semanas poderão receber o tópico. Se o usuário (especificamente o site do contexto da chamada) não tiver chamado a API anteriormente para aquele usuário em um site sobre aquele tópico, o tópico não será incluído na matriz retornada pela API.

O exemplo do Google sobre isso afirma que as únicas partes que podem obter um tópico de volta da API de Tópicos são aquelas que já chamaram a API de Tópicos em um site com um tópico de site predefinido e correspondente.

(Se você acha isso confuso, acho que você tem razão.)

Eis como o Google explica:

API de Tópicos do Google

Portanto, se em uma semana hipotética a API de Tópicos não for acionada em um site com o tópico X listado, esse site não poderá obter o tópico X de um visitante recorrente na semana 2.

Imagino que isso signifique que editores e fornecedores de tecnologia publicitária precisam usar a API de Tópicos o máximo possível, abrangendo o maior número possível de tópicos, para obter o máximo de dados de segmentação possível. Claramente, isso também significa que, para usuários frequentes e recorrentes que você rastreia de outras maneiras (conta, impressão digital, etc.), você só poderá obter da API de Tópicos o que já sabe por meio de outras fontes.

Há ainda outro detalhe importante: no ecossistema da API de Tópicos, você pode compartilhar esses tópicos legal e eticamente com terceiros, como redes e plataformas de anúncios, o que provavelmente oferece mais segurança em termos de privacidade do que qualquer outra metodologia interna. Uma pessoa com quem conversei descreveu isso como intencional: os editores não sabem muito, ou quase nada, sobre seus usuários... mas as ferramentas de tecnologia de anúncios para segmentação, compra, venda e veiculação de anúncios sabem.

(Lembra -se dos dados primários ? Trabalhe para ser suficientemente atraente para que os usuários se tornem membros autenticados, cadastrando-se e fazendo login.)

Sites grandes com muitos tópicos sofrerão

“Propomos escolher tópicos de interesse com base apenas nos nomes de domínio dos sites, em vez de informações adicionais como o URL completo ou o conteúdo dos sites visitados. Por exemplo, “tennis.example.com” poderia ter um tópico sobre tênis, enquanto example.com/tennis teria apenas tópicos relacionados ao site mais geral example.com.”

A Wikipédia ficará bem posicionada para… Wikipédia, presumo, e a ESPN ficará bem posicionada para… ESPN. Alternativamente, os editores terão que refazer as estruturas de seus sites e esquemas de URL para poderem aderir e se beneficiar totalmente da API de Tópicos, o que será interessante em grande escala e poderá causar problemas em muitas outras coisas.

Essa é uma decisão muito estranha que o Google afirma ser justificada por questões de privacidade. Especialistas em SEO que observaram a tendência crescente de buscas sem cliques podem discordar.

O Google vai decidir sobre o que é o seu site

“O mapeamento de sites para tópicos não é segredo e pode ser acessado por outros, assim como o Chrome faz. Seria interessante se um site também pudesse descobrir quais são seus tópicos por meio de alguma ferramenta externa…”

Leia a segunda parte desse parágrafo: seria bom se você pudesse descobrir quais são os seus tópicos. Isso indica que você não está fornecendo essas informações em primeiro lugar... então o Google deve estar.

Não tenha medo.

O Google afirma posteriormente: "O mapeamento de sites para tópicos nem sempre será preciso", mas haverá "melhorias iterativas ao longo do tempo"

E, para ser justo, acho que o Google já determina o assunto do seu site tanto durante as buscas na web quanto nas atividades de segmentação de anúncios.

É claro que a privacidade é fundamental

“A API não só deve reduzir significativamente a quantidade de informações fornecidas em comparação com os cookies, como também seria melhor garantir que ela não revele as informações a mais partes interessadas do que os cookies de terceiros.”

E …

“Os tópicos revelados pela API devem ser significativamente menos sensíveis para o usuário do que aqueles que poderiam ser obtidos usando os métodos de rastreamento existentes.”

O objetivo do Google é permitir a segmentação de anúncios, protegendo a privacidade. Segundo o Google, um site ou rede social só poderia obter informações sobre um usuário a partir de 15 tópicos por semana, o que representa uma quantidade significativamente menor de dados do que os cookies de terceiros revelam atualmente.

Ótimo na teoria… mas teremos que ver se realmente funciona na prática.

Uma das funcionalidades da API de Tópicos, que os cookies de terceiros não oferecem, é a capacidade de informar que um tópico obtido para uma pessoa está entre os cinco tópicos de navegação mais populares dela na semana. Além disso, sites que mantêm um relacionamento persistente com um usuário receberão mais dados. "Conforme um site utiliza a API para o mesmo usuário, no mesmo site, ao longo do tempo, ele desenvolve uma lista de tópicos relevantes para esse usuário", afirma o Google. "Essa lista de tópicos pode conter correlações não intencionais com tópicos sensíveis."

No entanto, é probabilístico e genérico: ambas diferenças significativas em relação aos cookies de terceiros.

E, é importante ressaltar, há transparência: todos podemos ver os tópicos que nos foram atribuídos, podemos remover aqueles de que não gostamos e podemos optar por não participar, se assim desejarmos. Esse tipo de controle individual e pessoal é revigorante.

Resumindo: a API de Tópicos está chegando

FLoC está morto. A API de Tópicos é o novo plano, e não consigo imaginar o Google descartando duas propostas seguidas. Então, presumo que eles estejam levando esta muito a sério. Mas... torná-la viável exigirá muito trabalho das comunidades de adtech e publishers, não apenas do Google. E mesmo assim, haverá grandes desafios com segmentação de anúncios, mensuração de marketing e monetização de anúncios.

Já vimos essa história antes: iOS 14.5.

Basicamente, quase ninguém leva isso a sério até que aconteça, aí todo mundo entra em pânico. Os gastos migram para ecossistemas mais segmentáveis ​​e mensuráveis ​​(imagine o quão feliz você acha que o Facebook está com isso!), enquanto todos tentam descobrir como contornar o problema e criam novas tecnologias (ou antigas, como a coleta de impressões digitais) para tentar burlar os novos recursos focados em privacidade.

Após seis a nove meses de corrida armamentista, estamos voltando a uma vida relativamente normal.

Podemos ajudar

Trabalha com métricas de marketing? Web para aplicativo? Prioridade Mobile ? Precisa de um conjunto completo de dados, desde custos e atribuição até modelagem e análise probabilística? Singular pode ajudar.

Reserve um horário para conversarmos hoje.

Mantenha-se atualizado sobre os últimos acontecimentos em marketing digital

Basta nos enviar seu e-mail e pronto! Prometemos não enviar spam para você.