API de temas: Cómo Privacy Sandbox en Android conecta a las personas con anuncios
API de Temas es cómo Privacy Sandbox en Android — y en Chrome — ayudará a los anunciantes a conectar con audiencias relevantes. No sorprenderá a nadie en la industria de apps móviles que uno de los componentes clave de la tecnología publicitaria es descubrir cómo conectar personas y anuncios. Los estafadores y redes de anuncios de baja calidad redes publicitarias no les importa a quién muestran un anuncio — o siquiera que una persona real lo vea — pero los socios publicitarios dignos del nombre invierten un enorme esfuerzo y meticuloso cuidado en crear tecnología para coincidencias de alta calidad entre anunciantes y usuarios o clientes potenciales.
En Privacy Sandbox para Android, Google’s propone asumir esa carga con la API de Topics.
Esta publicación es parte de una serie sobre Privacy Sandbox:
- Tiempo de ejecución del SDK
- Temas (esta publicación, sobre cómo Google ve el funcionamiento de la segmentación de anuncios)
- FLEDGE en Android (que ahora se llama API de audiencia protegida)
- Informes de atribución (donde we’ll profundizaremos en cómo Privacy Sandbox impactará la medición)
Segmentación de anuncios
Empecemos por dar un paso atrás y pensar en cómo segmentar la publicidad en general. Hay muchas maneras de segmentar a las personas con anuncios, por supuesto, pero el problema es que muchas de ellas tienen importantes desventajas para la privacidad.
| Metodología de segmentación | ¿Eficacia? | Requisitos tecnológicos | ¿Privacidad segura? |
| Comportamiento | Alto | Requiere seguimientoGeneralmente invasivo | No es fácil |
| Ubicación | Medio | Requiere metadatos. Puede ser peligroso con el tiempo | No es fácil |
| Demografía | Medio | Requiere datos de terceros. Requiere cierto nivel de resolución de identidad | Un poco |
| Contexto | Bajo | Requiere conocimiento del contexto | Principalmente |
| Intereses | Bajo | Requiere conocimiento de intereses | Potencialmente |
| Intención | Alto | Requiere conocimientos de búsquedas | Potencialmente |
Todo mecanismo de segmentación puede ser potencialmente seguro para la privacidad, pero cada uno tiene riesgos y algunos modos tienen mayores riesgos que otros.
Por ejemplo, Apple’s SKAdNetwork es determinístico: cada postback de instalación garantiza al 100% que alguien instaló tu app. Sin embargo, aunque no es granular por usuario y oculta gran cantidad de datos de medición de marketing mediante umbrales de privacidad en SKAN 3 o anonimato colectivo en SKAN 4, presenta bajo riesgo de violaciones de privacidad.
El comportamiento digital, como las visitas a sitios web o el uso de aplicaciones, generalmente adquirido mediante rastreadores como cookies de terceros o identificadores publicitarios (IDFA, GAID), es bastante invasivo. Sin embargo, en teoría, podría protegerse la privacidad mediante funciones adicionales como la privacidad diferencial, las audiencias agrupadas y la adición de ruido, entre otras. (La pregunta sería: ¿podría un anunciante con un gran volumen descifrar el código, obtener suficientes datos, desmitificarlos e identificar a las personas específicamente? ¿Y se confía en quien crea las audiencias?)
El contexto generalmente protege la privacidad: un anuncio se relaciona con el contenido del sitio web o la aplicación que rodea al anuncio, no con la persona.
El salto lógico que los anunciantes dan a partir del contexto, por supuesto, es que las personas que ven información sobre deportes, por ejemplo, están interesadas en los deportes, quizás los practiquen, podrían gustarles la cerveza o la comida de fiesta, podrían estar interesadas en comprar recuerdos deportivos, etc. Ese salto lógico puede ser breve, obvio, largo, ingenioso pero no obvio, o completamente erróneo.
API de intereses y temas
Los intereses que Google aprovecha en la API de temas para el entorno de privacidad de Android son interesantes.
¿Por qué?
Los temas son más que contexto. El contexto es bueno, pero se limita a una página o pantalla específica. Alguien podría haber hecho clic en el enlace equivocado, seguido un clickbait o tocado la pantalla equivocada en una aplicación. O bien, podría ser la pantalla correcta, pero solo la visita para obtener información necesaria, no porque le interese profundamente ese contexto.
El interés, por otra parte, debería ser mucho más global y persistente en el tiempo.
Ejemplo: Me gustan los deportes. Eso no cambiará de una semana a otra ni de un mes a otro, aunque es probable que los deportes con los que participo evolucionen a lo largo del tiempo o cambien según la temporada. Y aunque Google está desarrollando la API de Temas para intereses a corto plazo, sigue siendo a largo plazo, más allá del contexto inmediato.
El entorno de pruebas de privacidad de Google define un tema como un área de interés legible para humanos con la que alguien ha mostrado interés recientemente. De hecho, probablemente en las últimas tres semanas.
Los temas se basan en el uso reciente de anuncios y las instalaciones de aplicaciones de un usuario, pero si un usuario elimina una aplicación, cualquier tema asociado con esa aplicación no se eliminará de su lista de temas, "para evitar revelar información sobre la desinstalación", dice Google.
Un desafío: la visión actual de Google sobre los temas es que existe una taxonomía muy limitada: entre unos pocos cientos y miles de temas, que Google compartirá con la comunidad de marketing más adelante. Serán seleccionados por profesionales, por lo que no incluirán temas delicados, y su objetivo es no ser muy granulares
“La API de temas tiene como objetivo proporcionar a los usuarios temas publicitarios de interés general según el uso que hagan de la aplicación”, afirma Google.
La razón por la que no son muy granulares: las pruebas tempranas con niveles mucho más altos de granularidad de temas resultaron insuficientemente privadas. En otras palabras, si ves suficientes datos sobre mis intereses, probablemente podrás triangular mi identidad, o al menos seguir mi rastro digital por internet. Claramente, Google quiere evitar una segmentación demasiado estrecha basada en temas que la tecnología publicitaria SDKs guardan y recuerdan con el tiempo, asociándose con un usuario, para desarrollar un perfil muy detallado de una persona que podría usarse de manera que amenace la privacidad.
O desarrollar un gráfico de persona o dispositivo.
Curiosamente, Google afirma que los temas potenciales para un usuario están definidos por un modelo de clasificación para aplicaciones.
En otras palabras, las aplicaciones alimentan la taxonomía para los usuarios, y los datos que entrenan el modelo utilizan información pública, como el nombre de la aplicación, la descripción y el nombre del paquete. Las aplicaciones pueden asignarse a varios temas o a ninguno, pero hay un límite: independientemente de cuántos tengan, solo se añadirán 3 al historial de temas del usuario por semana.
Sin embargo, existe cierto grado de control por parte del usuario:
“El diseño pretende brindar a los usuarios la posibilidad de ver y eliminar los temas asociados con el uso de su aplicación”, afirma Google.
No se menciona que la gente añada temas manualmente, lo cual podría ser interesante. Veo dificultades con eso, como que la gente añada datos totalmente falsos, pero aun así podría ser útil: podría definir los temas sobre los que quiero ver anuncios, y la zona protegida de privacidad de Android podría garantizar que solo (o principalmente) vea anuncios sobre esos temas.
(Y tal vez nunca vea otros temas en una lista definida diferente)
Segmentación de anuncios con la API de temas: cómo funciona
Cada semana, Google calcula los 5 temas principales de un usuario, que permanecen en el dispositivo. La tecnología de Google lo calcula basándose en las aplicaciones recientes y el uso que hacen de ellas, pero la información permanece en el dispositivo sin que Google la conozca.
Cuando una aplicación que monetiza mediante anuncios desea ocupar un espacio publicitario, el SDK de tecnología publicitaria de la aplicación llama a la API de Temas y comprueba si hay un tema en la lista del usuario que coincida con un tema asignado a la aplicación. Nota: Google prohíbe específicamente que los SDK o las aplicaciones almacenen estos datos y los utilicen a lo largo del tiempo para obtener una visión más detallada de los intereses y temas del usuario.
- Una vez a la semana, Android calcula los 5 temas principales de un usuario
- Al llamar a la API de temas con éxito, obtendrá un tema elegido aleatoriamente de esa lista, el 95 % de las veces
- El 5% de las veces, obtendrás un tema diferente, elegido al azar de la taxonomía completa
- Cuando llames con éxito a la API de temas, obtendrás un máximo de 3 temas, 1 por cada una de las 3 semanas anteriores
- Esto significa que Android debe almacenar al menos 15 temas principales, muchos de los cuales probablemente sean duplicados
- Las aplicaciones obtienen diferentes temas, gracias a la selección aleatoria y al ruido introducido, para garantizar que la aplicación A y la aplicación B, que podrían ser propiedad del mismo editor, no puedan triangularse en usuarios individuales
- Sin embargo, para llamar con éxito a la API de temas, es necesario que las aplicaciones o los SDK hayan observado interacción con ese tema en las últimas 3 semanas.
- No está 100% claro, pero lo que yo leo es que su aplicación de tema general con alto uso pero espacios publicitarios de bajo valor no puede llamar a un tema como "abogado de lesiones" o "cotización de precio de seguro de automóvil" para intentar capturar impresiones de anuncios de alto valor
- Además, Google dice que si la aplicación o el SDK "no llamaron a la API en el pasado para ese usuario en una aplicación sobre ese tema, entonces el tema no se incluirá en la lista devuelta por la API"
- Por lo tanto, si bien no está del todo claro, ya que tanto la aplicación como el SDK pueden ver ese tipo de interacción, puede haber una ventaja de escala incorporada en Temas en Privacy Sandbox para Android, simplemente debido al hecho de que los SDK más grandes y distribuidos verán más
- Esa ventaja de escala también será crucial, porque no se trata solo de visibilidad de los temas durante toda la vida: tiene que ser en las últimas tres semanas
Tenga en cuenta que las aplicaciones pueden desactivar completamente la API de Temas a través de su manifiesto y elementos XML. En este caso, las aplicaciones no contribuyen al cálculo semanal de temas, según Google. Algunas aplicaciones grandes que no valoran la API de Temas o desean compartir información sobre sí mismas con SDK de anuncios de terceros, y algunas aplicaciones pequeñas que priorizan la privacidad, podrían desactivarla por completo.
Desafíos actuales con los temas
Existen varios problemas potenciales con los temas. Tenga en cuenta que aún es pronto y que Google está solicitando comentarios, por lo que es posible que se resuelvan con el tiempo.
- Escala: si Google can’t convencer a suficientes editores y empresas de adtech para inscribirse, Topics API won’t tener datos suficientes para producir resultados significativos. En móvil, particularmente, esto won’t ser un problema ya que apps y anunciantes deben inscribirse para obtener medición de marketing.
- Visibilidad: según la definición de Topics API por Google, you won’t ver temas devueltos que you haven’t observado en el pasado. Esto podría limitar seriamente la segmentación.
- Granularidad de los temas: con solo cientos a unos pocos miles de temas, es difícil ser granular. Los deportes son un tema grande, pero puedo gustar 7 u 10 deportes diferentes, y puedo seguir 15 o 20 equipos, y gustar 30 o 40 jugadores.
- Número limitado de temas para apps: las apps solo podrán añadir 3 temas al historial de temas del usuario’s en un período determinado. Eso’s realmente limitante para una app grande como NY Times, que maneja literalmente cientos, si no miles, de temas.
- Sin información de ubicación: la API de temas actualmente no parece tener ningún conocimiento ni provisión para información de ubicación, que puede ser un componente crítico para la segmentación y también puede afectar significativamente la taxonomía de temas.
- Huecos cuando no hay coincidencia: ¿qué ocurre si no hay correlación entre los temas asignados a una app y los temas que un usuario ha generado? ¿Qué anuncios ven entonces?
Interés, próximos pasos de Google y participación
Claro que existen algunas limitaciones para el interés como factor de segmentación. Que me gusten los deportes no significa que quiera comprar una camiseta de mi equipo favorito. El interés también es general y a largo plazo, a diferencia del comportamiento accionable impulsado por factores como las búsquedas, que muestran una mayor intención y, por lo tanto, probablemente un mayor valor.
También, los intereses son difíciles de correlacionar con la intención de compra. Como Shamanth Rao en Rocketship HQ dice:
Los cinco "temas" a los que accede un SDK sobre un usuario representan una pequeña parte de su personalidad. Si el tema que me asignan es Europa, ¿es porque soy estadounidense y quiero visitar el continente? ¿Porque soy economista y estoy investigando? ¿Estoy leyendo un libro sobre Europa? Será difícil identificar cuál de esos contextos se aplica a mí
Es un paso adelante. Y mantener los datos en el dispositivo supone una importante victoria para la privacidad.
Aún queda mucho por descubrir. Y no está claro cuán bien funcionará comparado con GAID (los expertos apuestan a que no tan bien). Además, cómo funcionan las redes publicitarias con Topics y cómo la mediación opera con — o ignora — la tecnología aún está por definir. Google no tiene que obligar a todos a usar su tecnología, pero la eventual desactivación del GAID obligará al ecosistema adtech a tomar esto en serio como medio y método para conectar el anuncio correcto con la persona adecuada en el momento preciso.
En otras palabras, para gestionar con éxito la segmentación de anuncios.
Todavía faltan dos años para que Google descontinúe el identificador de publicidad de Android, pero si nuestra experiencia en iOS significa algo, aquellos que se preparen para el cambio antes de que ocurra obtendrán mejores resultados.
Buenas noticias para los anunciantes: el referente de Google seguirá activo. Por lo tanto, al igual que en la web, podrán obtener la identificación del último clic del origen de un clic, lo cual es un dato útil para añadir a su conjunto de información de medición de marketing.