Google Topics API: 문서에서 배운 11가지
FLoC는 끝났다. 구글 토픽 API 만세!.
구글은 많은 비판을 받았던 '집단 학습(Federated Learning of Crowds)' 기반의 개인정보 보호 광고 타겟팅 방식을 새로운 ' 토픽 API'. 구글 토픽은 침해적인 추적 없이 관련성 높은 광고를 제공하기 위해 개발되었습니다.
마케터들이 관련성 높은 광고를 제공하기 위해 사용하는 주요 데이터 유형은 네 가지입니다
- 문맥 데이터: 광고는 주변 콘텐츠와 어떤 면에서 유사하므로, 해당 콘텐츠를 찾아본 사람들은 광고에도 관심이 있을 가능성이 높습니다. (때로는 스쿠버 다이버들이 해변 휴가를 선호하는 경향이 있거나, 바이크 라이더들이 허름한 술집을 좋아하는 경향이 있는 것처럼, 관련 없는 통찰력도 활용될 수 있습니다.)
- 의도 데이터: 광고는 사용자가 최근에 입력한 검색어와 관련이 있으므로, 이론적으로 사용자가 관심을 가질 만한 내용이어야 합니다.
- 행동 데이터: 광고는 사용자가 최근에 한 일과 방문한 장소(앱이나 웹사이트 같은 가상 공간 포함)와 관련이 있으므로, 사용자가 좋아할 만한 다른 콘텐츠와도 관련이 있어야 합니다.
- 인구 통계 데이터: 광고는 위치, 연령, 사회경제적 요인을 기반으로 특정 인구 통계 집단과 광범위하게 관련성이 있으며, 따라서 광고를 보는 사람에게도 관련성이 있을 가능성이 높습니다.
새로운 Topics API는 본질적으로 개인정보를 안전하게 보호하는 행동 데이터 수집을 목표로 합니다. 기존의 행동 데이터는 IDFA,GAID, 쿠키와 같은 기기 식별자를 통해 제3자 광고 타겟팅용 그래프를 구축하는 방식으로 개인정보를 침해해 왔습니다. 하지만 Topics API는 본질적으로 확률적이고 분산된 방식으로 작동합니다. 사용자의 브라우저에서 실행되며 클라우드의 대규모 데이터베이스에 데이터를 저장하지 않습니다.
모바일 사용자 확보를 통해 앱을 개발하려는 모바일 마케터에게 웹 중심의 새로운 광고 타겟팅 방식이 중요한 이유는 무엇일까요?
간단히 말해서, 웹에서 앱으로의 전환은 점점 더 효과적이고 저렴하며 성공적인 사용자 확보 수단이 되고 있기 때문에 모바일 마케터에게 중요합니다. 그리고 누가 알겠습니까? 만약 이 기술이 성공적으로 구현된다면, 언젠가는 안드로이드에서 개인정보 보호를 강화한 모바일 앱 마케팅으로 이어질 수도 있을 것입니다.
그리고 이건 구글에서 가져온 거예요.
구글이 광고 기술 분야에서 세계 최대 기업 두 곳 중 하나로 자리매김하고 있는 만큼, 구글의 새로운 마케팅 및 광고 정책이나 제안은 마케터들에게 본질적으로 흥미롭고 중요한 의미를 지닙니다.
그래서 I’m API를 살펴보고, I’m 이 작업을 단계별로 진행합니다: API 문서의 텍스트와 해설을 제공합니다. (참고로, I’m 바보같이 실수했다면, 알려 주세요! We’re 함께 더 똑똑해집니다.)
토픽 API는 관심사 기반입니다
"웹에서 타사 쿠키가 곧 제거됨에 따라 브라우저가 지원하고자 하는 주요 사용 사례는 새로운 API를 통해 해결해야 할 것입니다. 그중 하나가 관심 기반 광고입니다."
여기서 핵심은 관심사 기반 광고입니다. 이는 대개 문맥을 통해 추론하거나 디지털 추적을 통해 파악해 왔습니다. 하지만 문맥은 특정 시점의 제한된 관점만을 보여주는 반면, 관심사는 장기적인 추세를 반영하기 때문에 토픽 API는 시간이 지남에 따라 하나 이상의 관심사를 제공할 수 있습니다.
중요 사항: 이는 의도적인 것이 아니며, 이는 매우 중요한 점입니다.
2021년에는 IDFA(식별자 식별자)의 사용 중단과 개인정보 보호의 지속적인 확산에 따라 의도 분석이 크게 증가했습니다. 의도 분석은 경제 활동을 포함한 미래 활동을 예측하는 데 매우 유용하기 때문입니다. 이러한 분석은 여전히 주로 검색 엔진의 영역입니다.
하지만 토픽 API는 세부적인 제어가 어렵습니다
"토픽 API의 목적은 호출자(스크립트를 실행하는 페이지의 제3자 광고 기술 또는 광고 제공업체 포함)에게 페이지 방문자가 현재 관심을 가질 만한 포괄적인 광고 주제를 제공하는 것입니다. 이러한 주제는 현재 페이지의 문맥 정보를 보완하고, 방문자에게 적합한 광고를 찾는 데 도움이 되도록 조합될 수 있습니다."
이건 전혀 세분화된 게 아닙니다. 사실, 아주 거친 세분화입니다.
처음에는 350개의 주제만 다룰 예정인데, 이는 매우 적은 수입니다. 참고로 IAB 분류 체계는 1500개의 용어로 구성되어 있는데, 이는 수십만 개의 용어를 포함하는 완성도 높은 분류 체계와 비교하면 정말 극히 제한적인 수준입니다.
다음은 구글이 제시하는 쿠키와 토픽의 비교입니다
이 모든 주제들은 그 자체로 하나의 거대한 세계입니다. 예를 들어 스포츠를 생각해 보세요. 어떤 스포츠일까요? 야구, 하키, 럭비? 아니면 발가락 씨름(네, 실제로 존재합니다)? 타조 경주는요? 설령 스포츠 주제를 야구로 좁힐 수 있다고 해도, 마케터들은 실질적인 마케팅 활동을 위해서는 사람들이 어떤 팀에 관심을 갖는지 알아야 합니다.
요약하자면, 마케터들에게 유용하려면 훨씬 더 많은 개선이 필요합니다. 흥미롭게도 FLoC는 더 많은 옵션과 더 높은 정확도를 제공했습니다
웹사이트와 주제를 연결하는 공개 매핑이 있을 수 있습니다
"주제는 브라우저에서 추론됩니다. 브라우저는 분류 모델을 활용하여 사이트 호스트 이름을 주제에 매핑합니다. 분류기 가중치는 공개되며, 외부 파트너가 구축할 수도 있고 시간이 지남에 따라 개선될 것입니다. 사이트에서 자체 주제를 제공하는 것이 합리적일 수 있습니다…"
구글이나 제3자가 개발한 분류 모델이 브라우저, 그리고 토픽 API에 웹사이트의 주제를 알려줍니다. 이러한 가중치는 공개되어 있으며, 일부 사이트는 토픽 알고리즘에서 더 높은 가중치를 받게 됩니다
하지만… 가중치가 공개된다고 해서 모델 자체가 공개되는 것은 아닙니다.
학습 기회가 제한될 것입니다
"document.browsingTopics()는 이전 3개 에포크(주)에서 각각 하나씩, 최대 3개의 주제로 구성된 배열을 반환합니다. 반환되는 배열은 무작위 순서로 정렬됩니다. 3개의 주제를 제공함으로써 방문 빈도가 낮은 사이트는 관련 광고를 찾기에 충분한 주제를 확보할 수 있지만, 매주 방문하는 사이트는 매주 최대 하나의 새로운 주제만 학습하게 됩니다."
타사 쿠키는 사라지고 있으며, 그럴 만한 이유가 있습니다. 하지만 마케터의 관점에서 보면, 타사 쿠키를 통해 광고 타겟팅에 필요한 상당한 양의 데이터를 얻을 수 있습니다. 구글의 토픽 API가 구현된다 하더라도, 웹사이트에 일련의 관심사를 제공하는 것이 아니라 매주 새로운 주제 하나씩만 제공할 것입니다.
참고로, 주제는 3주 동안만 유지됩니다.
게다가 구글은 신호에 노이즈를 추가할 것입니다
"매주 사용자의 상위 5개 주제는 브라우저에 저장된 검색 정보를 기반으로 계산됩니다. 여기에 무작위로 선택된 주제 하나가 추가되어 해당 주/기간 동안 사용자에게 연결된 총 6개의 주제가 됩니다. document.browsingTopics()가 호출될 때, 매주 주제는 다음과 같이 사용 가능한 6개의 주제 중에서 선택됩니다. 무작위로 선택된 주제가 반환될 확률은 5%입니다."
이제 잘못된 데이터가 포함될 가능성이 있습니다. 상위 5개 주제 중 1개는 무작위로 생성되며, Topics API를 호출할 때 이 무작위로 생성된 주제를 받게 될 확률은 5%입니다. 즉, 자체적으로 디바이스 그래프를 구축하는 경우 완벽하게 깨끗한 데이터를 얻을 수는 없을 것입니다.
하지만… 5% 확률의 무작위 데이터는 그다지 무작위성이 높지 않습니다.
타겟팅 데이터는 반복적일 것입니다
"어떤 주제가 반환되든, 해당 사이트의 모든 발신자에게 남은 3주 동안 계속해서 해당 주제가 반환될 것입니다."
첫날에 "스포츠"를 받았나요? 그럼 21일째 되는 날에도 "스포츠"를 받을 수 있어요.
헨리 포드식이라고 할까요? 이전에 구매했던 색상과 동일한 색상이라면 어떤 색이든 다시 구매할 수 있어요.
사이트 네트워크는 지문 인식에 그다지 효과적이지 않을 것입니다
"각 사이트에 여러 주제 중 하나만 할당하는 이유는 사이트마다 다른 주제를 다루도록 하여 동일한 사용자를 사이트 간에 연관 짓기 어렵게 만들기 위함입니다."
35개의 서로 다른 웹사이트를 소유하고 모든 웹사이트 방문자에 대한 확정적인 신원 그래프를 구축하는 것은 불가능합니다. 물론 대부분의 브랜드나 웹사이트가 35개의 웹사이트를 실제로 소유할 수 있는 것은 아니지만, 이는 수천, 심지어 수백만 개의 웹사이트에 걸쳐 기기 또는 신원 그래프를 생성하도록 설계된 타사 플러그인이 제대로 작동하지 않을 것임을 의미합니다.
아니면 적어도 훨씬 더 힘든 일을 하게 되겠죠.
아이고: 이미 알고 있는 것만 배울 수 있을 뿐이죠 (광고 네트워크가 아닌 이상)
모든 API 호출자가 토픽을 수신하는 것은 아닙니다. 지난 3주 이내에 해당 사용자가 관련 토픽이 있는 사이트를 방문한 기록이 있는 호출자만 토픽을 수신할 수 있습니다. 호출자(특히 호출 컨텍스트의 사이트)가 과거에 해당 사용자가 관련 토픽이 있는 사이트를 방문했을 때 API를 호출한 적이 없다면, API에서 반환되는 배열에 해당 토픽이 포함되지 않습니다.
이와 관련하여 Google의 예시에 따르면, Topics API에서 토픽 정보를 가져올 수 있는 주체는 사전에 정의된 일치하는 사이트 토픽을 사용하여 해당 사이트에서 Topics API를 호출한 적이 있는 주체뿐입니다.
(만약 이게 혼란스럽다고 생각하신다면, 당신 생각이 맞는 것 같습니다.)
구글은 이를 다음과 같이 설명합니다
이론적으로 첫 주에 특정 사이트에 'X'라는 주제가 등록되어 있는데도 'Topics API' 호출이 발생하지 않으면, 해당 사이트는 둘째 주에 재방문자로부터 'X'라는 주제 관련 정보를 다시 받을 수 없습니다.
제 생각에는 퍼블리셔와 애드테크 업체들이 최대한 많은 타겟팅 데이터를 얻기 위해 가능한 한 많은 주제에 대해 Topics API를 최대한 자주 호출해야 한다는 뜻인 것 같습니다. 분명히 이는 다른 방법(계정, 핑거프린팅, 기타 방법)으로 추적하는 단골 고객이나 재방문 고객의 경우, Topics API를 통해 얻을 수 있는 정보는 다른 소스에서 이미 알고 있는 내용뿐이라는 것을 의미합니다.
또 다른 반전이 있습니다. 토픽 API 생태계에서는 광고 네트워크나 거래소 같은 제3자와 토픽을 합법적이고 윤리적으로 공유할 수 있는데, 이는 다른 어떤 내부 방식보다 개인정보 보호에 더 안전할 가능성이 높습니다. 제가 이야기를 나눈 한 사람은 이것이 의도적인 설계라고 설명했습니다. 퍼블리셔는 사용자에 대해 거의 알지 못하지만, 광고 타겟팅/구매/판매/전달을 담당하는 애드테크 도구는 사용자에 대한 정보를 모두 알고 있다는 것입니다.
( 자사 데이터? 사용자들이 로그인 회원이 되고, 가입하고 로그인하도록 충분히 매력적인 환경을 조성하세요.)
주제가 많은 대형 사이트는 어려움을 겪을 것입니다
"저희는 방문한 웹사이트의 전체 URL이나 콘텐츠와 같은 추가 정보 대신 웹사이트 호스트 이름만을 기반으로 관심 주제를 선택하는 방식을 제안합니다. 예를 들어, 'tennis.example.com'은 테니스 관련 주제를 포함할 수 있지만, example.com/tennis는 example.com과 관련된 일반적인 주제만 포함할 수 있습니다."
위키피디아는 당연히 위키피디아로 검색 순위가 올라가고, ESPN은 당연히 ESPN으로 검색 순위가 올라갈 겁니다. 아니면, 퍼블리셔들은 토픽 API를 완전히 활용하고 그 이점을 누리려면 사이트 구조와 URL 스키마를 재구성해야 할 텐데, 이는 규모가 커질수록 흥미로운 변화를 가져오겠지만 다른 많은 것들을 망가뜨릴 가능성도 있습니다.
구글은 개인정보 보호를 이유로 이 결정을 내렸다고 하는데, 이는 매우 이상한 행보입니다. 클릭 없이 검색하는 추세가 점점 증가하는 것을 목격해 온 SEO 전문가들은 이 의견에 동의하지 않을 수도 있습니다.
구글은 당신의 사이트가 무엇에 관한 것인지 결정할 것입니다
"사이트와 주제를 연결하는 정보는 비밀이 아니며, 크롬처럼 다른 곳에서도 확인할 수 있습니다. 사이트가 외부 도구를 통해 어떤 주제를 다루는지 알 수 있다면 좋을 것입니다."
그 문단의 두 번째 부분을 읽어보세요. "주제가 무엇인지 알면 좋겠습니다."라는 말은 애초에 그 정보를 제공하지 않고 있다는 뜻입니다. 그러니 구글이 대신 해줘야 한다는 거죠.
두려워하지 마세요.
구글은 나중에 "사이트와 주제를 연결하는 작업이 항상 정확하지는 않을 것"이라며 "시간이 지남에 따라 점진적으로 개선될 것"이라고 밝혔습니다
그리고 솔직히 말해서, 구글은 웹 검색과 광고 타겟팅 활동 모두에서 이미 사이트의 주제를 파악하고 있는 것 같습니다.
물론 사생활 보호는 최우선 사항입니다
"API는 쿠키에 비해 제공하는 정보의 양을 크게 줄여야 할 뿐만 아니라, 제3자 쿠키보다 더 많은 이해 관계자에게 정보를 노출하지 않도록 하는 것이 더 바람직합니다."
그리고 …
"API를 통해 드러나는 주제는 기존 추적 방법을 통해 얻을 수 있는 정보보다 사용자에게 개인적으로 민감한 정보가 훨씬 적을 것입니다."
구글의 목표는 개인정보를 보호하면서 타겟팅을 가능하게 하는 것입니다. 구글에 따르면 웹사이트나 네트워크가 사용자에 대해 알 수 있는 정보는 주당 최대 15개 주제로 제한되며, 이는 현재 타사 쿠키를 통해 수집되는 정보보다 훨씬 적은 양입니다.
이론상으로는 훌륭하지만… 실제로 얼마나 성공할지는 지켜봐야 할 겁니다.
Topics API는 타사 쿠키와 달리 특정 사용자의 주간 검색 주제 상위 5개에 해당하는 주제를 알려줍니다. 또한, 사용자와 지속적인 관계를 유지하는 사이트는 더 많은 데이터를 수집합니다. 구글은 "사이트가 동일한 사용자를 대상으로 동일한 사이트에서 API를 반복적으로 호출할수록 해당 사용자와 관련된 주제 목록이 생성됩니다."라고 설명하며, "이러한 주제 목록에는 민감한 주제와 의도치 않은 상관관계가 포함될 수 있습니다."라고 덧붙였습니다
하지만 이는 확률적이고 일반적입니다. 이는 타사 쿠키와 중요한 차이점입니다.
그리고 중요한 점은 투명성이 확보되어 있다는 것입니다. 우리는 모두 자신에게 배정된 주제를 확인할 수 있고, 마음에 들지 않는 주제는 삭제할 수 있으며, 원한다면 완전히 참여하지 않을 수도 있습니다. 이러한 개인적인 통제권은 매우 고무적입니다.
요약: 토픽 API가 출시될 예정입니다
FLoC는 이제 끝났습니다. Topics API가 새로운 계획인데, 구글이 두 개의 제안을 연달아 폐기할 것 같지는 않네요. 그래서 이번 계획은 상당히 진지하게 추진하고 있다고 봅니다. 하지만… 실현 가능하게 만들려면 구글뿐만 아니라 애드테크 및 퍼블리셔 커뮤니티의 많은 노력이 필요할 겁니다. 그리고 설령 모든 노력이 결실을 맺더라도 광고 타겟팅, 마케팅 측정, 광고 수익화에는 상당한 어려움이 있을 것입니다.
우리는 이런 이야기를 전에 본 적이 있습니다. 바로 iOS 14.5 때 말이죠.
본질적으로, 거의 아무도 심각하게 생각하지 않다가 실제로 일이 터지면 모두가 패닉에 빠집니다. 지출은 타겟팅과 측정이 더 용이한 생태계로 이동하고(페이스북이 이걸 얼마나 좋아할지 짐작이 가시죠?), 모두가 해결책을 찾고 새로운 개인정보 보호 기능을 우회하기 위해 새로운 기술(혹은 지문 인식 같은 기존 기술)을 개발하려고 애씁니다.
6개월에서 9개월간의 군비 경쟁 끝에 우리는 어느 정도 정상적인 생활로 돌아왔습니다.
저희가 도와드릴 수 있습니다
마케팅 성과 측정, 웹에서 앱으로의 전환, 모바일 우선 전략 수립 등 마케팅 관련 업무를 하고 계신가요? 비용 분석부터 기여도 분석, 모델링, 확률 분석까지 모든 데이터 솔루션이 필요하신가요? Singular 도와드리겠습니다.