RankBrain 알고리즘은 구글 가이드에 나와있는 검색 순위 시스템에서 중요한 요소입니다. 하지만 이번 미국 독점금지 재판을 하게되면서 알고리즘의 중요성이 오픈되었습니다. 이에 대해서 공유를 해보겠습니다.
RankBrain 알고리즘
RankBrain은 단어와 개념간의 관계를 이해하는데 도움을 주는 AI 시스템입니다. 즉, 콘텐츠가 다른 단어 및 개념과 관련이 있다는 것을 이해하면 검색에 사용된 단어가 모두 포함되어 있지 않더라도 관련 콘텐츠를 더 효과적으로 반환할 수 있습니다.
출처 : 구글 검색 센터 Rankbrain
랭크브레인은 2015년에 구글에서 검색에 배포된 최초의 딥러닝 시스템입니다. 당시에는 지금의 AI를 맞먹을 빅데이터 기술이기때문이었는데요.
이 알고리즘은 단어가 문장의 개념과 어떤 관련이 되는지를 이해하는데 도움이 됩니다.
데이터를 계속 수집하여 단어가 어떠한 의미와 개념으로 사용되는지를 꾸준하게 학습하고 결과치를 만들게 되는 알고리즘입니다. 이러한 학습을 지속적으로 하게되면서 복잡한 쿼리를 해석하게 되었습니다.
QBST (Query-Based Salient terms)
결과 순위에 영향을 주기 위해 쿼리 및 관련 문서 내의 중요한 용어에 중점을 둡니다. 대조적으로, 용어 가중치는 검색 결과와의 사용자 상호 작용을 기반으로 쿼리에서 개별 용어의 상대적 중요성을 조정하여 쿼리 컨텍스트 내에서 용어 관련성을 결정합니다.
검색 엔진이 사용자 검색어의 가장 중요한 측면을 신속하게 인식하고 관련 결과의 우선순위를 지정할 수 있음을 의미합니다.
QBST는 BERT의 한계와 관련하여 언급됩니다. 구체적인 언급은 ” BERT는 navboost, QBST 등과 같은 대규모 기억 시스템을 포함하지 않습니다. “입니다.
이는 BERT가 자연어를 이해하고 처리하는 데 매우 효과적이지만 특정 제한 사항이 있다는 것을 의미합니다. 그 중 하나는 처리 능력입니다. 또는 QBST와 같은 대규모 암기 시스템을 대체합니다.
미국 독점금지 재판에서 공개된 알고리즘
출처 : https://searchengineland.com/how-google-search-ranking-works-pandu-nayak-435395
- 상위 20개 또는 30개 문서를 살펴보고 초기 점수를 조정할 수 있습니다.
- Google의 다른 순위 구성 요소 중 일부보다 비용이 많이 드는 프로세스입니다(수백 또는 수천 개의 결과를 실행하기에는 너무 비용이 많이 듭니다).
- Google이 운영하는 모든 언어 및 지역의 쿼리에 대한 교육을 받았습니다.
- IS( 정보 만족도 ) 등급 데이터를 미세 조정합니다 .
- 인간 평가자 데이터만으로는 학습할 수 없습니다.
- RankBrain은 항상 새로운 데이터로 재교육됩니다(수년 동안 RankBrain은 13개월치의 클릭 및 쿼리 데이터에 대해 교육을 받았습니다).
- “RankBrain은 훈련하면서 롱테일 사용자의 요구를 이해합니다…” Nayak이 말했습니다.
위에 내용은 가이드에 없는 내용이기때문에 굉장히 중요한 정보인데요. rankbrain의 알고리즘은 롱테일 사용자의 요구를 이해하기때문에 너무너무 중요한 요소가 되었습니다.
또한 언어와 지역안에서의 검색어를 학습하고, 언어간의 매칭을 할 수가 있기때문에 번역이나 중복 문서에서도 중요한 영향을 주는 시스템입니다.
이 알고리즘은 사용자 데이터만으로 학습하는 것이 아니라 문구의 단어와 문장의 구문을 학습합니다.
글을 쓸때 이제는 키워드 위치와 수에 신경쓰지 않고 자연스럽게 써도 되는 이유가 이러한 알고리즘때문입니다.
사용자들이 제대로 읽고, 사용자 반응의 데이터를 끌어내기 위해서는 이제는 SEO툴에 의지하는 것보다는 자연스럽게 콘텐츠를 작성하는 방향으로 만드시는 것을 추천드립니다.
RankBrain 최적화하는 방법
- 관련 키워드를 잘 조합해서 사용.
- 콘텐츠 질을 높여 사용자들의 반응을 이끌어 내야함.
- 내부링크 구조를 잘 짜야함.
- 구조화된 데이터 (스키마 마크업) 활용 필수.