BERT란 무엇이고 검색 순위에 어떠한 영향을 주는지에 대해 이해하기 쉽게 설명을 해보도록 하겠습니다. 이 요소를 이해하고 어떻게 적용해야하는지에 대해서도 확인을 해보겠습니다.
BERT란 무엇인가
BERT는 단어 조합을 분석하여 시스템이 어떠한 의미와 의도를 가지고 있는지에 도움이 되는 시스템입니다.
단순 키워드에 대한 이해가 아니라 단어의 조합을 이해시키고, 이러한 조합을 이용하여 콘텐츠의 문맥을 이해기시는 시스템입니다.
2019년에 출시된 BERT는 자연어 이해에 큰 변화를 가져왔으며, 단어 조합이 어떻게 다른 의미와 의도를 표현하는지 이해하는 데 도움이 되었습니다.
BERT는 단순히 개별 단어와 일치하는 콘텐츠를 검색하는 것이 아니라 단어 조합이 복잡한 아이디어를 어떻게 표현하는지 이해합니다.
BERT는 순서대로 단어가 어떻게 연결되어 있는지 이해하므로 아무리 작은 단어라도 쿼리에서 중요한 단어를 삭제하지 않도록 보장합니다.
예를 들어, “약국 약국에서 약을 구할 수 있나요?”를 검색하면 BERT는 다른 사람을 위해 약을 구할 수 있는지 알아내려고 한다는 것을 이해합니다.
BERT 이전에 우리는 짧은 전치사를 당연하게 여겼고 대부분 처방전 작성 방법에 대한 결과를 공유했습니다. BERT 덕분에 우리는 작은 단어라도 큰 의미를 가질 수 있다는 것을 이해합니다.
오늘날 BERT는 거의 모든 언어 쿼리에서 중요한 역할을 합니다. 이는 BERT 시스템이 관련 결과를 제공하는 가장 중요한 두 가지 작업인 순위 지정 및 검색에서 탁월하기 때문입니다.
BERT는 복잡한 언어 이해를 기반으로 문서의 관련성을 매우 빠르게 평가할 수 있습니다. 또한 BERT 교육을 통해 레거시 시스템을 개선하여 순위를 매기기 위해 관련 문서를 검색하는 데 더 유용하게 만들었습니다.
BERT는 검색에서 중요한 역할을 하지만 결코 단독으로 작동하지 않습니다. 모든 시스템과 마찬가지로 BERT는 고품질 결과를 공유하기 위해 함께 작동하는 시스템 앙상블의 일부입니다.
출처 : 구글
왜 만들었는가?
매사람들은 매일 많은 검색을 하고 있으며, 새로운 콘텐츠가 올라옵니다. 그리고 이 중 15% 정도가 새로운 검색어가 올라옵니다.
구글에서는 이러한 검색어에 대한 결과를 이끌어내기 위해서 만든 시스템입니다.
검색의 핵심은 언어를 이해하는 것입니다. 검색어에서 다언의 철자나 조합에 관계없이 검색하는 내용을 파악하고 유용한 정보를 표시하게끔 하는 것이 목표입니다.
예 : 강아지 = 댕댕이 = 멍멍이
의미에 대한 부분은 위와 같이 이해를 하게 된다는 것입니다. 그래서 의미가 비슷한 키워드를 사용하였을 때 문장의 맥락을 이해하게 된 것입니다.
이 시스템을 어떻게 유용하게 사용할까?
단순 키워드의 의미만 여러방면으로 이해를 하는 시스템이 아닙니다. 키워드의 단어와 문장의 모든 단어를 관련하여 의미를 이해하는 시스템이기에 자연스럽게 문장을 써도 이해를 잘할 수 있습니다.
예를 들어서,
“효과좋은 다이어트약”이라는 단어를 타이틀로 만든다고 하면, “21세기 몸에 좋고 효과좋은 검증된 다이어트 기능성 약“이라고 만들었다고 하면, 빨간 단어들을 시스템이 분류하여 이해하여 효과좋은 다이어트약과 동일한 의미로 받아들이게 됩니다.
이렇게 되었을 때 키워드별 검색어를 시스템이 이해를 하고 검색 결과를 보여주기때문에 키워드 단어에 너무 신경쓰지마시고, 사용자들이 읽기 쉽고, 클릭하고 싶은 타이틀을 만드시는 것이 더욱 좋습니다.
이러한 단어조합은 보다 좋은 관련성 높은 검색 결과를 제공할 수 있습니다.
내용 출처: https://blog.google/products/search/search-language-understanding-bert/
반면 이러한 단어조합의 의미를 이해를 한다는 것은 Spam성 단어에 대한 조합도 이해를 할 수가 있다는 것입니다. 과거에는 검색어의 조합에 따른 검색 결과를 보여줬다면, 이제는 검색 조합에 따른 사용자 데이터를 이용하여 Spam성 단어를 이해를 할 수 있습니다. 그렇기때문에 반대로 단어 조합을 이용하여 Spam성 단어 조합 데이터를 분석할 수 있습니다.
- 단지 분석을 할뿐이지 Spam성으로 분류하지는 않을것입니다. 구글은 무분별하게 분류를하기보다는 데이터 검증을하여 구분을 하기때문입니다.
- Spam 문서에 점수를 준다면, 구글의 경우 마이너스 점수를 주기보다는 의미가 없는 문서는 그냥 0점입니다. 가산점을 줄만한 페이지에 점수를 주고 노출 기회를 준다고 생각하시면 좋습니다.
결론
이미 시스템은 구현이 되었고, 데이터를 취합하여 반영을 해야하는 문제가 있는데, 2022년 말부터 AI 시스템이 도입이 되었다는것은 데이터 취합이 어느정도 되었다고 봐야합니다.
그렇기에 너무 키워드를 검색량에 맞추어서 조합하는것보다는 부드럽고 자연스럽게 만드시는 것을 추천드립니다.
SEO 플로그인의 키워드 점수가 안오른다고요? 이부분도 구글에서는 너무 믿지 말라고하니 문맥에 집중하시길 바랍니다.
참고글 : https://www.searchenginejournal.com/google-dont-rely-on-seo-tools-to-tell-you-how-to-write/501758/