구글은 엄청난 가짜 리뷰 (Spam)을 차단할 수 있는 알고리즘을 적용하였고, 이전보다 더 정확하게 차단을 한다고 합니다. 이 가짜 리뷰를 차단하는 방식은 매일 새로운 정보를 업데이트하면서 비교 분석하여 식별한다고 봐야합니다.
AI를 이용해 가짜 리뷰를 어떻게 잡아내는가?
- 구글은 1억 7천만 개가 넘는 가짜 리뷰를 차단하고 AI 기반 알고리즘을 사용하여 업체의 평판을 보호합니다.
- 구글은 새로운 알고리즘을 도입하여 가짜 리뷰를 빠르게 감지하고, 이전보다 45% 더 높은 정확도로 차단합니다.
- 이를 통해 구글은 고객을 오도하고 지역 비즈니스에 해를 끼치는 가짜 리뷰의 급증을 차단하고 있습니다.
- 구글은 영업시간, 고객 리뷰 등의 세부정보를 포함하여 매일 약 2천만 건의 업데이트를 받으며, 새로운 알고리즘이 패턴을 분석하여 의심스러운 리뷰 활동을 신속하게 식별합니다.
- 새로운 알고리즘은 Google의 검토 프로세스를 효율적으로 만들어 패턴을 식별하고 대량의 데이터를 처리하며, 사기적인 리뷰를 차단합니다.
- 마케팅 담당자는 구글의 향상된 리뷰 감지 기능을 고려할 때 진정성에 초점을 맞추고, 리뷰를 모니터링하고 고객과 소통하는 것이 중요합니다.
구글은 최근에 1억 7천만 개가 넘는 가짜 리뷰를 차단하고, AI 기반 알고리즘을 도입하여 업체의 평판을 보호하는 데 성공했습니다. 이러한 가짜 리뷰의 급증으로부터 소비자와 지역 비즈니스를 보호하기 위해 구글은 새로운 기술을 도입했으며, 이로써 가짜 리뷰를 빠르게 감지하고, 더 정확하게 차단할 수 있게 되었습니다.
2023년에 구글은 1억 7천만 개가 넘는 가짜 리뷰를 차단한 것으로 보고되었습니다. 이는 이전에 비해 45% 증가한 수치이며, 이는 새로운 AI 알고리즘이 더욱 빠르고 정확하게 가짜 리뷰를 식별하는 데 기여했습니다. 구글은 이러한 가짜 리뷰의 식별에 대한 새로운 알고리즘을 도입하여 시간이 지남에 따른 패턴을 분석하고, 의심스러운 활동을 신속하게 식별하는 방법에 대해 설명했습니다. 이러한 노력은 지역 비즈니스 소유자들에게는 환영받을 만한 구제책으로 작용했습니다.
또한 구글은 지역 비즈니스 정보에 대한 업데이트를 관리하면서 매일 약 2천만 건의 업데이트를 수신했다고 밝혔습니다. 이러한 방대한 양의 데이터를 처리하면서 구글은 데이터의 무결성을 유지하고 오해의 소지가 있는 정보나 기만적인 내용을 신속하게 식별하고 제거하는 새로운 알고리즘을 구현했습니다.
구글은 또한 새로운 알고리즘을 통해 거짓 긍정 리뷰를 작성하고 이를 통해 돈을 벌려는 사기 행위를 식별했습니다. 이를 통해 구글은 사기적인 리뷰가 더 이상 퍼지는 것을 방지하고, 지역 비즈니스와 소비자의 신뢰를 회복할 수 있었습니다.
이러한 노력을 통해 구글은 가짜 리뷰를 식별하고 차단하는 데 성공했으며, 이를 통해 지역 비즈니스에 더욱 공정하고 안전한 온라인 환경을 제공할 수 있게 되었습니다. 이는 마케팅 담당자들이 고객과 소통하고, 진정성에 초점을 맞추며, 리뷰를 지속적으로 모니터링하여 소비자와의 신뢰를 유지하는 데 도움이 될 것입니다.
출처 : https://www.searchenginejournal.com/google-uses-ai-to-detect-fake-online-reviews-faster/508093/
기술적으로 어떻게 위와 같은 리뷰를 분석하고 식별하는지에 궁금할텐데요. 구글 리뷰 시스템 알고리즘 프로세스는 아래와 같다고 봐야합니다.
1. 데이터 수집
구글은 지속적으로 온라인에서 발생하는 리뷰 데이터를 수집합니다. 이 데이터에는 텍스트 리뷰, 평점, 리뷰 작성자의 프로필 정보 등이 포함될 수 있습니다.
2. 전처리
수집된 데이터는 전처리 과정을 거쳐 텍스트를 토큰화하고, 불필요한 문자를 제거하며, 형태소 분석 등의 과정을 거쳐 정제됩니다. 이는 알고리즘이 텍스트를 이해하고 처리하는 데 도움이 됩니다.
3. 특성 추출
텍스트 데이터에서 특징을 추출합니다. 이 단계에서는 TF-IDF, Word2Vec, GloVe 등의 기법을 사용하여 각 리뷰의 특징을 나타내는 벡터를 생성합니다.
4. 학습 알고리즘 적용
추출된 특징 벡터를 입력으로 하여 기계 학습 알고리즘을 적용합니다. 이 알고리즘은 과거의 리뷰 데이터를 기반으로 학습하여 가짜 리뷰와 실제 리뷰를 구분하는 패턴을 파악합니다. 이러한 알고리즘으로는 로지스틱 회귀, 서포트 벡터 머신, 랜덤 포레스트 등이 사용될 수 있습니다.
5. 모델 평가
학습된 모델의 성능을 평가합니다. 이 단계에서는 정확도, 재현율, 정밀도 등의 지표를 사용하여 모델의 성능을 측정합니다. 필요에 따라 모델을 조정하고 성능을 향상시키는 작업이 수행될 수 있습니다.
6. 예측 및 분류
학습된 모델을 사용하여 새로운 리뷰를 분류하고 예측합니다. 이를 통해 가짜 리뷰와 실제 리뷰를 식별하고 필요한 조치를 취할 수 있습니다.
7. 실시간 업데이트
구글은 실시간으로 리뷰 데이터를 모니터링하고 알고리즘을 업데이트하여 새로운 패턴이나 트렌드를 반영합니다. 이를 통해 알고리즘이 항상 최신 정보를 기반으로 작동할 수 있습니다.
위와 같은 방법으로 패턴을 형성하면서 매일 업데이트 되는 데이터를 다시 넣어서 분석하고 결과치를 얻는다고 합니다.
한마디로 이제는 실제 리뷰를 만들지 않으면, 시간이 지날수록 높은 확율로 필터에 걸러진다고 봐야합니다.
spam 형식으로 일처리를 줄이려는 것은 알지만, 이제는 안통하고 지금 통해도 언젠가는 잡힌다는것~잊지마세요!