일론 머스크가 올해 github에 X (구 트위터) 추천 알고리즘을 올렸습니다. 대단하죠. 그만큼 이제는 알고리즘이 밝혀져도 자신있다는 것인데, 한번 살펴보겠습니다. 아래의 2개의 페이지를 자세히 보시면 됩니다.
X (구 트위터) 추천 알고리즘 작동 원리 요약
X (구 트위터) 추천 알고리즘 기본은 트윗, 사용자 및 참여 데이터에서 잠재 정보를 추출하는 핵심 모델 및 기능 집합이라고 합니다. 여기서도 사용자의 참여 데이터를 보고 트윗을 추천해줍니다.
- 앞으로 다른 사용자와 상호작용할 가능성은 얼마나 되는지 예측
- candidate sourcing이라는 프로세스를 통해 다양한 추천 소스에서 최고의 트윗을 가져옵니다.
- 기계 학습 모델을 사용하여 각 트윗의 순위를 지정합니다.
- 차단한 사용자의 트윗, NSFW 콘텐츠, 이미 본 트윗 필터링 등 적용 휴리스틱 및 필터
X (구 트위터)도 마찬가지로 사용자들끼리의 상호작용할 것을 예측하고, 트윗, 리트윗, 좋아요와 같은 소스를 가지고 트윗의 질을 판단하네요.
그리고 이러한 트윗들을 머신러닝으로 순위를 지정합니다. 또한 다른 X (구 트위터)들이 차단한 것과, 성인 콘텐츠와 같은 Spam성 트윗을 필터하여 점수에 적용한다고 보시면 됩니다.
X (구 트위터)에서 트윗을 검색하는데 우선순위로 보여줄때 가장 중요한 것이
- 네트워크 내 소스 ( 가장 큰 점수를 주는 소스이고, 내가 팔로우하는 사용자로부터 가장 관련성이 높은 최근 트윗을 전달하는 것을 목표로 함) 최근에는 순위 모델을 재설계하는 과정이라고 합니다. 기본적인 중요성은 변함이 없을 듯 합니다.
- 팔로우 하지 않는 트윗이 나와 연관이 있는지 어떻게 알 수 있을까를 알려주는 소스입니다. X (구 트위터)는 내가 팔로우하는 사람들이나 비슷한 관심사를 가진 사람들의 참여를 분석하여 나와 관련성이 있다고 생각하는 것이 무엇인지 추정함.
- X (구 트위터) 역시 상호작용이 중요하므로 좋아요. 댓글, 리트윗과 같은 것이 상당히 중요합니다.
X (구 트위터) 추천 알고리즘 Ranking
For You 타임라인의 목표는 관련 트윗을 제공하는 것입니다. 파이프라인의 이 시점에서 관련성이 있을 수 있는 후보자는 최대 1,500명입니다. 점수를 매기는 것은 각 트윗 후보의 관련성을 직접적으로 예측하며 타임라인에서 트윗 순위를 매기기 위한 기본 신호입니다. 이 단계에서는 모든 후보자가 출처가 무엇인지에 관계없이 모든 후보자가 동등하게 취급됩니다.
순위는 긍정적인 참여(예: 좋아요, 리트윗, 답글)를 최적화하기 위해 트윗 상호 작용에 대해 지속적으로 훈련되는 ~4,800만 매개변수 신경망을 통해 달성됩니다. 이 순위 메커니즘은 수천 개의 기능을 고려하고 10개의 라벨을 출력하여 각 트윗에 점수를 부여합니다. 여기서 각 라벨은 참여 가능성을 나타냅니다. 우리는 이 점수를 바탕으로 트윗의 순위를 매깁니다.
휴리스틱, 필터 및 제품 기능 (Spam)
Ranking 단계 이후에는 휴리스틱과 필터를 적용하여 다양한 제품 기능을 구현합니다. 이러한 기능은 함께 작동하여 균형 있고 다양한 피드를 만듭니다. 몇 가지 예는 다음과 같습니다.
출처 : 트위터 블로그
- 공개 여부 필터링: 콘텐츠와 선호도에 따라 트윗을 필터링합니다. 예를 들어 차단하거나 뮤트한 계정에서 트윗을 삭제하세요.
- 저자 다양성: 단일 작성자의 연속 트윗이 너무 많이 나오지 않도록 하세요.
- 콘텐츠 균형: 네트워크 내 트윗과 네트워크 외부 트윗의 균형을 공정하게 유지합니다.
- 피드백 기반 피로: 시청자가 부정적인 피드백을 제공한 경우 특정 트윗의 점수를 낮춥니다.
- 소셜 증명: 품질 보호를 위해 트윗에 대한 2차 연결이 없는 네트워크 외부 트윗을 제외합니다. 즉, 내가 팔로우하는 사람이 트윗에 참여했거나 트윗 작성자를 팔로우하는지 확인하세요.
- 대화: 답글을 원본 트윗과 함께 스레드하여 답글에 더 많은 맥락을 제공합니다.
- 수정된 트윗: 현재 기기에 있는 트윗이 오래된 것인지 확인하고 이를 수정된 버전으로 대체하라는 지침을 보냅니다.
결론
X (구 트위터) 운영을 위해서 아래에 풀이를 했습니다. X (구 트위터) 추천 알고리즘을 이용한 원리는 간단합니다. 사람들과의 소통을 하면서 시간을 두고 성장시키는 것이 핵심입니다.
알고리즘으로 운영이 된다는것은 점수가 있는 것이고, 이러한 점수를 시간을 두면서 쌓아가는 것이 중요합니다.
아래의 내용을 자세히 살펴보시길 바랍니다.
- X (구 트위터) 추천 알고리즘 이해하고 운영하기 (구독자에 한해 정보를 볼 수 있습니다.)