Как YouTube рекомендует видео? Как работают алгоритмы youtube? Если хотите узнать механизмы и принципы работы искусственных нейронных сетей, по которым они производят ранжирование и продвижение видеороликов, то смотрите это видео:
Информация в даном видео основывается на официальных публикациях в научных журналах, которые были размещены сотрудниками YouTube и Google. Механизмы крупнейшего видеохостинга направлены на рекомендацию зрителям именно тех видеороликов, которые будут максимально полезны и интересны. Рекомендации видео выдаются на основе персональных предпочтений, истории активности, поведенческих факторов.
Проблемы и задачи перед разработчиками алгоритмов YouTube
- Обработка огромного массива видео;
- Необходимость точных рекомендаций для зрителей;
- Высокая отзывчивость и динамичность модели рекомендаций;
- Непредсказуемость поведения зрителей на платформе. Влияние поведения на статистические данные, шумы;
Понятно, что если домохозяйке будут рекомендованы видео из тематики ремонта авто, то она вряд ли будет это смотреть и просто уйдёт с платформы с испортившимся впечатлением. YouTube, который заинтересован в развитии и в том, чтобы на платформе сохранялась активность, привлекающая рекламные бюджеты, не может этого допустить. Из этого следует, что нужны точные рекомендации для зрителей.
При этом существует такой объективный фактор, что серверные (вычислительные) мощности ограничены. Даже у таких гигантов IT-индустрии, как Google. Процессорное время стоит вполне определённых денег, поэтому YouTube вынужден находить баланс между точностью рекомендаций и оптимальным расходом вычислительных мощностей.
Общие принципы работы системы
- Принцип двойной фильтрации (комбинация из 2 нейронных сетей);
- А/Б - тестирование.
- Каждому видео присваивается ранг/рейтинг для конкретного asset (набора вариантов) для конкретного зрителя.
- Поправочные статистические коэффициенты (precision, recall, ranking loss и другие).
- Результат оценивается исходя из стабильных изменений ряда показателей вовлечённости (всем знакомый CTR (Click-Through rate), и watch time - время просмотра).
Первая из фильтрующих нейросетей обеспечивает грубое отсеивание тех видео, которые вряд ли будут интересны зрителю (исходя из его прошлого опыта). Вторая нейросеть анализирует конкурентоспособность возможных вариантов рекомендаций видеороликов.
Исходя из таких параметров, как watch time, оцениваются показатели удержания аудитории, релевантность выдачи от 1-й нейросети и то, насколько удачно рекомендации попали в интересы конкретного зрителя.
Первая нейронная сеть учитывает множество факторов, которые связаны и с параметрами видео (метаданными и т.д.) и с самим зрителем, конечно. Вот некоторые из анализируемых параметров:
- возраст и пол;
- географическое месторасположение;
- язык видеоролика и самого зрителя;
- watch vector (история и направленность просмотров в конкретном аккаунте);
- и search vector (история поиска зрителя - когда что и где искал);
Формируется массив из этих данных и происходит базовая фильтрация с обучением нейронной сети. На выходе получаются результаты, которые можно ранжировать.
Ранжирование
Сначала дадим расшифровку этому термину:
Ранжирование - это процесс, в результате которого выборка из сотен потенциально интересных видеороликов выстраивается в соответствии с приоритетами.
А теперь о самих механизмах ранжирования:
- История взаимодействия и поведенческие факторы (impression data) используются для расстановки видео в источниках трафика и интерфейсах.
- Используется нейронная сеть с подобной архитектурой, что и при выборе роликов-кандидатов (candidate generation).
- Построение выборки видео базируется на expected watch time per impression.
- Показатель CTR не даёт репрезентативных результатов, потому что не отсекает clickbait.
- Цель обучения сети - точное предсказание ожидаемого времени просмотра.
В 1 пункте речь идёт об интенсивном и экстенсивном ранжировании (подробнее о принципах этих видов ранжирования было разобрано в теме про удержание аудитории и продвижении видео на YouTube).
Архитектура 2-й нейронной сети схожа с архитектурой для первой. Многое в современных системах ранжирования на ютубе завязано на таком показателе, как ожидаемое время просмотра. Другие факторы, которые оказывают влияние на нейросеть ранжирования:
- информация, связанная с видеороликом (impression video ID, watched video IDs);
- языковая составляющая (язык пользователя и язык видео);
- время с последнего просмотра;
- предыдущие просмотры и впечатления от них;
Проводится нормализация всех этих значений с дальнейшим "скармливанием" всего этого нейронной сети, которая далее и ранжирует эти видеоролики.
Понятно, что обе нейросети тесно связаны между собой, как и влияющие на их работу факторы.
Чтобы делать ролики качественными и оправдывать ожидания зрителей, важно понимать 2 показателя:
- Фактор обнаружения видеороликов.
- Ожидаемое время просмотра.
Если оба эти компонента на высоком уровне, то ваше видео будут привлекать зрителей и успешно продвигаться на ютубе.
Выводы:
- Тематика, ниша, тема видео - предмет фильтрации нейронной сети первого уровня.
- Фактор обнаружения, вовлечённость, взаимодействие, поведенческие факторы обрабатываются фильтром нейросети второго уровня.
- Понимание этих принципов работы алгоритмов YouTube - ключ к успешному развитию канала. Используйте всё это при построении своей контент-стратегии.
Детальное описание механизмов работы алгоритмов YouTube смотрите в видео.
Хотите узнать ещё больше? Пройдите Школу YouTube (бесплатно)! 😉