Как работают рекомендации YouTube? Как попасть в рекомендованные на Ютуб в 2021 году? Как работает система, позволяющая видеороликам попадать на главную страницу, в раздел "Следующее", в раздел "Рекомендованные видео"? Разберём большой и очень важный материал непосредственно от официального представительства Google в России.

Рекомендации направляют зрителей, приносят больше половины просмотров на всей платформе. Это значительно больше, чем подписки, поиск или любые другие источники трафика за пределами рекомендаций. Этот материал должен знать каждый ютубер, поэтому мы разберём все детально.

Что такое система рекомендаций

Рекомендации отображаются в двух основных разделах:

  1. на главной странице YouTube;
  2. и в разделе «Следующее».

«Следующее» появляется, когда вы смотрите видео и YouTube предлагает дополнительный контент, сформированный на основе информации о том, что вы смотрите в данный момент. А также на основе контента, который, по мнению системы, может вас заинтересовать.

Как система рекомендаций работала раньше

В 2008 году, когда YouTube только разработал систему рекомендаций, она работала совершенно иначе. Предположим, что вы в основном смотрите кулинарные видео. Было бы нелогично видеть в рекомендациях на главной странице спортивные и музыкальные видео только лишь потому, что у них больше всего просмотров, правда? Однако, такое случалось на раннем этапе развития системы, когда видео отбирались на основе их популярности и группировались на одной странице. Мало кто смотрел такие рекомендации. Большую часть просмотров на YouTube приносил поиск и внешние ссылки.

Современная модель работы системы рекомендаций

Сегодня система классифицирует миллиарды видео, чтобы подобрать контент, соответствующий именно вашим интересам. Например, алгоритмы обнаружили, что зритель смотрел ролик с лучшими моментами футбольного матча Университета Южной Калифорнии и предложили и другие спортивные подборки тех времен. Без системы рекомендаций зритель никогда бы не увидел эти видео.

В отличие от других платформ, YouTube не подбирает для пользователей контент на основании их социальной активности. Вместо этого успешность рекомендаций на YouTube зависит от того, насколько точно платформа может предсказать желания зрителя. Система отталкивается от того, что зрительские привычки каждого пользователя уникальны, но имеют определённые паттерны и повторяемость.

Система сравнивает ваши действия в сервисе с поведением других, похожих на вас людей. И на основании этой информации предлагает вам контент, который может вас заинтересовать. Предположим, вам нравится смотреть видео про теннис. Алгоритмы определяют, что другие зрители, которым нравятся те же ролики, также с удовольствием смотрят видео про джаз. Вероятно, в ваших рекомендациях появятся ролики с джазовой тематикой, даже если вы никогда их не смотрели. Есть исключения: для новостных и информационных разделов принцип работы рекомендаций может отличаться, об этом мы поговорим чуть позже.

Как собираются рекомендации

Если вы зайдёте в аккаунт вашего YouTube-канала и посмотрите настройки, то вы увидите там «настройки конфиденциальности». Они нужны, чтобы вы сами могли решать, доступ к каким данным вы хотите предоставлять. В частности, вы можете удалять/редактировать и временно отключать историю поиска/просмотров на YouTube в любой момент. Вы можете скрывать свои предпочтения. Но помните, что если вы смотрите YouTube с анонимного аккаунта, то платформа всё равно собирает огромное количество данных, которые в дальнейшем используются для персонализации контента, рекомендованного вам для просмотра.

Как персонализируются рекомендации

YouTube собирает огромное количество «сигналов». Сигналами YouTube называет 80 миллиардов информационных объектов. Чтобы объяснить работу системы рекомендаций, нужно не только объяснить их принцип работы, но и рассказать, какие данные используются. Чтобы определить предпочтения, алгоритмы Ютуба принимают во внимание множество сигналов, поведенческих факторов:

  • нажатия;
  • время просмотра;
  • результаты опросов;
  • ссылки на контент;
  • отметки «Нравится» и «Не нравится»;

Клики

Когда вы кликаете на ролик, это с большой вероятностью говорит о том, что он покажется вам интересным. Вряд ли вы станете нажимать на то, что не хотите смотреть. Однако, в 2011 году выяснили, что даже если пользователь кликнул на ролик, это не значит, что он его посмотрел. И в 2011-2012 году произошло одно из самых масштабных изменений в работе алгоритмов YouTube. Тогда системы ранжирования были перестроены с количества просмотров на суммарное время просмотра. А уже в 2014 году к расчётам присоединилась динамика трафика в первые часы. То есть, тогда уже произошло приближение к современной модели ранжирования.

Время просмотра

Анализируя, какие видео вы смотрели и как долго, система получает персонализированные сигналы о том, какой контент вам, скорее всего, понравится. Влияние кликбейта при этом также учитывается.

Когда YouTube впервые стали учитывать время просмотра при подборе рекомендаций, то количество просмотров резко снизилось на 20%. Однако, специалисты Google/YouTube верят, что важнее предоставлять зрителям интересный контент, ведь польза от просмотра разных видео может отличаться.

Результаты опросов

Когда вы смотрите ролик, периодически вам отображается окошко с опросом. Эти опросы корректируют работу алгоритмов индивидуально для вас, а также вносят понимание в общую систему. Чтобы наверняка определить, довольны ли зрители просматриваемым контентом, учитывается так называемое «ценное время просмотра». Это алгоритмическое понятие означает время, которое вы сами оцениваете, как проведённое с пользой.

«Ценное время просмотра» определяется с помощью опросов, где пользователь ставит видео оценку по шкале от 1 до 5. Так YouTube может понять, доволен ли зритель контентом. Если пользователь ставит видео одну или две звезды, Google спрашивает, что ему не понравилось, а если четыре или пять — что оказалось полезным. При подсчёте ценного времени просмотра учитываются только те ролики, которым вы поставили четыре или пять звезд.

Конечно, не все пользователи проходят опрос после каждого просмотренного видео. На основе ответов, которые получает система, модель машинного обучения научилась предсказывать возможные оценки. Чтобы проверить точность этих прогнозов, специально исключаются из задания для обучения часть уже выставленных пользователями оценок. Это позволяет проверить, насколько полученные с помощью системы данные соответствуют реальным ответам.

Репосты контента и отметки «Нравится»/«Не нравится»

Если зритель делится видеороликом или ставит ему отметку «Нравится», обычно это означает, что он доволен этим контентом. Система использует эту информацию, чтобы предсказывать вероятность того, что вы поделитесь следующими роликами или поставите им отметку «Нравится». Когда вы нажимаете «Не нравится», это сигнал алгоритмам, что вам контент не показался интересным.

Как и в случае с рекомендациями, значимость каждого сигнала зависит от вас. Если вы делитесь всеми просмотренными видео, даже теми, которым поставили одну или две звезды, система не будет учитывать отправленные вами ссылки на контент при подборе рекомендаций. Именно поэтому алгоритмы YouTube не базируются на чётких правилах, а адаптируются к вашему поведению.

Теперь поговорим о новостном и информационном контенте. Будь это актуальные новости или сложные научные исследования, для таких тем очень важно качество контента и контекст. Кто-то может поставить высокую оценку видео, где утверждается, что Земля плоская, но это не значит, что мы будем рекомендовать подобный некачественный контент.

Именно поэтому рекомендации играют важную роль в процессе построения платформы, которая внушает доверие. YouTube предлагает зрителям проверенную информацию и минимизирует вероятность того, что они столкнутся с сомнительным контентом. При этом учитываются правила сообщества, определяющие, какие материалы разрешены, а какие запрещены на YouTube.

Этапы на пути к становлению системы рекомендаций

В 2011 году YouTube начал ограничивать распространение некачественного контента с помощью рекомендаций. Тогда разработали классификаторы, позволяющие распознавать и исключать из рекомендаций видео, содержащие насилие и контент для взрослых.

В 2015 году YouTube обратил внимание, что на главной странице показывается много нарочито сенсационных материалов от таблоидов, и принял меры, чтобы убрать "кричащий контент". В следующем году научились прогнозировать вероятность того, что в видео показаны несовершеннолетние в опасных ситуациях, и стали удалять такие ролики из рекомендаций.

В 2017 году YouTube начал оценивать работу машинного обучения, отслеживая справедливость системы по отношению к социально-уязвимым лицам.

В последние годы увеличилось количество недостоверной информации на платформе. Речь о фейках, спекуляциях и провоцирующем контенте. Поэтому YouTube улучшил систему рекомендаций, чтобы она могла обрабатывать видео с неверными данными, а также спорный контент (материалы, которые близки к нарушению правил сообщества, но технически этого не делают). Например, ролики с конспирологическими теориями («высадка человека на Луну была сфальсифицирована») и другие видео, распространяющие неверную информацию («апельсиновый сок может вылечить рак»).

YouTube отделяет проверенный контент от пограничного с помощью классификаторов. Оценку качества информации, представленной на канале или в видео, осуществляют специалисты со всего мира, которые обучаются по подробным общедоступным правилам. Платформа также обращается к сертифицированным экспертам — например, врачам, когда надо оценить информацию, касающуюся здоровья.

Как формируется авторитетность контента

Чтобы определить авторитетность контента, специалисты по оценке отвечают на несколько ключевых вопросов:

  • Материалы отвечают заявленной цели?
  • Какой уровень квалификации требуется, чтобы понять смысл видео?
  • Какая репутация у выступающего в ролике человека и канала, на котором оно опубликовано?
  • Какая основная тематика видео (например, «Новости», «Спорт», «История», «Наука» и т. д.)?
  • Контент задуман как сатирический?

Ответы на эти и другие вопросы определяют, насколько видео заслуживает доверия. Чем выше оценка, тем выше вероятность, что ролик будет продвигаться в системе рекомендаций. Чтобы определить пограничные видео, специалисты по оценке отмечают факт присутствия неточного, вводящего в заблуждение, оскорбительного, нетолерантного, реально или потенциально вредоносного контента и ряд других факторов. На основании общих результатов определяется вероятность того, что ролик содержит вредоносную информацию или пограничный контент. Видео, которые классифицируются как пограничный контент, удаляются из рекомендаций.

Каждому ютуберу необходимо понимать, как работают рекомендации YouTube. Я надеюсь, что вы осознали важность понимания тех аспектов, которые озвучены в этой статье и будете строить работу с вашим каналом, исходя из этих принципов. Резюмируем кратко, на что стоит обращать внимание:

  • цепочки рекомендованного контента;
  • понимание интересов вашей целевой аудитории;
  • понимание поведенческих факторов ваших зрителей;
  • избегание пограничного состояния контента;
  • понимание пользы контента для зрителей.

И ещё раз. Важно понимать, что система рекомендаций индивидуальна для каждого зрителя. Другими словами, можно сказать так:

У каждого свой YouTube.

Бесплатная школа YouTube

Присоединиться к обсуждению:

  1. Lavron:

    Ссылка на доклад от YouTube о том, как работают рекомендации: https://russia.googleblog.com/2021/09/youtube_15.html

Заполняя и отправляя данную форму, вы соглашаетесь с условиями пользовательского соглашения и разрешаете обработку персональных данных.