« Инженеры не любят копировать

13.07.2021 Газета РБК

О технологиях, которые помогут пользователям искать информацию в интернете, в каких случаях сейчас используют голосовой поиск и при каких условиях «Яндекс» готов платить СМИ за контент  — Андрей Стыскин в интервью РБК
«Яндекс» был основан в 2000 году как сервис для поиска в интернете. И до сих пор поиск — одно из важнейших направлений бизнеса компании, на рекламе в поиске и других сервисах интернет-холдинг зарабатывает 49% выручки, или 39,5 млрд руб., по итогам первого квартала 2021 года (последние доступные данные). Россия остается одной из немногих стран в мире, где лидером на рынке поиска является не мировой монополист Google, а национальная компания. По данным «Яндекс.Радар», сейчас доля «Яндекса» на рынке поиска в России составляет 58,8%, а Google — 39,4%. Однако в 2015-2016 годах российская компания теряла долю: на мобильных устройствах, которые стремительно набирали популярность, по умолчанию использовался поисковик Google, так как компания является владельцем операционной системы Android. Исправить ситуацию удалось только после того, как Федеральная антимонопольная служба (ФАС) обязала Google не препятствовать установке на смартфоны альтернативных поисковых приложений. Дело было возбуждено по жалобе «Яндекса».
Теперь сам «Яндекс» является объектом расследования ФАС. В августе 2020 года ivi, Avito, ЦИАН, Profi.ru, «Туту.ру» и другие игроки российского интернет-рынка пожаловались на компанию из-за использования так называемых колдунщиков — интерактивных виджетов, всплывающих на странице результатов поиска после рекламы. В феврале этого года ФАС вынесла «Яндексу» предупреждение и потребовала до 1 апреля устранить нарушение. Этого не произошло, и ФАС возбудила дело против «Яндекса», его рассмотрение должно состояться в июле.
Параллельно в отдельных странах звучат предложения обязать цифровые платформы платить СМИ за контент. О жалобе в ФАС, конкуренции с Google и о том, что компания намерена добровольно делиться со СМИ частью выручки, в интервью РБК рассказал Андрей Стыскин, директор бизнес-группы поиска, рекламных и облачных сервисов «Яндекса», в зону ответственности которого входят все поисковые продукты и технологии компании, реклама в поиске, голосовой помощник «Алиса», геосервисы, сервисы «Погода», «Новости», «Путешествия» и др.
Про спор вокруг «колдунщиков»
После того как ФАС возбудила дело против «Яндекса», компания опубликовала принципы, согласно которым сторонние сервисы могут получить представление в поиске с помощью обогащенных, то есть расширенных, ответов. Для этого им нужно предоставить большой объем данных «Яндексу», а также поддерживать на своих ресурсах авторизацию и оплату через инструменты интернет-компании. Пожаловавшимся в ФАС компаниям такие условия не понравились.
По словам Андрея Стыскина, несмотря на сомнения со стороны ряда бизнесов, сейчас «Яндекс» ведет переговоры об интеграции в соответствии с опубликованными принципами более чем с 40 крупными и небольшими компаниями (какими конкретно, он не называет).
— Все без исключения поиски в мире, в том числе в США, Китае, Корее, используют обогащенные ответы, для того чтобы улучшать пользовательский опыт. Это не вчера придуманная вещь. «Яндекс» развивает такие ответы больше десяти лет, у нас больше десятка видов публично доступных обогащенных ответов. Для миллионов сайтов мы обогащаем выдачу автоматически, например для сайтов СМИ, а больше 30 тыс. интернет-магазинов на безвозмездной основе самостоятельно предоставляют данные для обогащения выдачи. Заявители [жалобы в ФАС] хотят получить больше внимания и трафика, но внимание пользователя небесконечно. Задача «Яндекса» — найти правильный баланс и помочь решить вопрос пользователя наилучшим образом. Поэтому важно затачивать интеграции с партнерами под каждый сценарий, что требует дополнительной разработки. Иначе получается, как в оригинальной «Золушке» братьев Гримм: лучше отрубить пальцы сестрам, лишь бы влезть в туфельку. А нам важно найти именно правильную Золушку под правильный размер туфли.
Свою ключевую задачу в качестве поисковика компания видит в том, чтобы «создать максимально универсальный поиск, который ищет объекты во всех доступных источниках», говорит Стыскин. Например, если человек захочет посмотреть французскую комедию, ему не нужно будет искать ее отдельно в каждом онлайн-кинотеатре или «Афише». Достаточно будет забить вопрос в поиске «Яндекса», чтобы увидеть в одном блоке фильмы из коллекции «Кинопоиска», Okko и других онлайн-кинотеатров, а также те, что идут в кино. Интеграция в такие универсальные ответы бесплатная. Стыскин рассчитывает, что благодаря публикации принципов компания сможет интегрировать большее количество партнеров.
Андрей Стыскин (Фото: Владислав Шатило / РБК)
Он напомнил, что «Яндекс» уже давно разрабатывал и предлагал партнерам более заметное представление в поисковой выдаче. В 2013 году компания представила такие форматы в рамках проекта «Острова», но тогда они не пользовались большим спросом, потому что интеграция требовала технических усилий со стороны партнеров, к которым рынок не был готов. «В 2021 году общий уровень технологий, доступных участникам рынка, гораздо выше, чем в 2013-м, а мы со своей стороны пытаемся в каждом следующем поколении своего предложения упростить порог входа в интеграцию с поиском», — отметил Стыскин.
— Когда мы опубликовали свои принципы, представители рынка, в том числе коалиции [компаний, пожаловавшихся в ФАС], спросили, зачем нам столько информации. Мы объясняем, что без этих данных не получится сделать полезный людям обогащенный ответ. Например, чтобы искать по сайтам, через которые продаются автомобили, мало иметь только фото и пробег машины. Необходимо знать, как люди взаимодействовали с конкретным объявлением в прошлом, на что кликали. Тогда мы не будем предлагать человеку, который ищет семейный автомобиль, модели стоимостью на порядок выше.
Пилот с HeadHunter
По словам Андрея Стыскина, «Яндекс» делает пилот с HeadHunter, в рамках которого последний отдает feed (поток контента, который автоматически подгружается блоками. — РБК). «База объявлений о работе достаточно быстро обновляется, важно не ждать, пока поисковый робот обойдет по ссылкам в интернете всю информацию, а получить актуальную информацию непосредственно от HeadHunter. Без данных о кликах и других действиях пользователей мы не понимали, решил человек задачу или нет. Мы видели ухудшение пользовательских показателей, так как люди возвращались и снова задавали уточняющие вопросы. Когда стали использовать данные «Яндекс.Метрика», при переходе из обогащенного ответа в среднем на 20% вырос показатель полезных действий соискателей на сайте — регистраций или откликов на вакансию. Это произошло потому, что мы поняли, какие работодатели интересны человеку, и начали показывать их вакансии. В итоге люди быстрее находят работу, а сайт получает нужную аудиторию», — пояснил Стыскин.
Про развитие поиска
По словам Андрея Стыскина, для улучшения работы поиска только в прошлом году компания внесла более 2 тыс. изменений в него, то есть почти по восемь за рабочий день. Но он отмечает, что «у пользователя есть привычка, и если ему 2 тыс. раз в год «все переколбасить», то он сойдет с ума», поэтому изменения вводятся «маленькими шагами», чтобы они воспринимались естественно.
— Поиск — это очень сложная штука. В его развитие за последние пять лет мы проинвестировали больше $1,5 млрд. Самые крупные статьи расходов — строительство дата-центров и закупка «железа», зарплаты сотрудникам, а также обучение алгоритмов: десятки тысяч людей работают на краудсорсинговых платформах «Яндекса», для того чтобы обучать алгоритмы ранжирования. Нам приходится конкурировать с мировой компанией Google, в которой работают в десять раз больше людей, много ученых. Мы маленькие по сравнению с Google, у нас меньше ресурсов, поэтому нам нужно двигаться быстрее, находить способы срезать углы, чтобы давать пользователям в России конкурентоспособные продукты.
В ближайшие годы инвестиции в поиск будут только увеличиваться, прогнозирует топ-менеджер. Основные вложения компания направит на развитие новых технологий: например, в области обработки естественного языка это «Трансформеры». Он напомнил, что в последнем обновлении «Яндекс» объявил о внедрении языковой модели YaLM (Yet another Language Model, с ее помощью можно генерировать следующие слова в предложении. — РБК), также была технобета-модель «Балабоба» (позволяет на архитектуре нейросетей выучивать закономерности, которые есть в естественном языке, и в результате генерировать текст, который по правдоподобности не отличается от человеческого. — РБК). «Например, можем спросить, про что я дал интервью РБК, и модель напишет. Это будет связный текст, как будто его придумал человек. Конечно, он не будет идеальным, но все же это прорыв», — указал Стыскин.
Кроме того, эта технология «умеет выявлять закономерности, которые есть в языке, с помощью чего можно решать многие задачи». Например, делать краткие выжимки из больших объемов текстов, то есть экономить время для вычленения важной информации. Из этого можно сделать много различных новых сервисов, «которые радикально ускорят доступ к ответам на вопросы, к информации», ожидает Стыскин. По его словам, над продуктами, которые позволят анализировать, генерировать и суммаризировать информацию, сейчас работают компании по всему миру.
Андрей Стыскин (Фото: Владислав Шатило / РБК)
— Ключевая задача поиска — найти ответ на любой вопрос, который задает пользователь. Чтобы решить эту задачу, поиск должен становиться все более и более универсальным. Тем более что вопрос можно задавать различными способами: и голосом, и картинкой. Мы запустили «умную» камеру, которая позволяет делать запросы, для которых непонятно, как их сформулировать текстом или голосом. Например, если нужно узнать название цветка, можно открыть приложение «Яндекса», сфотографировать и узнать.
Еще один важный пользовательский запрос, по словам топ-менеджера «Яндекса», — в качестве, актуальности и достоверности информации, потому что ее стало очень много. Поэтому компания работает над вовлечением экспертов в обучение алгоритма, чтобы поиск становился «умнее».
— У нас запустился пока маленький прообраз экспертного поиска. Проект связан с борьбой с депрессией: в результатах поиска мы представили телефоны горячих линий. Когда речь идет о таком сложном вопросе, важно не читать рецепты и заниматься самолечением, а найти специалиста в этой области. Мы видим, что доля запросов, в которых требуется глубокая проработка, растет. С другой стороны, есть запрос от экспертов [сервиса вопросов и ответов] «Яндекс.Кью» — они хотят делиться знаниями в той области, которой посвятили жизнь. У нас есть несколько пилотов по формированию экспертных оценок в области медицины, юриспруденции и финансов, и мы видим, насколько это улучшает качество продукта. Сейчас основной вызов — как с технологической и организационной точек зрения эту вещь масштабировать. Это то, чем мы будем заниматься в ближайшие годы.
Про голосовой поиск
Андрей Стыскин отмечает, что есть сценарии, в которых проще спросить голосом, — это длинные вопросы, где много контекста. Например, когда человек хочет узнать какой-то факт, построить маршрут, включить музыку или телеканал. Поиском через голосовой помощник «Алиса» особенно любят пользоваться дети и люди старшего возраста, то есть те, кто не любит или не умеет делать запросы текстом, а также те, кому это по каким-то причинам неудобно.
Кроме того, компания обнаружила, что многие сложные сценарии проще задавать голосом. Например, в начале 2021 года у «Яндекса» резко выросло число установок его автоматического определителя номера (АОН), который может отследить рекламные звонки, чтобы пользователь не брал трубку. Раньше для его установки на различных платформах нужно было провести сложные настройки, что отпугивало потребителей. «Когда мы сделали навык «Алиса», настрой АОН», мы увидели просто космический взлет включений сервиса и на iOS, и на Android», — указал Стыскин. В дальнейшем «Алиса» может научиться выполнять типовые регулярные операции — например, делать повторные заказы в «Лавке» или заказывать линзы на следующий месяц.
Андрей Стыскин (Фото: Владислав Шатило / РБК)
— Будет ли голос вообще замещать и вытеснять поиск через набивание текста? В ряде сценариев будет. Ядро аудитории «Алисы» — это активные люди в возрасте от 25 до 35 лет. Когда они едут за рулем или занимаются домашними делами, им проще сделать запрос голосом. Когда хочется включить музыку или фильм — тоже. Еще один популярный сценарий — это бытовой фактчекинг. Если во время общения возникли разногласия по какому-то вопросу, например сколько весит слон, человек берет мобильный, нажимает кнопку и спрашивает:
— Сколько весит слон?
— От 2 до 7 т.
— Вот видишь, я тебе говорил.
Таких запросов, по словам Стыскина, очень много. В то же время остается много рабочих сценариев поиска через текст на десктопе: «Мы видим, что программистские запросы в основном поступают с десктопа, какие-то профессиональные документы, юридические, нормативные акты люди продолжают искать на десктопе».
Про данные пользователей
Чтобы улучшать качество поиска и таргетирования в рекламе, «Яндекс» использует обезличенные данные о пользователе, которые получает через его взаимодействие с продуктами компании, а также закупает аналитику по использованию интернет-ресурсов у партнеров. «Это позволяет нам понять те области качества, в которых мы можем лучше развиваться, в которых нужно больше совершенствоваться. Персональные данные мы не закупаем», — отметил Андрей Стыскин.
— Если я купил холодильник, то мне уже поздно его рекламировать. И есть категории товаров, в которых это полезно. Например, второй букет цветов предлагать можно — это будет полезно, а второй холодильник человек вряд ли купит в ближайшие пять лет. Со временем мы научим этому наши алгоритмы.
По словам Стыскина, знания о запросах и потребностях пользователей позволяют улучшать качество поиска и моментально предоставлять лучший ответ.
— Не все интересы пользователей выражаются в виде запроса в поиск, посещения сайтов, кликов. Но, думаю, покупка пользовательских данных — это не тот вектор, в котором будет развиваться отрасль, потому что хозяином своих данных является человек. Именно поэтому мы даем возможность пользователям управлять своими данными: выгружать их или удалять вовсе. Надеемся, что наши коллеги по отрасли реализуют такие же возможности. Наверное, было бы круто, чтобы пользователи в удобном виде могли управлять своими данными. Например, я пользуюсь [музыкальным сервисом] Spotify, очень много там прослушал, поскольку мне нравится их рекомендательная лента. Я бы хотел иметь возможность нажать кнопку и перенести свои данные в «Яндекс.Музыка», где тарифы сейчас выгоднее и присутствуют те же музыкальные исполнители. При этом важно, чтобы при переносе цифрового следа не нужно было заново обучать алгоритмы «Яндекс.Музыка» под мои музыкальные предпочтения. Такая картина мира, когда пользователи управляют своими данными, мне очень импонирует. Но тут нужно много технических и отраслевых вещей пройти, чтобы это случилось.
Андрей Стыскин (Фото: Владислав Шатило / РБК)
Про монетизацию контента СМИ
По словам Андрея Стыскина, «Яндекс.Новости» начал тестировать дайджест — подборку выдержек из сообщений СМИ, из которой можно быстро узнать основные подробности о событии. При этом сервис намерен делиться доходами от рекламы с партнерами, материалы которых попадают в дайджест.
— Мы готовы вместе с партнерами делать новые форматы представления информации и делиться с ними доходами, которые получает сервис «Яндекс.Новости». Сейчас у «Яндекс.Новости» более 3 тыс. партнеров, которые передают свой контент в сервис. Текущая модель монетизации сайтов в интернете и СМИ, когда они продают рекламные баннеры, приводит к тому, что им нужен трафик, ради которого они часто используют желтые кричащие заголовки. В качестве ответной реакции «Яндекс.Новости» затачивает алгоритмы, чтобы бороться с желтизной и накрутками, и учитывает различные показатели СМИ при ранжировании (информативность заголовка, оперативность, цитируемость, отсутствие опечаток и т.д.).
За дайджест, который компания делает вместе с партнерами и размещает в сюжетах «Яндекс.Новости», она будет делиться со СМИ частью рекламной выручки, которую зарабатывает сервис. Детали Стыскин не раскрывает, лишь оговаривается, что подборка выдержек для дайджеста формируется автоматически. Ее составляет алгоритм, который анализирует все новости сюжета и вычленяет ключевые моменты. Рядом с каждой выдержкой есть ссылка на новость-источник. Размер выплат будет пропорционален количеству показов в дайджесте.
— Это не аттракцион, в котором просто раздаются деньги. В результате таких интеграций возникает дополнительная ценность для пользователей. Сейчас мы видим, что потребление информации переходит, например, в Telegram: очень много людей получают актуальные короткие обновления, потому что подписаны на большое количество Telegram-каналов. Мы видим два пользовательских сценария: изучить все в деталях или сразу узнать суть — и хотим в рамках сервиса дать пользователям выбор. Те издания, которые быстро, фактурно, объективно и емко дают эту информацию, в конечном счете получают не только трафик, но и лояльность аудитории.
Андрей Стыскин (Фото: Владислав Шатило / РБК)
Про сравнение с Google
На вопрос, насколько пристально компания следит за тем, что делает в области поиска Google, и возможно ли, в принципе, копировать на этом рынке, Андрей Стыскин отвечает, что «Яндекс» — инженерная компания, а инженеры не любят копировать, они любят изобретать.
— У нас даже обратная проблема, называется not invented here (не было придумано здесь. — РБК), когда решения, которые есть в open source (открытом программном обеспечении. — РБК), не пользуются особой популярностью внутри «Яндекса», потому что их не здесь придумали. Но причина не в том, что мы снобы и самодуры. Большая часть технологических решений, которые сейчас существуют на рынке, появились позже, чем мы столкнулись с проблемой, для решения которой они предназначены. Мы, безусловно, активно смотрим на все, что происходит вокруг нас, у наших конкурентов, в отрасли, и используем всю информацию, чтобы принимать решения о том, какие продукты делать, какие технологии создавать, читаем научные статьи, но невозможно скопировать то, что делает другой игрок в сфере поиска. Даже больше скажу: многие вещи, которые появляются в поиске в России, появляются благодаря «Яндексу». Для отдельных наших конкурентов Россия не является основным рынком, а поиск и сервисы «Яндекса» заточены под потребности и особенности российского интернета и российских пользователей.
По словам Стыскина, цель компании — чтобы ее «продуктами пользовались все больше и больше людей», но конкретных показателей он не назвал.
— Что важно понимать про рыночную конкуренцию в области поисковых систем: есть открытые платформы, на которых конкуренция возможна, например Windows на десктопе, и там наша поисковая доля выше средней по рынку. Есть мобильные платформы, где ситуация другая. В 2017 году ФАС признала, что Google ограничивала возможность выбора поисковой системы для пользователей платформы Android. Нужно было заходить в браузер Chrome, вбивать в адресной строке слово «Яндекс» и затем искать. После того как появилась возможность выбирать поисковик на Android, наша доля существенно выросла, но на это потребовалось много времени, в течение которого мы продолжали улучшать свой продукт. Если на других платформах, например iOS, появится возможность выбирать, наша доля, конечно, начнет постепенно расти. Но для этого нужно не останавливаться — инвестировать в технологии и качество поиска.
Стыскин не прогнозирует, как изменится доля «Яндекса» благодаря вступившему в силу с 1 июля требованию о том, что производители смартфонов, планшетов, компьютеров и Smart TV должны обеспечить пользователям возможность выбора поисковой системы. По его словам, это будет зависеть в том числе от того, как платформы реализуют возможность выбора, насколько удобным он будет для пользователя.
В то же время Стыскин отметил, что с дискриминацией сталкиваются и различные сервисы «Яндекса».
— Например, «Алиса» не имеет тех технических возможностей в iPhone, которые есть у [голосового ассистента, разработанного производителем этого смартфона] Siri. Нет доступа к чтению СМС, как у Siri, возможности интегрироваться в наушники AirPods или сервис для автомобилей CarPlay.
Четыре факта об Андрее Стыскине
10 августа 1986 года родился в Москве.
В 2008 году окончил факультет кибернетики Московского инженерно-физического института (МИФИ).
В 2007 году пришел разработчиком в «Яндекс».
В феврале 2021 года возглавил только что созданную бизнес-группу поиска, рекламных и облачных сервисов.


https://www.rbc.ru/newspaper/2021/07/13/60e45ca99a794726be892d29