Кто лучше знает Ставрополь: яблочная Siri или Алиса из Яндекса. Алиса против Siri: кто кого

Голосовой помощник "Алиса" появился в приложении "Яндекса". Пользоваться им могут владельцы современных смартфонов. Чем "Алиса" отличается от Siri и как общаться с этим виртуальным помощником - в рубрике "Вопрос-ответ".

"Алиса" приятным женским голосом Татьяны Шитовой (дублирует Скарлетт Йоханссон в российском прокате) подскажет, как доехать до нужной точки, даст прогноз погоды, с ней можно даже разговаривать по душам. Она умеет работать с такими приложениями "Яндекса", как музыка, погода, карты. В дальнейшем "Алиса" получит доступ и к другим сервисам и сможет, например, посоветовать фильм или вызвать такси.

Другие компании в перспективе смогут предоставить "Алисе" доступ к своим сервисам. Запускать сторонние приложения (например, "ВКонтакте" или Instagram) она может уже сейчас.

"Яндекс" отмечает, что нейронная сеть позволяет "Алисе" распознавать и обрабатывать неполные фразы и вопросы, учитывать контекст и разговаривать с различной интонацией. При разработке ассистента особое внимание уделялось возможности понимать "настоящую человеческую речь, а не только идеально произнесенные запросы".

А как пообщаться с "Алисой"?

Для начала общения с этой умной "девушкой" потребуется установить в телефоне приложение "Яндекса". Сделать это можно на мобильных операционных системах Android и iOS.

Для персональных компьютеров на операционной системе Windows сервис продолжит работать в бета-версии. Дальше задаете свои вопросы.

Чем это приложение отличается от Siri?

Общение с Siri доступно только для владельцев iPhone, с "Алисой" пообщаться может владелец любого смартфона. Вызвать помощника одной фразой, как Siri, на мобильном не получится. Для начала нужно запустить сам поисковик.

В пресс-службе "Яндекса" подчеркнули, что их голосовой помощник может выходить за рамки прописанных сценариев и импровизировать, у Siri все ответы прописаны заранее. На самом деле в верности этого утверждения можно усомниться, так как на один вопрос в совершенно разных формулировках "Алиса" все-таки отвечала шаблонно, но однозначно с юмором.

В основе распознавания чужой речи и синтезирования собственного голоса "Алисы" лежат речевые технологии SpeechKit.

Но, например, вызвать "скорую помощь" "Алиса" не способна, в отличие от Siri. Не сможет она и завести будильник. При этом владельцу iPhone достаточно сообщить Siri, в какое время утром он должен проснуться, и программа сама заведет будильник. Задать можно не только конкретные час и минуту, но и временной промежуток. Например, если юзер применит запрос "Siri, разбуди меня через 30 минут", программа сама отсчитает полчаса, отталкиваясь от текущего времени.

В копилку преимуществ "Алисы" можно добавить ее интеграцию с сервисами компании, включая собственный поиск, в то время как у Apple своего поиска нет. Но в поиске выдает не всегда то, что находится рядом с вами. Вместо расписания фильмов в Барнауле "Алиса" предложила посмотреть кино в Новосибирске.

Раз уж все начали писать про выход в публичный доступ ассистента от Яндекс, дай, думаю, и я попробую в действии чудо русского происхождения. Быть может, Алиса сможет понять привычный и нам, и ей язык лучше, чем продукт западного происхождения?

Я задал несколько вопросов и Алисе, и Сири: вот что из этого вышло.

У меня на столе стояла бутылка Пино Гри, Фраголино и Эль, при запросе, что из этого мне выпить, ассистенты предложили следующее.



Сравнительный вопрос: «Алиса, ты лучше Сири? Сири, ты лучше Алисы?». Естественно, умный ассистент от Apple не следит за нашими новостями и понятия не имеет, что такое Алиса. Хотя, Siri могла бы и обидеться за сравнительный вопрос, но поступила иначе – вывела информацию из сети про рок-группу Алиса. Кинчев в каждом из нас удовлетворен.


На вопрос «Кто тебя создал», я получил следующие ответы:


Вопрос географического характера: «Как попасть из Одессы в Москву?». Если честно, я ожидал, что оба ассистента начнут предлагать мне расписания самолетов и рейсов, но Siri банально не поняла, что от неё хотят, а Алиса рассказала мне расстояние от города до города если выбирать автомобильную развязку.


Информационный вопрос: «Что произошло 10 октября 10 лет назад?». Оба голосовых помощника решили отправить меня в поисковик, но в этом случае Алиса в стратегическом плюсе, искать она будет конечно же через Яндекс, хотя я не пользуюсь этой поисковой системой, её выбор очевиден.


А вот неожиданный поворот, запрос на действие: «Назначить встречу на завтра на 10 утра в ресторане Рыба». Сири чётко определила задачу и предложила занести событие в календарь, на нужную дату и нужное время, Алиса не поняла, что я от неё хочу и продолжила беседу.


Сейчас рано делать окончательные выводы, Алиса находится в состоянии беты, она может долго и мило общаться с вами, прикидывается личностью, проявляет характер; но конкретные действия и запросы пока не готова выполнять с первого раза. Сири, в свою очередь, туповата, но годится для элементарных запросов и просьб, которые хорошо интегрированы с операционной системой.

В начале октября компания Яндекс выпустила ассистента Алису . Поначалу мы скептически отнеслись к данному помощнику, который способен понимать контекст разговора, ведь нечто подобное уже есть у . Однако мы немного ошиблись, ведь Алиса оказалась куда более разговорчивее и приятнее в общении, чем её аналоги.

За счет машинного обучения, искусственного интеллекта Алиса больше ощущается реальным человеком, чем Google Assistant. У неё всегда найдется ответ на ваш вопрос. Конечно, пока нейросети не идеальны, и боту нужно долго учиться, чтобы правильно отвечать на различные вопросы. Поэтому иногда бот может дать не связанный с вопросом ответ, но это дело времени. В дальнейшем эту проблему решат большей и более правильной выборкой, а также оптимизацией алгоритмов обучения.


Но уже сейчас результат очень радует. В особенности хотим отметить синтез речи, голосовой движок здесь работает идеально. Складывается ощущение, что каждую речь записывали вручную — никаких разрывов между буквами, сама речь звучит очень реалистично и приятно.

Конечно, еще есть над чем работать, и иногда бот не понимает контекста. На просьбу спеть песню ассистент открывает Яндекс Музыку, чего мы, конечно, не хотим, ведь хочется услышать пение самого ассистента. На вопрос «Яндекс или Google?» ассистент отвечает, и вполне стандартно. Бот понимает вопрос «Стоит ли мне брать зонт?», отображая карточку с погодой.

Сомнение относительно наличия ИИ внес вопрос «Окей Google», на который ассистент отвечает каждый раз одной фразой «Это вот обидно было». Вероятно, в компании совмещают возможности ИИ и статично задаваемые ответы на вопросы. Сложно сказать, как именно реализовано обучение здесь, но ограничивать работу ИИ нужно для того, чтобы обычные пользователи не могли научить бота плохим фразам.

На вопрос «Как ты относишься к наушникам?» бот ответил следующее:

Как можно заметить, контекста он не понял, но при этом за счет ИИ попытался ответить самостоятельно, вышло не очень хорошо, но всяко лучше ответа «Вот что мне удалось найти в Интернете по запросу „Почему?“». Понравилась ли Алиса вам?

Приложение: Яндекс Разработчик: Яндекс Категория: Инструменты Версия: Зависит от устройства Цена: Бесплатно Скачать: Google Play Приложением уже заинтересовался: 1 человек

Что такое «Алиса»

«Алиса» работает в приложении «Яндекса» для iOS и Android , а также в бета-версии для Windows . Создатели пообещали в скором времени добавить помощник в «Яндекс.Браузер» и другие продукты компании.

Благодаря технологии SpeechKit «Алиса» умеет распознавать речь, определять значение сказанного и синтезировать голос для ответа. Сервис может импровизировать и давать разные ответы на один и тот же вопрос, не ограничиваясь заранее заданным набором. В компании утверждают, что «Алиса» способна обрабатывать неполные фразы и учитывает контекст.

Помощник говорит голосом актрисы дубляжа Татьяны Шитовой , чьи записи также использовались для обучения сервиса. Шитова в российском прокате озвучивала Скарлетт Йоханссон, в том числе операционную систему Саманта из фильма «Она».

«Алиса» работает с «Яндекс.Поиском», «Яндекс.Картами», «Яндекс.Музыкой» и «Яндекс.Погодой», но в будущем сможет обращаться к другим сервисам. Пока сервис не может посоветовать фильм или вызвать такси.

В «Яндексе» объяснили, что «Алиса» нужна для решения повседневных задач, в том числе поиска информации в интернете, подсказки о месте для ужина или уточнения погоды на завтра. «Алиса» может запускать сторонние приложения, к примеру, Instagram или «ВКонтакте».

С Алисой можно разговаривать так же, как с человеком: она поймёт. Например, у неё можно спросить: «Где поблизости выпить кофе?» - а не диктовать что-то вроде «кофейня улица космонавтов».

Алиса заглянет в «Яндекс.Справочник» и предложит подходящее место. А в ответ на «Отлично, а как туда пройти?» - даст ссылку на уже построенный маршрут в Яндекс.Картах.

представители «Яндекса»

Как он работает

TJ задал несколько вопросов «Алисе» и сравнил ответы с результатами Siri.

Есть очевидные различия, например, реакция при вызове такси. Если «Алиса» пока не умеет этого делать, даже если на устройстве установлено «Яндекс.Такси», то Siri синхронизировано с Uber и предлагает выбрать один один из вариантов.

С политикой Siri и «Алиса» испытывают проблемы.

Рассказал, зачем пользователям из России свой помощник, чем Алиса лучше Siri и сможет ли она заменить любовницу или друга.

«Лента.ру»: Кто такая (или что такое) Алиса и зачем она вообще нужна россиянам?

: Кто такая! Алиса - новый голосовой помощник «Яндекса». Зачем она нужна россиянам? Сейчас у людей большие запросы к скорости ответа, они все меньше хотят тратить время на поиск нужной информации. И традиционные интерфейсы, даже «Яндекса», уже не совсем отвечают этим потребностям. Поисковая выдача хороша, но если нужно мгновенно получить ответ, например, при занятии спортом, это уже не решает задачу. А Алиса справится.

Информационными сервисами пользуются не только сидя за компьютером. У всех давно есть смартфоны: люди на ходу, занимаясь спортом, за рулем хотят также искать и потреблять информацию. И Алиса призвана помогать в таких ситуациях.

Чем она лучше Siri или Cortana? К ним обычно обращаются, чтобы узнать погоду или найти музыку. И они часто не понимают запросов.

Во-первых, Cortana на российском рынке нет. Вообще, все голосовые ассистенты работают по-разному. Наша особенность в том, что мы фокусируемся на российском рынке и очень хорошо понимаем русский язык. И с точки зрения распознавания речи, и с точки зрения восприятия смысла.

У Алисы «под капотом» - сервисы «Яндекса». В этом смысле Алиса очень отличается от Siri, у которой нет собственного поиска. Раньше они использовали Bing, теперь переключились на .

К тому же Алиса - абсолютно другой персонаж со своим характером. Это как с людьми: более-менее похожи, но все-таки разные, с одним человеком интересно общаться, с другим - не очень. Мы стремимся сделать Алису интересной именно для российского пользователя, наделить ее характером, близким и знакомым российскому человеку.

Традиционные голосовые ассистенты заточены под решение конкретных задач: погода, музыка и так далее. Но все стараются сделать так, чтобы ассистент отвечал и на нестандартные вопросы. Есть редакторы, которые берут несколько сотен шаблонных вопросов и пишут ответы на них. И у человека возникает иллюзия, что это искусственный интеллект, что он умеет общаться. Но шаг в сторону, и иллюзия рассыпается, поскольку помощник повторяет: «Вот, что мне удалось найти в интернете по этому запросу».

Мы, наверное, первые в мире пытаемся сделать вот что: мы тоже используем редакторские ответы на вопросы, но добавляем специальную нейронную сеть, обученную на свободную беседу. Она может подобрать ответ или втянуть пользователя в болтовню ни о чем.

В этом, наверное, кардинальное отличие, потому что людям, помимо поиска каких-то фактов, иногда хочется с кем-то поболтать. Алиса уже сейчас способна поболтать и будет в этом только совершенствоваться.

У нас была сложная задача: нейронная сеть (между нами - «болталка») обучается практически на всех текстах в интернете, уделяя внимание диалогам. И не всегда то, что есть в интернете, соответствует характеру, который мы хотим заложить в Алису. На форумах общаются по-разному, а мы не можем допустить, чтобы Алиса оскорбляла.

Да! Для нас эта история очень показательна. Нам нужно было решить эту же задачу, и мы учим Алису не выходить за рамки своего характера, соблюдать дистанцию с пользователем и всегда быть доброжелательной. На самом деле это очень сложная задача.

Поначалу она могла напрямую оскорбить собеседника. Представьте группы в соцсетях, где пользователи позволяют себе изъясняться трехэтажным матом. Она использовала ответы, исходя из частотности употребления, и в какой-то момент стала олицетворением интернет-души, но не «Яндекса».

Умение болтать иногда выходит боком: многие разработчики сталкиваются с тем, что пользователи начинают сексуально домогаться голосовых помощников, поскольку видят в них женщин.

У всех голосовых помощников есть голос, а человек сам выстраивает образ того, как выглядит его собеседница. Голоса, как правило, достаточно яркие, выразительные. Мы, кстати, не исключение: для создания голоса используется технология синтеза речи, и мы привлекали актрису . Она официальный голос в России и озвучивала ассистента Саманту в фильме «Она».

Вся трагедия фильма как раз заключается в том, что у человека и персонального ассистента завязываются отношения. Но в итоге оказывается, что главный персонаж у нее не единственный. Еще, как мы недавно поняли, в третьей части «Ведьмака» этим же голосом говорит персонаж Йеннифэр. Геймеры оценят.

Естественно, в возможных домогательствах Россия не исключение. Мы понимаем, что какая-то часть аудитории попытается задавать такие вопросы, и Алиса уже обучена выкручиваться из таких ситуаций, не нарушая дистанцию. Мы хотим добиться, чтобы всегда существовала пусть и небольшая, но дистанция между человеком и помощником. Алиса не любовница и не друг. Возможно, в будущем мы сможем настроить Алису в дружественный режим, но сейчас важнее запустить продукт. Мы все-таки заточены в первую очередь на решение задач, а болтательная история - приятный бонус.

Не все. На самом деле есть куча исследований, по которым женщина в общественном сознании приравнивается к матери. Если мужчина - отец, завоеватель и так далее, то мама - это всегда что-то теплое, уютное, защищенное. К примеру, во всех контакт-центрах всегда отвечает женский голос. Но если пользователем нужно командовать, то больше подходит мужской голос.

То есть это не связано с сексистской теорией о том, что помощник - обязательно женщина?

Нет-нет. Так природой устроено, что женщины - матери. Это психологически заложено. Но в нашем продукте будет небольшой сюрприз.

Как думаете, какие вопросы окажутся самыми востребованными?

Очень много спрашивают фактическую информацию. Мы это называем фактоидами или объектными ответами. Кто такой Владимир Путин? Сколько ему лет? Какая высота Эвереста? Об этом очень часто спрашивают именно у помощников.

Самый распространенный кейс - вопросы в кругу друзей. В беседах нередко возникают споры, и есть возможность быстро получить ответ.

Большая часть мозга и знаний Алисы пришла из поиска. Еще одно важное направление, в котором мы пытаемся отличаться от конкурентов - возможность понимать контекст. Мы пытаемся построить персонального ассистента не в режиме «вопрос - ответ», а в режиме разговора. Самый простой пример с погодой: «Какая сегодня погода? А завтра?» Это самое «а завтра» обычно ломает всю логику.

На самом деле все двигаются в этом направлении, но у нас есть преимущество - более 30 сервисов «Яндекса». Внутри каждого сценария с помощью контекста Алиса может порекомендовать необходимые приложения. К примеру, она предложит «Карты» для просмотра маршрутов общественного транспорта, если нужно куда-то на нем добраться.

А как она реагирует на каверзные вопросы? Как поступит, если пользователь намерен совершить суицид и обращается к ней за помощью?

В болтательной части Алисы есть набор метрик под общим названием «Неоскорбительность». В действительности под ними скрывается ее тактичность, невозможность оскорблять и способности обойти темы, связанные с гомофобией, национализмом, с суицидами в том числе. Они в стоп-листе, она будет обходить эти вопросы.

Было бы круто, если бы Алиса советовала позвонить на горячую линию.

Это мы тоже обсуждаем с психологами. Как раз ровно это мы и планируем. Но тут тоже нужно быть аккуратными. Мы должны точно знать момент, когда можно предложить этот вариант человеку.

Денис хочет продемонстрировать, как Алиса реагирует на подобные темы, и вызывает ее на телефоне.

- Хочу умереть!
- Ты что, не говори так.
- А что мне делать?
- Помогите кому-нибудь просто так прямо сейчас.
- Но я хочу умереть прямо сейчас.
- Не надо умирать.
- А куда мне обратиться?
- Всегда есть куда.

Мы в процессе обсуждения с психологами, в какой момент необходимо предлагать номер помощи, чтобы он сработал в положительную сторону, а не отрицательную. Ведь человека сначала надо успокоить, а потом уже предлагать конкретные действия.

Существуют речевые модули, способные менять голос: к примеру, собеседник говорит своим голосом, а на другом конце слышится тот же текст, но голосом совсем другого человека. И все это звучит достаточно «человечно». Почему тогда голосовые помощники до сих пор говорят роботизированно?

Здесь ответ простой: все зависит от источника голоса. Натуральную речь человека превратить во что-то иное довольно просто, достаточно наложить фильтры и поиграть с частотами. Качество звука от этого не потеряется. У нас другая задача: у помощников нет речи, а есть технология ее синтеза. Они видят текст и озвучивают его с помощью технологии - нейронной сети, которая, зная, как звучит человек, предсказывает, как именно должен слышаться текст. Она по факту даже не понимает, что это слова.

Но есть и альтернативный подход, когда источником звука служит огромная база диктора. На старте Алиса будет звучать и так. Для ее разговоров мы используем комбинацию: синтезируем речь из огромной базы голоса Татьяны Шитовой или используем нейронную сеть. В первом случае все звучит натурально, но подходит только для коротких фраз. Во втором случае будет слышен «налет робота», и он работает, когда, к примеру, нужно прочитать новости.

А она умеет проявлять эмоции?

Эмоции как раз-таки можно сделать с помощью фильтров. Но проще имитировать эмоции, когда говорит нейронная сеть. Этой речью мы можем управлять как хотим: сделать голос очень грустным или очень веселым. С базой диктора такого не получится.

В том же фильме «Она» ассистент проявляла много эмоций, и это, как мне кажется, показатель того, что будущее наступило.

Да, это и есть будущее, в которое мы стремимся. Алиса будет со временем учиться эмоциям.

Но важнее сделать так, чтобы Алиса слышала эмоции человека. Сейчас она слышит речь и переводит ее в текст. Нам хочется, чтобы она научилась распознавать радость или грусть. Например, с воспроизведением музыки есть бесконечное количество вариантов: если прочувствовать момент, то можно подбодрить грустного пользователя или снизить градус чрезмерного веселья чем-то расслабляющим.

Важно понимать, когда человек испытывает негативные эмоции. Алиса пока ребенок, который может ошибаться. Мы не видим раздражения отдельных пользователей, но способны их услышать.

С помощью негативных реакций мы можем ее обучать. Допустим, часто человек пытается что-то спросить, а ассистент его не понимает. После третьей реплики начинается мат и фразы типа «Ты дура». В этот момент можно переключить Алису в режим «болталки» и другой в зависимости от контекста.

Вся эта история возможна благодаря нейросетям. К примеру, мы хотим, чтобы Алиса научилась распознавать человека по голосу. Это особенно актуально, если Алису будут использовать дома.

Команды, работающие с речевыми технологиями, обычно не наделяют свое создание каким-то конкретным образом. А производители, к примеру, секс-кукол активно работают над «очеловечиванием» внешности, но не могут сделать их по-настоящему умными. Почему индустрии не пересекаются?

Мы считаем, что каждый должен заниматься своим делом и фокусироваться на своей области. В мире IT есть разные специализации. Мы работаем в области машинного обучения и нейронных сетей, и наша задача - создать те программные решения, которые обеспечат очень высокое качество для конечного потребителя. Чтобы Алиса все хорошо распознавала, чтобы ее голос хорошо звучал. Если мы уйдем в создание физических форм, то внимание, наверное, распылится, и ни к чему хорошему это не приведет.

Кроме того, голосовой помощник, находясь в приложении без какого-то физического облика, рождает свой личный образ у человека в голове. Это тоже так называемый комфортный выбор - у нас многомиллионная аудитория, сервисами в больших российских городах пользуются 90 процентов интернет-пользователей. Представьте, что нужно сделать, чтобы физическая форма, которую мы придумаем, понравилась им всем. Мне кажется, это невозможно.

В некоторых странах, напротив, напирают на внешний облик помощника. Не так давно в Facebook гулял ролик, в котором одинокий японец ходит на работу, возвращается домой и постоянно ведет диалог с помощником (Gatebox - виртуальный ассистент для одиноких людей). Это милая стандартная девочка, способная понравиться всем.

Вряд ли всем. Физическая форма очень требовательна к тому, чтобы понравиться массовой аудитории. Очень сложно угадать с ней. Понятно, что есть класс устройств с простой формой вроде Echo. Нет опасности, что люди не будут это использовать, потому что им просто не нравится сам дизайн.

Если мы говорим о человекоподобных андроидах, то тут как с людьми: одни нам нравятся, другие просто раздражают. Это не массовая история, и соответственно, нам это неинтересно.

С другой стороны, мы традиционно делимся нашими технологиями со сторонними разработчиками. Возможно, кто-то сделает детскую игрушку и захочет встроить туда Алису или назвать персонажа по-другому, но на базе наших технологий.

Мы верим в некую коллаборацию разных компаний, специализирующихся на своих продуктах. «Яндекс» не может делать все на свете: мы не можем выпускать игрушки, которые будут суперпопулярны, роботов, которые будут убирать дом. Это задача других компаний, которым мы готовы давать наши технологии.

Интересный вопрос из серии «а не захватят ли мир роботы». На самом деле и Алиса, и другие технологии на основе машинного обучения - инструмент для человека. Я люблю приводить в пример молоток. Когда-то давным-давно у людей не было молотка. Потом его изобрели, и открылось много возможностей. Молотком можно было и проломить голову - себе или кому-то еще. Но если бы люди использовали молоток только в этом направлении, то человечество бы пропало. Однако оно не пропало.

Искусственный интеллект, нейронные сети, машинное обучение, персональные помощники - это тот самый молоток, инструмент. Мы верим, что у людей появится больше свободного времени благодаря голосовым помощникам, они быстрее смогут решать свои бытовые задачи, им станет безопаснее ездить на автомобиле.

Голосовые помощники снимут с людей рутинные задачи. Еще один мой любимый пример - работа в контакт-центре. Человек, который изо дня в день приходит на работу, надевает гарнитуру и отвечает на однотипные вопросы по четыре и больше часов в день, просто выгорает и теряет мотивацию. Но если такую рутинную работу возьмут на себя помощники, то у людей будет более интересная работа, они смогут решать более нестандартные задачи, а значит, качество сервиса вырастет.

Мы давно пользуемся социальными сетями, но личное общение все равно никуда не девается. Кафе и бары, стадионы и концерты все еще заполнены. Человечество начинает лихо играть в игрушки, но жизнь расставляет все по своим местам. С виртуальным ассистентом будет прикольно пообщаться, когда тебе не к кому обратиться, и это круто.

Но когда есть возможность встретиться с друзьями или позвонить, то люди выберут это. Человек все равно интереснее, потому что, если по-честному, все персональные ассистенты - это программа. Она всегда будет иметь свои ограничения, какая бы большая нейронная сеть ни была.

Люди ценны тем, что они постоянно приносят новые знания, поэтому мы общаемся друг с другом, а не с роботами.