4 стартапа по разработке искусственного интеллекта, анализирующие отзывы потребителей

Уже по состоянию на 2010 год четвёртая часть американцев (24%) опубликовала в интернете отзывы о продуктах или комментарии, и 78% пользователей интернета занимались исследованиями товаров в сети. Но эта статистика уже устарела. Нынешние показатели выше. Совсем недавно, в 2016 году, компания BrightLocal установила, что 91% потребителей регулярно или время от времени читает отзывы онлайн, 47% из них учитывают тональность отзывов о местных предприятиях при принятии решения о покупке. Среди прочих показателей, предоставленных BrightLocal: 74% потребителей утверждают, что положительные отзывы заставляют их доверять местным компаниям больше, а 60% говорят, что из-за негативных отзывов о том или ином предприятии они не обращаются к нему за услугами.

Так что отзывы важны, а ключевой элемент в них – выраженное мнение. Для понимания содержания отзывов и их тональности с учётом масштабов интернета и всего общества, а также скорости их распространения, вам необходима автоматизированная обработка естественного языка и другие формы искусственного интеллекта.

Платформы потребительских отзывов – Bazaarvoice, PowerReviews, Yotpo и т.п. – помогают брендам и интернет-магазинам собирать отзывы и повторно их используют с целью увеличения продаж. Эта функция важна, ведь, как сообщает Bazaarvoice: «Доход наших клиентов при каждом посещении в среднем увеличивается на 65%, а также на 52% возрастает конверсия web-страниц, содержащих рейтинги и отзывы о продуктах». Однако не все платформы используют обработку естественного языка в работе своих продуктов или сервисов. Меня интересуют именно те компании, которые её задействуют, те, которые обращают внимание на то, что действительно сказано в отзывах, независимо от звёзд рейтинга. Давайте рассмотрим четыре из них, а также самостоятельные подходы к анализу потребительских отзывов.

Отзывы потребителей содержат несколько основных элементов информации. Во-первых, существует звёздный рейтинг. Но рейтинги, даже те, которые разбиты на категории (на сайте Airbnb, например, среди категорий выделяют точность, общение, чистота, расположение прибытие, цена/качество) не имеют объяснительной силы. Поэтому нам остаётся текст отзыва: произвольная форма, потребительская оценка продукта. Этот текст рассказывает историю, а истории хорошо продаются, так что нам нужно знать, какие аспекты продукта или сервиса обсуждаются, какие слова используются при их описании, а также общую тональность отзыва.

«Текст отзыва также позволяет узнать многое об его авторе», – пишет профессор Стэндфордского университета Дэн Джурафски в своём исследовании языковых особенностей отзывов «Применение методов обработки естественного языка для изучения повседневного языка». (Очень показательно исследование Джурафски в сфере науки о данных. Он изучал, как рестораны и люди, оставляющие отзывы, говорят о еде, включая также связи между словесной формулировкой меню и ценой за позицию. Кроме того, обработка естественного языка и искусственный интеллект могут помочь в модерации отзывов путём определения нецензурной лексики и выявления фальшивых отзывов. Но это уже темы для другой статьи). И наконец, важней всего личность человека, оставляющего отзыв. Так, основную роль играют демографические характеристики, такие как возраст, пол и географическое положение, новизна отзыва,  а также репутация автора отзыва (или рейтинг) и его социальный профиль.

Мы описываем сценарий, в котором данные — комплексные. Пост в блоге Bazaarvoice расскажет вам о некоторых проблемах, связанных с анализом и обработкой данных, но он ничего не говорит об их решении. Стартапы, которые я вам представлю, задействуют аналитику – обработку естественного языка, машинное обучение, а также другие формы искусственного интеллекта – для того, чтобы решать эти проблемы.

На изображении: Панель инструментов для анализа с помощью Revuze

  1. Revuze анализирует продукты и их свойства, а также состояние бренда при помощи нескольких дифференциаторов. Один из них отвечает за обнаружение разных способов, с помощью которых люди разговаривают на заданную тему, а второй – за определение тональности фраз, в которых отсутствуют очевидные подсказки, как например, использование слов типа «хороший», «счастливый», «ужасный».

Анализы при помощи Revuze не ограничиваются лишь отзывами; технология компании использует обработку естественной речи для выделения тем, ключевых слов и тональности из ответов на опрос, записей разговоров с колл-центром и социальных медиа. Исходный текст анализируется в разрезе таксономических категорий, генерируемых при помощи обучения с частичным привлечением учителя. Компания возникла осенью 2015 года на базе инновационного инкубатора корпорации Nielsen в Кесарии, Израиль, и стала специализироваться на управлении впечатлениями клиента, позволяя клиентам «измерить потребительское восприятие целостного продукта и опыт его эксплуатации».


На изображении: Встроенный в сайт анализатор общественного мнения от компании Aspectiva

  1. Aspectiva осуществляет аспектно-ориентированную агрегацию отзывов и поиск продуктов, исходя из впечатлений авторов отзывов о свойствах товаров и их возможностях. Выделение аспектов, осуществлённое при помощи машинного обучения без учителя, сочетают со скрытой аналитикой, чтобы определить «истинное использование любого продукта и создать рекомендации на основе полного пользовательского опыта».

График результатов, а именно аспекты продуктов и рейтинги тональности отзывов, как показано на изображении, можно встраивать на сайт интернет-магазина. Как указано в процитированном выше отчёте компании Brandwatch, основная цель – увеличить коэффициент конверсии и доходы от продаж. Кроме того, Aspectiva предоставляет API, позволяя потребителям создавать собственный пользовательский интерфейс для аналитики от Aspectiva, и функцию поиска с учётом свойств продукта.

Aspectiva повторно задействует комбинацию из обработки естественного языка и машинного обучения, которая «сканирует тексты, написанные потребителями, и изучает, что говорят люди, когда они довольны или недовольны продуктами, о которых пишут, кроме очевидных слов на обозначение тональности,…а также определяет тональности с помощью фактических предложений». Эта функция компании Aspectiva не уникальна (Revuze также использует что-то похожее), но она обеспечивает более надежное определение тональности, по сравнению с большинством других продуктов-конкурентов.

На изображении: Панель управления потребительской удовлетворённостью от компании SmartMunk.

  1. Анализ при помощи программы story.ly от компании Smart Munk фокусируется скорее на факторах, улучшающих удовлетворённость потребителей, нежели на свойствах продуктов или услуг. Основной принцип заключается в том, что удовлетворённость потребителей улучшает результаты бизнеса, так что важно сосредоточиться на тех элементах, которые радуют или разочаровывают клиента.

Гибридная методология компании подсчитывает качественное понимание, обнаруженное в контенте, созданном потребителями. При этом она ориентирует развитие продукции бренда и маркетинговые функции. «story.ly напрямую собирает ваши отзывы, включая переменные фильтров с платформ продавцов. Уже через несколько секунд вы можете увидеть всю историю онлайн в вашем интеллектуальном отчёте».

Особенно мне нравится онтологический график в виде линии горизонта, который находится в нижнем правом углу панели управления потребительской удовлетворённостью. Основательница SmartMunk Андера Гадайб, которая также руководит агентством по исследованию рынка Dialego, указывает на функциональные и эмоциональные свойства, отраженные в онтологии. Это репрезентация факторов, улучшающих удовлетворённость потребителей, осуществлённая по категориям.

Что касается облака тем: оно генерируется при помощи алгоритма TF-IDF для ранжирования терминов на основе относительной частотности термина в ряде входных материалов. По словам Гадайб, несмотря на то, что «клиентам нравится смотреть на кодированные данные» – на созданный потребителями контент, классифицированный по свойствам продукта (нежели по факторам, улучшающим удовлетворённость потребителей) –  компания «имеет большой успех, используя менее зависимый от категорий анализ».

На изображении: Архитектура технологии по анализу отзывов от компании SentiGeek

  1. SentiGeek – это компания, которая занимается анализом тональности отзывов и обратной связи от потребителей перед запуском товара. (Я неофициально консультирую основательницу Мару Цумари, которая рассказывает о функциях и возможностях на видео). Рынки кандидата, демонстрирующие широкую заинтересованность в тональности отзывов, включают в себя розничную торговлю онлайн, исследования рынка, маркетинг, финансовые учреждения и органы государственного управления. Продукт поддерживает функции составления отчётов и анализа, а также предоставляет возможность мониторинга. Он извлекает оценочные слова и фразы, а также тщательно отфильтровывает отзывы по тональности и предоставляет анализ по отзыву и по его автору с возможностью создания профайлов потребителей.

SentiGeek отличается тем, что в своих анализах сосредотачивается именно на авторах отзывов. Но вместо того, чтобы в подтверждение своих слов предоставить скриншот интерфейса, я подумал, что интересней будет посмотреть на архитектуру технологии SentiGeek. Обратите внимание на использование spaCy, инновационного пакета для обработки естественного языка, основные функциональные возможности которого – это парсинг и извлечение именованных объектов. Также обратите внимание на базу знаний, структурированную при помощи RDF (Resource Description Framework) – среды описания ресурса, которая изначально возникла как стандарт семантической паутины, созданный для оценок аспектов и тональности на конкретном домене.

Возможности самостоятельного анализа 

DIY («сделай сам») – это вариант для вас, если вы имеете аналитическое мышление и навыки «выпаса» данных. Самостоятельный анализ наиболее подходит тогда, когда надо иметь дело с текстом отзыва в рамках автоматизированного рабочего места для анализа данных. К примеру, компания Aylien описывает создание процесса анализа текстов потребительских отзывов в RapidMiner, а MeaningCloud рассказывает о классификации текстов в Excel и создании собственной модели. Если у вас есть навыки анализа и обработки данных, замечательным выбором станет Python с возможным использованием gensim, NLTK, Stanford CoreNLP (в оболочке Python) и TensorFlow. Вы можете использовать spaCy для обработки естественного языка (это выбор компании SentiGeek) и выделять исходною информацию Python; spaCy хорошо работает в паре с TensorFlow, Keras, Scikit-Learn, Gensim и с остальными элементами платформы искусственного интеллекта Python.

Вы также создать его самостоятельно, используя платную систему обработки естественного языка. Описывая опыт своей работы на сайте TripAdvisor (с использованием технологий от Lexalytics), Джон Келли открыл мне глаза на возможности, которые предоставляет аналитика отзывов. Видео презентации Келли «Что говорят путешественники…Использование тональности для улучшения вовлечённости пользователей» уже не новое, но всё ещё достаточно интересное.

Прогноз на будущее

Ожидается, что потребители будут продолжать делиться своими впечатлениями от продуктов и услуг, концентрируясь и на характеристиках, и на опыте использования. «Сарафанное радио» имеет значение: влияние отзывов и постов в социальных сетях на решения о покупке будет лишь возрастать. Мы будем наблюдать за по-прежнему сильным рынком аналитики – обработка естественного языка, машинное обучение, анализ и обработка данных – как лучший ответ на сочетание объема и влияния, аналитика текстов (а также изображений и видео), которые могут обнаружить объекты, эмоции и контекст в разнообразных медиа. Если вы торговая марка, вам следует разработать или приобрести аналитическое программное обеспечение либо у авторитетного поставщика, либо у стартапа. В противном случае вы рискуете отставать от современных тенденций.

Original