ПРИМЕНЕНИЕ СКВОЗНЫХ ТЕХНОЛОГИЙ ДЛЯ РЫНКА ТЕХНЕТ
ЦИФРОВОЙ СЛЕД ПОТРЕБИТЕЛЯ И ЕГО ИСПОЛЬЗОВАНИЕ
АНТОН АМБРАЖЕЙ
К.Ф.-М.Н., ЗАМЕСТИТЕЛЬ ДИРЕКТОРА АКАДЕМИЧЕСКОГО ЦЕНТРА КОМПЕТЕНЦИИ SAP СПБПУ
ЧТО ТАКОЕ BIGDATA?
Большие данные изменили наше представление о маркетинге. Они породили принципиально новые подходы к созданию и продвижению товаров, изменили парадигму общения с клиентом. Термин «Большие данные» ввел Клиффорд Линч, редактор журнала «Nature», 3 сентября 2008 года, когда опубликовал в специальном номере журнала свои размышлениях на тему «Как могут повлиять на будущее науки технологии, открывающие возможности работы с большими объемами данных?». Сам термин, конечно же, не относиться только к объему данных. Это общее обозначение структурированных и неструктурированных данных огромных и при этом сложно устроенных объемов. Их характеристики можно представить как пять «V»:
объем — volume
Накопленная база данных представляет собой большой объем информации, который трудоемко обрабатывать и хранить традиционными способами, для них требуются новый подход и альтернативные инструменты
скорость — velocity
Данный признак указывает как на увеличивающуюся скорость накопления данных (90 % информации было собрано за последние 2 года), так и на скорость обработки данных. В последнее время стали более востребованы технологии обработки данных в реальном времени
многообразие — variety
То есть возможность одновременной обработки структурированной и неструктурированной разноформатной информации (на текущий момент 80 % информации входит в группу неструктурированной)
достоверность данных — Veracity
Все большее значение пользователи стали придавать достоверности имеющихся данных
ценность накопленной информации — value
Большие данные должны быть полезны компании и приносить определенную ценность для нее
На протяжении всей жизни мы движемся через пространство, время, взаимодействуем с окружающим миром и, конечно же, оставляем следы. Следы в реальном мире подвержены изменениям, а следы в виртуальном мире потенциально могут храниться вечно. Поэтому практически любой контакт с компьютерными системами и часто вне зависимости от нашего желания приводит к образованию следа. В современном мире практически нет возможности избежать этого, поэтому надо понимать, что оставляет след и как это могут использовать.
ИСТОЧНИКИ ЦИФРОВОГО СЛЕДА
фотографии
Самое простое и самое распространенное средство оставить след — это разместить фотографию на любом сайте, фотохостинге, социальной сети или просто отправить по почте. Каждый файл с фото в зависимости от камеры или действия пользователя хранит в себе определенную метаинформацию, или метаданные в стандарте EXIF. Стандарт EXIF является чрезвычайно гибким (например, позволяет сохранить полученные с приемника GPS координаты места съемки) и допускает широкое развитие — как правило, фотоаппараты добавляют к файлу информацию, специфичную только для данной камеры. Правильно интерпретировать такую информацию могут только программы от изготовителя фотоаппарата. В качестве примера информации, записываемой в EXIF, можно указать следующее:
Производитель камеры, модель
Информация о правообладании
Выдержка, диафрагма, ISO, использование вспышки, разрешение кадра, фокусное расстояние, размер матрицы, эквивалентное фокусное расстояние и т. д.
Дата и время съемки
Географические координаты и адрес места съемки
Пользовательская информация
Поэтому самое простое — начать с анализа метаинформации, используя один из многочисленных онлайн-сервисов, например, этот. Метаинформацию можно удалять или изменять, некоторые сервисы удаляют метаинформацию из фотографий, некоторые ее оставляют, в частности данные о координатах точки съемки. Если же метаинформации недостаточно, то есть еще много способов работы с картинками. Прежде всего, по картинкам можно проводить поиск. Вот как это делают некоторые системы:
Можно загрузить картинку или указать на нее ссылку. Алгоритмы отличаются, поэтому можно попробовать обе системы; помимо похожих фото могут быть выданы предположения о том, что изображено на картинке. Поэтому если вы просто сделали фото в отпуске, то найти, в каком отеле вы остановились, — это не проблема. Таким образом, получается, что не только люди, но и предметы или здания оставляют свои следы. Картинка может быть сделана не вами, а другими людьми или автоматизированными системами.
Распознавание лиц в потоке, идентификация и поиск людей, изображенных на фото, — эти технологии уже активно применяются не только спецслужбами и компаниями, работающими с системами безопасности, но и социальными сетями, программами управления фотоальбомами и даже интернет-магазинами. Для социальных сетей это используется, например, для автоматической отметки друзей на фото.
В целом найти нужного человека по фото не составляет большой сложности, если он хоть где-то оставил свой след. Кроме идентификации человека можно по фото определить его пол, возраст и даже эмоции. Пример распознавания эмоций и определения возраста.
торговые сети
Возьмем, например, чек. Это факт покупки на некоторую сумму. Сам по себе он не очень полезен, но если добавить данные покупателя, дату, информацию о купленном товаре, магазине, т. е. метаинформацию, и сделать это для всех покупок в сети, то мы получим данные, на основе которых можно сделать определенные выводы, построить модели поведения, предсказать действия покупателя. Это и будет то, что мы называем большими данными.
По прогнозам, количество данных на планете будет удваиваться каждые два года, вплоть до 2020 года. В период между 2013 и 2020 годами количество информации увеличится десятикратно — с 4,4 трлн гигабайт до 44 трлн. При этом, по оценкам International Data Corporation (IDC), к 2020 году только 35 % данных будут содержать ценную для анализа информацию. Сейчас умные большие данные (smart big data), представляющие собой уже отобранную полезную информацию, можно эффективно использовать для решения различных задач. Но для того чтобы эффективно использовать эти данные, нам надо идентифицировать покупателя. Привязка к покупателю нужна, прежде всего, для анализа его потребительских предпочтений и особенностей поведения. Что, как часто, какие продукты вместе и даже то, как он перемещается по магазину — все это предмет пристального изучения.
Для идентификации нас, как покупателей, есть много способов. Самый простой — карта лояльности. Это обычно и идентификатор, и канал коммуникации, т. к. карта привязана к e-mail или номеру телефона, который сейчас по факту совмещает в себе все каналы. Единственный минус карт лояльности — идентификация идет на кассе, поэтому нет возможности сделать мгновенное предложение. Кстати, все больше карт перемещается в специальные приложения, так что возможности идентификации повышаются. В частности, есть проекты идентификации по Wi-Fi. Магазины или кафе предоставляют клиентам бесплатный Wi-Fi, и уже после первого же подключения можно определять, что данный клиент появился в сети определенного магазина, вернее, появилось его устройство. В любом случае нам нужно, чтобы покупатель как-то себя идентифицировал. Например, используя персональный ручной сканер для покупок, который выдается при предъявлении карты лояльности. Этот проект стартовал в сети «Лента».
Другой способ — распознавание лиц. Мы можем фотографировать человека в момент выдачи карты и дальше распознавать его в момент входа в магазин. Даже не персонифицированных покупателей мы можем распознавать под каким-то условным идентификатором и дальше контролировать любое посещение им магазина. Точность таких систем составляет примерно 85 %, они универсальные, но дорогие.
фитнес-браслеты
Еще пример, когда большие данные существенно меняют картину — геотрекеры. В ноябре 2017 года разработчик приложения для фитнеса опубликовал большую карту данных с маршрутами пользователей по всему миру. Сами траектории обезличены, но оказалось, что с помощью этой информации легко можно отследить местоположение секретных военных баз. Действительно, почему так много людей бегают по кругу в такой пустынной местности?
Один трек не дал бы такой информации, а множество дали нам понимание того, как перемещаются люди, и позволили сделать соответствующие выводы. Большие данные — это больше, чем просто много данных, собранных вместе. Они позволяют узнавать закономерности, о которых мы ранее и не подозревали, и создавать на их основе новые ценности и даже спасать людские жизни. Кстати, виртуальным следом можно даже рисовать.
социальные сети
Социальные сети — это, наверное, самый мощный источник информации о человеке. Анализу может подлежать все:
Информация из профиля
Анализ изображений
Анализ связей с другими людьми
Анализ текстов публикаций
Анализ лайков и т. д.
Например, тут можно посмотреть предпочтение Фейсбука по рекламе, связанной с вашим профилем. Есть также и открытые системы, которые осуществляют поиск по социальным сетям, например, Яндекс.Люди, в которой в настоящий момент поиск происходит по 16 соцсетям. Или же поиск по постам в соцсетях: Social Searcher и другие сервисы. Сейчас данные сетей используют даже банки, которые анализируют профили в соцсетях для определения надежности клиента, его психотипа, уровня дохода, образа жизни и т. д. Не обходят своим вниманием страницы работников и работодатели.
специализированные сервисы, государственные сервисы
Сейчас государственные органы стараются максимально консолидировать свои базы и переносят часть своих сервисов в виртуальное пространство. Конечно, это позволяет иметь все более точный потрет гражданина. Ниже перечень открытых сервисов, по которым можно найти информацию о человеке или объекте:
На сайте ФНС можно узнать ИНН. Для этого необходимо знать ФИО, дату рождения, серию и номер паспорта, а также дату выдачи паспорта. Аналогично на сайте ФНС можно узнать, является ли физическое лицо ИП (индивидуальным предпринимателем). Поиск можно осуществлять по ФИО и региону, ИНН или ОГРНИП. Там же можно получить данные об учредителях по наименованию юрлица.
Перечень сервисов, по которым можно найти наличие судебных решений. Поиск осуществляется в системе ГАС «Правосудие» (государственная автоматизированная система):
Перечень сервисов по которым можно проверить, находится ли человек в розыске:
смартфон
Смартфон сейчас — это основное средство коммуникации, идентификации и платежа. Источниками информации служат:
Приложения магазинов, сервисов, систем лояльности
Банковские приложения
СМС
Навигационные системы
История поиска, геопозиционирование
Операционная система
Почта
Мессенджеры
Прочие приложения, которые имеют доступ к персональной информации
По данным за 2017 год, доля мобильных операционных систем составляла: Android — 73,52 %, iOS — 19,37 %, Windows — 0,77 %. Среди персональных компьютеров в марте 2018 года Google Chrome установлен на 59,66 % компьютеров. Таким образом, операционная система от Google является абсолютным лидером среди систем как для смартфонов, так и для ПК. Отслеживание информации встроено на уровне самой системы, это сделано для предоставления контекстной рекламы, хотя может использоваться гораздо шире. Ниже ссылки на то, что знает о нас Google:
Таким образом, мы понимаем, что любой контакт с любым сервисом или использование электронного устройства, каким бы безобидным это нам ни казалось, приводит к образованию цифрового следа. Собранные вместе эти данные образуют нашу цифровую тень.
Цифровая тень и цифровой двойник
Большое количество данных позволяет узнавать закономерности, о которых мы ранее и не подозревали, и создавать на их основе новые ценности, продукты или даже спасать людские жизни. Из массы информации, которую собирают о нас, формируется наша цифровая тень, образ, каким видят нас различные системы: образ пациента, покупателя, гражданина. Это позволяет строить модели, предсказывать поведение, предпочтения, разрабатывать индивидуальные продукты, диагностировать состояние здоровья и многое другое.
Давайте рассмотрим ряд сценариев использования больших данных и цифровой тени потребителя. Все мы знаем, как одежда на картинке в интернет-магазине отличается от того, как она выглядит на нас. Поэтому нам всегда нужна примерка. Теперь представьте, если бы вы могли загрузить на сайт производителя одежды свою точную цифровую модель и примерить на нее одежду. А производитель, в свою очередь, получил бы бесценную информацию о том, какие размеры одежды у его клиентов. Такие проекты уже есть. Как бы это изменило торговлю одеждой? Думаю, что кардинально. Пойдем дальше: как насчет производства одежды под вас, с учетом всех анатомических особенностей?
Рекомендательные системы
Большинство сайтов используют рекомендательные системы. Самое простое — это рекомендовать понятные товары типа аксессуаров, как футляр к телефону или объектив к фотоаппарату — эти товары связаны напрямую. Но сейчас этого явно недостаточно, надо проанализировать действия человека на сайте, понять, что и как он ищет, что ему надо или может понадобиться в будущем. Большинство систем используют алгоритмы коллаборативной фильтрации. В их основе лежит предположение что если мы сгруппируем похожих пользователей по каким-то признакам, то, скорее всего, им будут нравиться одни и те же товары т. к. их поведение, как покупателей, одинаково. Также можно воспользоваться фильтрацией на основе контента, т. е. проследить историю предпочтений пользователя и предложить ему новый товар из того же ряда. Например, если покупатель книжного магазина предпочитает отечественные детективы, то, скорее всего, его заинтересует новый детектив российского автора.
Существуют и гибридные модели. Анализу подвергается не только то, что смотрит человек, но и то, как он взаимодействует с сайтом или сервисом. Как долго он смотрел страницу, сколько пробыл на сайте и т. д. На основе этого анализа можем отнести пользователя к тому или иному типу и подстроить контент сайта под него. Сайт изменит дизайн так, чтобы предложить аналитику больше информации, а человеку, склонному к импульсивному поведению, — яркие впечатления. И эта технология уже работает. Сайты анализируют поведение пользователей, накапливают информацию и все точнее подстраиваются под них. Даже когда мы ушли с сайта, с нами продолжают взаимодействовать — работают скрипты на основе поведения. Остались товары в корзине, можно напомнить, можно предложить скидку или товар-заместитель. Тут главное понять, что произошло, а это не всегда очевидно.
На помощь приходят алгоритмы машинного обучения. Мы даем на вход модели все данные о пользователе и известные нам результаты, например, то, что пользователь покинул сайт, ничего не купив, или закрыл вклад в банке, или же у него наступил страховой случай. Система сама может выделить нужные факторы и научиться предсказывать уже известный результат с достаточной точностью. Так система обучается. Если на вход подать данные для нового пользователя, то мы можем предсказать результат для него с определенной точностью. Так работают предиктивные системы, они обучаются на исходных исторических данных и делают предсказание. Следующее поколение систем, основанных на прескриптивной аналитике, готовы дать конкретные указания, что делать. Таким образом, мы формируем автоматические сценарии реагирования.
Другая полезная для анализа следа потребителя технология — это сентиментный анализ. Он позволяет оценить тональность высказывания, например, понять, хвалят или нет ваш продукт в комментариях, и отреагировать соответствующим образом. Например, сегментировать клиентов на основе их отзывов о новом продукте в соцсетях.
Следующий случай — это уже не продажа, а производство товаров под конкретного индивидуального потребителя при сохранении цены, аналогичной серийному товару. Это новый тип производства, и уже сейчас есть примеры его реализации. Давайте рассмотрим этот сценарий на примере производства автомобиля. Что нам нужно знать о пользователе и откуда мы можем получить эту информацию:
Зачем ему нужен автомобиль?
Какие требования к его оснащению и техническим характеристикам?
Какой должен быть дизайн?
Какому стилю вождения должен отвечать автомобиль и т. д.
Можно ли это сделать полностью в автоматическом режиме, без участия пользователя? Для этого придется собрать довольно много данных из различных источников. Данные о стиле вождения может дать навигационная система, требования к эргономике водителя можно получить, если у нас будут его антропометрические данные, анализ социальных сетей может дать информацию о составе семьи, работе, предпочтениях. Конечно, нужна еще информация о социальном статусе, финансовых возможностях и т. д.
В целом чем полнее будет «цифровое досье», или цифровая тень, тем более точным будет попадание в цель. Примерно так и должны работать фабрики будущего, собирая информацию о потребителе и производя индивидуальную продукцию. Но все ли данные нам нужны? Сейчас многие компании собирают данные, но не знают, что с ними делать, поэтому появляется понятие умных больших данных, когда мы проектируем те точки сбора данных, которые нам необходимы.
Правовые аспекты использования информации
Кто же контролирует эти потоки данных и где грань между преимуществами, которые дает сбор данных о нас, и тотальным контролем? Это очень сложный этический вопрос.
За последнее время было большое количество утечек данных пользователей различных систем. За нашими данными идет настоящая охота, их продают, покупают, используют без нашего ведома: для рекламы, политики, формирования поведения и т. д. Большая часть государств стремится регламентировать эту сферу и ограничить использование персональных данных пользователей. Они создают законы о защите персональных данных, которые должны определить кто, как и зачем собирает наши данные, также большинство законодательных актов предусматривает хранение данных на территории проживания их владельцев, ведь данные становятся таким же богатством, как нефть, золото или другие полезные ископаемые. Появилось даже понятие «цифровые недра», и принадлежать они должны тем, кто их породил.
Основные законы, регламентирующие работу с персональными данными
в российской федерации
Федеральный закон Российской Федерации от 27 июля 2006 г. № 152-ФЗ «О персональных данных»
Федеральный закон «О внесении изменений в Федеральный закон «О противодействии терроризму» и отдельные законодательные акты Российской Федерации в части установления дополнительных мер противодействия терроризму и обеспечения общественной безопасности» от 6 июля 2016 г. № 374-ФЗ. Так называемый Закон Яровой
Право на забвение. Удаление информации о человеке из поисковиков. С 1 января 2016 г. вступил в силу Федеральный закон № 264 от 13 июля 2015 г. «О внесении изменений в Федеральный закон „Об информации, информационных технологиях и о защите информации“ и статьи 29 и 402 Гражданского процессуального кодекса Российской Федерации». Этот закон именуется также как «закон о праве на забвение». Суть его заключается в следующем: по требованию гражданина поисковая система должна удалить из поиска информацию о заявителе, распространяемую с нарушением Российского законодательства, недостоверную информацию, неактуальную, утратившую значение для заявителя. Исключения: информацию об уголовно наказуемых деяниях, если сроки привлечения к ответственности не истекли и информацию о совершенном преступлении, если не истекла судимость удалить нельзя. Оператор поисковой системы обязан в течении 10 дней удалить информацию. Отказ в удалении информации можно обжаловать в суд. Также необходимо понимать, что сама информация из Интернета физически не удаляется. Удаляется из поиска выдача ссылок на эту информацию. И если кто-то знает эту ссылку, он может зайти по ней напрямую и увидеть эту информацию
в европейском союзе
GDPR. General Data Protection Regulation. Генеральный регламент о защите персональных данных
#новыепроизводственныетехнологии #большиеданные #беспроводнаясвязьиинтернетвещей #трансфертехнологий #цифровоймаркетингимедиа #нормативно-правовоерегулирование #сборииспользованиеданныхвуправлении #практикиуправленияиорганизациядеятельности #передачакомпетенцийиуправлениезнаниями #нейротехнологии #искусственныйинтелект #сетевоеисистемноеадминистрирование #кибер-безопасность #кросскультурность #коммуникация #мышлениеикреативность #виртуальнаяидопреальность
Больше лонгридов и заданий доступны при записи на курс