Человек — это набор из пяти чисел: Игорь Волжанин, DataSine — о психотипировании с помощью big data

Желание человека знать о себе как можно больше играет на руку современной психологии — многочисленная информация, которую люди генерируют в социальных сетях, используется для психотипирования. Бизнес, в свою очередь, на основе этих больших данных персонализирует подход к клиентам. «Хайтек» встретился на конференции «Big Data, Meet Big Brother!», организованной Sistema_VC, с Игорем Волжаниным, CEO компании DataSine. Он рассказал о том, как компания выступает посредником между бизнесом и клиентом, об этике сбора данных и о том, почему психология людей позволила Cambridge Analytica украсть данные пользователей Facebook.

Игорь Волжанин — основатель компании DataSine, которая занимается психологическим профилированием клиентов для банков и других бизнесов. С помощью данных DataSine определяет психотип человека и делает коммуникацию бизнеса с ним более успешной. Компания была основана в 2015 году, когда Волжанин переехал в Лондон писать докторскую диссертацию по психологии. Инвестор DataSine — венчурный фонд Sistema_VC (основной инвестор — АФК «Система»).

«Человек кликает на баннер, а мы определяем его психотип»

— Чем занимается DataSine?

— Помощью с персонализацией общения бизнеса с клиентом. У этого процесса две составляющие. Первая — профилирование клиента на основе данных, которые уже есть у бизнеса. В основном раньше мы работали с финансовыми учреждениями, поэтому это были транзакционные данные клиента — как человек тратит деньги, где, сколько. За счет этого строился психологический портрет человека. И второе — это платформа, позволяющая менять e-mail, телефонные скрипты и СМС под психотип человека. Брать письмо и менять цвета, картинки, слова — чтобы сделать его более доступным и интересным для определенного психотипа.

— Раньше вы работали с банками, а сейчас?

— Мы пытаемся выйти на новые рынки. Из-за прежней ограниченности с транзакционными данными в качестве исходных у нас был узкий круг компаний, с которыми мы работали. Теперь мы создали новый метод профилирования и больше уже не нуждаемся в транзакционных данных. И мы можем профилировать клиентов практически для всех — от огромных корпораций до стартапов, у которых нет подобных данных.

— Какие данные можно использовать вместо транзакционных?

— Сейчас мы можем провести скоринг любого контента — письма или баннера, и определить по тому, кто кликнул, его психотип. И если даже у клиента нет исторических данных по email-кампаниям или баннерам, то мы создаем свои. Грубо говоря, берется баннер и делается две версии, для интровертов и экстравертов. И показываются эти баннеры — один день вы видите один баннер, второй день — второй баннер. В зависимости от того, на какой из двух баннеров кликает пользователь, мы можем определить его психотип.

Этическая грань автоматического профилирования

— Какие теории используете для определения психотипов?

— В психологии (если мы говорим о психотипировании) сегодня используется один фреймворк. Это Big Five, его еще называют OCEAN. Если я как ученый исследую человека, то даю ему опросник Big Five. Самая новая версия этого опросника сделана учеными из США и переведена уже на 15–20 разных языков. Он используется практически везде. В нем от 20 до 150 вопросов, стандартный вариант — 60 вопросов. Пройти его можно приблизительно за десять минут. По результатам вы получаете психотип, вектор из пяти чисел. То есть вы, я — это набор из пяти чисел. Открытость, экстраверсия/интроверсия, доброжелательность, добросовестность, нейротизм. И по каждому параметру вы можете быть от 1 до 100. Вы можете быть полностью интровертом или экстравертом. Или где-то посередине. В большинстве случаев человек находится посередине по трем-четырем категориям, но одна категория, как правило, очень сильно выражена.

— Как используете данные вместо опросников?

— До 2013 года практически единственным способом получить психотип человека оставались опросники. Но за 5 лет появились новые методы — первым было использование социальных сетей. Исследователь Михал Косинский попросил людей в Facebook заполнить анкету из 50 вопросов и поделиться своим профайлом. И люди это сделали. Он собрал достаточно большой набор данных — наверное, уже больше миллиона людей. За счет этого он сделал вывод: с определенной погрешностью можно определить психотип человека, используя лайки. И с этого времени началось психотипирование с использованием big data.

Мы используем транзакционные данные — то есть смотрим, как человек тратит деньги, где, сколько он тратит, как часто. Некоторые из этих людей заполнили анкеты — и мы сопоставляем это с их данными. Так мы можем профилировать любого клиента банка.

— Вы говорите про обозначение человека в качестве кода, что звучит довольно пугающе. Но в психологии это используется довольно давно. Что об этом думаете: насколько приписывание человеку кода этично, нормально, полезно?

— Мы сейчас переживаем из-за многих вещей, связанных с big data. Например, оценка кредитоспособности в банке. Но если разобраться, модель кредитного скоринга существует 50–60 лет и используется по всему миру. И там тоже используют личные данные, и это считается нормальным. А сейчас, когда начинают использовать Facebook или что-то другое, вдруг становится страшно. Или даже те же модели, но уже более точные.

Если мы скажем, что психология началась с Вундта, то психотипирование пошло сначала с Фрейда, а потом с Юнга. Слова «интроверт» и «экстраверт» появились именно из его работ. Поэтому это уже давно делается. А Косинский, Cambridge Analytica и все остальные построили эти дата-сеты, потому что люди любят заполнять анкеты и узнавать про себя какую-то информацию. И это нормально. То есть с точки зрения «объяснить человека», кто он и что он, — мы это давно делаем, и тут проблем нет.

Но когда дело доходит до автоматического профилирования, здесь начинается некая этическая грань. Потому что в некоторых случаях человек может этого не знать. И это неправильно. Сейчас в Европе — с введением GDPR и всем остальным — клиент должен знать, что происходит с его данными. То есть не просто где бизнес хранит ваши данные, а что именно с ними происходит. И более того, вы должны дать согласие на то, что это будет происходить. Когда мы создаем аналитику, то предупреждаем — в случае необходимости бизнес должен показать клиенту все данные. И в зависимости от того, будет ли клиенту или бизнесу от этого комфортно, мы либо делаем свою работу, либо нет.

«Раньше данные выбрасывали, а теперь это — ценность»

— Но вы начинали до введения GDPR. Что-то изменилось в работе с введением стандарта?

— Лично в нашей — ничего, потому что мы делаем всю работу, связанную с профайлингом клиентов банка на месте, без привлечения посторонних данных. GDPR — очень интересная штука, потому что с точки зрения сбора и хранения данных в регламенте нет ничего нового. Это существовало уже 10–20 лет назад. Просто сейчас это как-то выплеснулось. Плюс увеличились штрафы и за счет этого появился ажиотаж. И 20 лет назад банки обязаны были своих клиентов предупредить об использовании данных. Многие банки — почти все банки в Европе — имели огромные файлы в 20–30 страниц, которые клиент читал и подписывал.

— Только никто это никогда не читает.

— Да, я тоже никогда не читаю пользовательское соглашение iTunes и кликаю «Да». Это проблема нашего общества, что эти Terms & Conditions нам недоступны. Их очень тяжело сделать доступными, даже если бы это кто-то хотел сделать.

Я не люблю аргумент «Ты сказал „да“, подписал, значит все». Но я обычно читаю контракты. Даже когда прихожу в гостиницу и там дают бумажку подписать. Я сижу и читаю ее. Потому что были прецеденты в моей жизни, когда это действительно сыграло свою роль. Не все это делают, но я бы советовал это делать, особенно когда вы, например, идете в банк открывать счет. Потому что там действительно расписано, что будет происходить с вашими данными.

Но банкам очень тяжело объяснить каждый вариант использования данных подробно, чтобы это не заняло 100–200 страниц. Объяснять клиенту, что эту цифру мы используем в этой модели, эту — в той, тоже нереально. Должен быть какой-то баланс.

— Как вы относитесь к предоставлению своих данных корпорациям? Некоторые категорически против, другие говорят, что их жизнь становится от этого только удобнее.

— Здесь можно философствовать часами. Вот на конференции «Big Data, Meet Big Brother!» правильно сказали, что очень мало людей готовы платить за почту даже $10 в месяц, чтобы какой-то провайдер ничего про них не знал, а просто предоставлял e-mail. Людям нравится Gmail, людям нравится Facebook, это бесплатно, они проводят там много времени. Поэтому, как говорили раньше, «если продукт бесплатный, значит продукт — это вы». Это одна сторона. Вторая — что такое предоставление данных и насколько вы действительно предоставляете данные. Когда вы заполняете свою анкету и говорите имя, фамилию, адрес, номер телефона, это должно быть сохранно. И оно им и является: мало компаний будут так просто продавать ваши имя, фамилию и адрес. Этого практически не происходит. Остаются данные, которые вы генерируете. Тут уже возникает вопрос: мы генерируем очень много данных, но кому они принадлежат?

Мы работали с компанией в Португалии, которая занимается процессингом всех транзакций в стране. То есть они делают так, чтобы банки могли между собой общаться. И 30 лет назад никто не хотел у себя хранить эти данные. Это дорого и неинтересно, это проблемы. И в контракте они пытались всячески отказаться от данных. 30 лет спустя процессинг осуществляется по Apple Pay, Visa, Mastercard, и сама компания уже практически не нужна. А данные, генерируемые этой системой, вдруг оказались самыми ценными. И они теперь пытаются понять, как же вернуть то, что они 30 лет назад хотели выкинуть. И кому это вообще принадлежит — банку, клиенту?

Совершенно непонятно, кому принадлежат данные, которые мы генерируем, и кому они должны принадлежать. Мир не строился на том, что это важно. Наоборот, раньше все выбрасывалось как можно быстрее. По закону мы должны хранить все 90 дней — на 91-й это все удаляем. А теперь храним данные десять лет, потому что это ценно.

Очень тяжело сказать, кому принадлежат данные, которые вы генерируете. То, что в отправленном вами сообщении, — это ваше. Я не уверен, что все генерируемые данные принадлежат человеку, который их генерирует, или даже системе, их сохраняющей. Этот вопрос, наверное, самый интересный.

«Тест, который невозможно сделать в лаборатории»

— Про ценность данных: люди недавно поняли, какая у них цена на самом деле. Вы думаете, это эпоха, которая пройдет, или данные скоро станут нашей новой валютой?

— Заменит ли big data что-то еще? Я не знаю. Мне кажется, это останется и войдет в норму. Мы будем понимать, что у меня есть машина, дом и сейф с моими данными. Или есть данные, которые мои, и я могу их продавать — точно так же, как машину.

С другой стороны, кому это интересно, нужно, зачем кто-то будет покупать ваши данные? Есть ли действительно ценность тому, что я делал вчера? Если мы не найдем этой ценности и поймем, что есть другие способы анализировать человека и предлагать ему продукт, — тогда это все уйдет. Сейчас весь мир пытается понять, как использовать данные и какая у них ценность.

— Вы сейчас используете психологические модели, которые создавались еще до эпохи данных. Доступ к данным как-то изменит количество психотипов, психологию как науку?

— Если брать просто дата-сеты, machine learning, то психология вообще не нужна. Что дает big data психологии? Это подтверждение или опровержение теорий, возможность экспериментировать на большем количестве людей. Если в университете проводить какой-то эксперимент, получим 50 человек, которые придут. А если мы можем профилировать базу данных, допустим, Сбербанка, — это 80 млн клиентов. Это тест, который невозможно сделать в лаборатории.

Мы сотрудничаем с профессором из Колумбийского университета Сандрой Мэтц и обсуждаем с ней вещи на грани психологической фантастики. То, что мы можем сделать, работая с клиентом, она никогда сделать не сможет. 300 или 500 тыс. человек — таких масштабов просто нет в психологии как науке. Но полученные данные приведут к очень интересным прорывам в самой психологии. Если вы меня спросите, останутся ли интроверты и экстраверты как категория через 100 лет, — да, потому что это полезная категоризация человека, и она позволяет понять что-то большее, чем данные.

— Как вы думаете, на что еще смогут влиять психологические профили в будущем? Будут ли у людей с разными психотипами разные возможности? Могут ли быть психологические рейтинги?

— Это связано с вопросом, можно ли изменить психотип человека. Например, вы родились интровертом, а через 50 лет интровертам вдруг запретят пользоваться скоростными поездами. Так сложилось: не нужно им это делать, или они себя плохо ведут, когда садятся в скоростные поезда. У меня ребенок родился интровертом, можно ли из него сделать экстраверта? Это большие дебаты, которые происходят в психологии на протяжении всей истории науки. Nature vs nurture (биогенетизм против социогенетизма — «Хайтек»).

Социогенетизм или биогенетизм — это продолжительные дебаты между сторонниками роли воспитания и природных факторов при формировании личности человека. Дискуссии продолжались вплоть до конца 1970-х годов, но с появлением новых методик в психогенетике многие из гипотез просто отпали, а разногласия между сторонниками социо- и биогенетизма перешли из острой конфронтации в мягкую полемики.

Сторонники социогенетизма убеждены: большинство способностей и личностных характеристик человека не являются врожденными. Они формируются под воздействием окружения. В противоположность социогенетизму сторонники биогенетизма сводят черты характера человека к его врожденным особенностям.

Сегодня иногда считают, что ДНК влияет на психологию, а иногда еще и воспитание. В соотношении примерно 50/50 — 50% в вас заложено природой, 50% — окружающей средой. Допустим, в будущем кредитование полностью привязано к психотипу человека. Тогда получается, что вы начинаете пенализировать человека за то, кем он родился. Не первый раз в нашей истории. И тут начинаются вещи, которые человек не в силах изменить. Поэтому я бы к этому очень осторожно относился, я бы этого не делал.

— В дебатах nature vs nurture спорят об изначальном формировании человека. Может ли человек меняться дальше?

— С одной стороны, считается, что после 25 лет ваша личность сформирована и стабильна. Если бы она была нестабильной, система бы не работала. Если сегодня вы интроверт, а завтра экстраверт, — значит опросник плохой. Поэтому с точки зрения психологии мы хотим, чтобы личность была стабильной. Что мы видим — это то, что в течение жизни человека у людей есть тенденция становиться более консервативными и более интровертными. Если взять отрывок в 40 лет — так и происходит, но медленно. На пятилетних отрезках все более стабильно, а на протяжении 40 лет это видно.

Может ли человек измениться? Я считаю, что да. Я менялся несколько раз в жизни — и после 25 лет, создание компании на меня сильно повлияло. Но интроверт или экстраверт — я все-таки остался таким же. Я все равно люблю общаться с людьми, заниматься какими-то публичными делами, и я это любил до компании и буду любить после нее. Наше поведение, реакции могут меняться, но то, кто вы есть, — остается, это что-то более глубокое. Если вы экстраверт, вы будете им, даже если сидите дома и играете в видеоигры, как последний интроверт.

Люди могут идти против себя, идти против своей природы, заниматься вещами, которые им неестественны, по совершенно разным причинам. Не потому, что они — экстраверт или интроверт, а потому что так сложились жизнь и обстоятельства. Поэтому психотип — это только часть человека.

Вам также может понравиться