Владельца банковской карты можно выделить из миллионного списка всего по четырём покупкам





Исследователи из MIT разоблачили несколько мифов о приватности в современном обществе. Они установили, что даже неполные данные о четырёх покупках, совершённых при помощи банковских карт, позволяют установить личность человека в 90% случаев. Необходимо знать только даты и места покупок. Эти данные сравнивались со списком транзакций за три месяца, совершённых более чем миллионом человек.

Более того, если воспользоваться грубыми данными о ценах покупок (стоимость покупки с точностью до 50%), то количество точек привязки сокращается до трёх, а точность вырастает до 94%. То есть, к примеру, вооружившись одним выброшенным вами чеком, одной фотографией вашего завтрака в кафе из Instagram и одним вашим твитом с сообщением о покупке нового гаджета, можно почти наверняка идентифицировать вас в списке транзакций среди миллиона других покупателей.

Для исследования был использован список транзакций, включающий названия и местоположение магазинов, а также дату и сумму покупки. Покупки, совершённые с одной банковской карты, были отмечены одним и тем же id. Во время работы над проектом исследователи пробовали разное количество опорных точек, от двух до пяти. Даже при использовании двух точек без информации о стоимости покупки идентификация человека становится возможной в 40% случаев. Использование пяти точек приводит к результатам, близким к 100%.

Встал вопрос — каким образом можно было бы изменить набор данных, чтобы он всё ещё представлял интерес с точки зрения экономистов и маркетологов, но при этом улучшал приватность покупателей. Для этого исследователи пробовали делать информацию менее точной, укрупнив временной промежуток покупки до недели, а место покупки обобщив до 150 магазинов на определённой территории. И всё равно по четырём опорным точкам, у которых стоимость покупки указана с точностью 50%, оказалось возможным выделить человека из общего набора транзакций с вероятностью 70%.

Современные средства обработки больших данных позволяют из такой, казалось бы, обезличенной информации, как база покупок, или база перемещений и использования мобильных телефонов, строить неожиданно точные выводы. Пожалуй, обычным гражданам опасаться таких возможностей не стоит. Но и не нужно питать иллюзий по поводу вашей анонимности, если вам по каким-то причинам это важно. Особенно, когда вы активно пользуетесь социальными сетями, мобильным телефоном и банковскими картами.

Источник: geektimes.ru/post/244422/


Комментарии