Категории

Интересное

 

 

Вопросы конфиденциальности

Потенциально технология извлечения данных позволяет собрать массу полезной и нуж­ной информации практически в любой области. В тоже время она чревата угрозой нару­шения конфиденциальности. Рассмотрим извлечение данных в контексте этой книги: вы ищете характерные структуры в тех данных, которые собираете из мнений и запросов своих заказчиков, а также потоков щелчков (определяющих закономерности поведения заказчиков).
Сбор информации о пользователях нередко создает опасность нарушения конфиденци­альности заказчиков. Откуда вы можете знать, беспокоит или нет заказчиков факт сбора информации из их потоков щелчков? Тревожит ли их, что вы наблюдаете за тем, на ка­кое рекламное объявление они обратили внимание и на каких страницах задерживались? Извлекая данные, вы нарушаете их конфиденциальность еще сильнее. Отыскивая харак­терные структуры на основе анализа поведения заказчиков, вы обобщаете все данные о них с целью более полного удовлетворения их же нужд.
К счастью для тех заказчиков, данные о которых вносят вклад в результаты поиска ха­рактерных структур, извлечение данных фактически усиливает защиту конфиденциаль­ности существующих данных. Почему? Потому что результаты извлечения данных представляют собой ряд обобщений обо всех ваших заказчиках. Например, результаты гласят, что большинство покупателей составляют мужчины возрастом 25 — 34 года, а среди женщин наибольшим спросом пользуются товары синего цвета. Мужчины возрас­том 18 - 24 года реже изучают технические статьи по использованию товаров, чем посе­тители групп новостей по техническим вопросам. Хотя потенциально сбор статистиче­ских данных для формирования этих обобщений и нарушает личную конфиденциаль­ность, конечные результаты измерений не позволяют проследить ни одного человека. Конечно, этот аргумент не принимает во внимание постоянство, устойчивость данных, которые привели к обобщениям.

Кроме того, озабоченность вызывают несколько случаев «увода» информации