Категории
Интересное
Вопросы конфиденциальности
Потенциально технология извлечения данных позволяет собрать массу полезной и нужной информации практически в любой области. В тоже время она чревата угрозой нарушения конфиденциальности. Рассмотрим извлечение данных в контексте этой книги: вы ищете характерные структуры в тех данных, которые собираете из мнений и запросов своих заказчиков, а также потоков щелчков (определяющих закономерности поведения заказчиков).
Сбор информации о пользователях нередко создает опасность нарушения конфиденциальности заказчиков. Откуда вы можете знать, беспокоит или нет заказчиков факт сбора информации из их потоков щелчков? Тревожит ли их, что вы наблюдаете за тем, на какое рекламное объявление они обратили внимание и на каких страницах задерживались? Извлекая данные, вы нарушаете их конфиденциальность еще сильнее. Отыскивая характерные структуры на основе анализа поведения заказчиков, вы обобщаете все данные о них с целью более полного удовлетворения их же нужд.
К счастью для тех заказчиков, данные о которых вносят вклад в результаты поиска характерных структур, извлечение данных фактически усиливает защиту конфиденциальности существующих данных. Почему? Потому что результаты извлечения данных представляют собой ряд обобщений обо всех ваших заказчиках. Например, результаты гласят, что большинство покупателей составляют мужчины возрастом 25 — 34 года, а среди женщин наибольшим спросом пользуются товары синего цвета. Мужчины возрастом 18 - 24 года реже изучают технические статьи по использованию товаров, чем посетители групп новостей по техническим вопросам. Хотя потенциально сбор статистических данных для формирования этих обобщений и нарушает личную конфиденциальность, конечные результаты измерений не позволяют проследить ни одного человека. Конечно, этот аргумент не принимает во внимание постоянство, устойчивость данных, которые привели к обобщениям.