9 января 2018 3150
Мы живем в эпоху ускоряющегося технического прогресса. Высокие технологии и “большие данные” всё больше влияют на нашу повседневную жизнь. Но всегда ли это влияние положительное? Делают ли новые технические возможности наш мир лучше, комфортнее, справедливее, наконец, или же бывает и наоборот? Над такими вопросами заставляет задуматься книга Кэти О’Нил.

Мы живем в эпоху ускоряющегося технического прогресса. Высокие технологии и “большие данные” всё больше влияют на нашу повседневную жизнь. Но всегда ли это влияние положительное? Делают ли новые технические возможности наш мир лучше, комфортнее, справедливее, наконец, или же бывает и наоборот? Над такими вопросами заставляет задуматься книга Кэти О’Нил "Weapons of Math Destruction: How Big Data Increases Inequality and Threatens Democracy".

28186015.jpg

Сама она – математик и специалист в области анализа финансовых рынков. Собственный опыт, наблюдения и исследования привели ее к мысли о том, что в некоторых случаях алгоритмы, основанные на “больших данных” и машинном обучении, усугубляют неравенство и даже угрожают демократии.

Почему и как это происходит?

Всё чаще важные решения, влияющие на жизнь людей, принимают не люди, а машины. Поступит ли абитуриент в колледж, позовут ли на собеседование того или иного кандидата, кого уволить при сокращении штатов, выдавать или не выдавать кредит, во сколько обойдется медицинская страховка - зачастую эти решения принимаются на основе математических моделей.

Однако любая модель по определению представляет собой некое упрощение. Что включить в модель, а что выкинуть как несущественное - зависит от тех, кто эту модель создает. Как говорит Кэти О’Нил, “модели – это мнения, воплощенные в математике”. И не все модели одинаково хороши.

Одна из существенных проблем, на которые указывает О’Нил, – использование замещающих переменных (proxy variables). Нередко нет возможности получить данные о неком желаемом свойстве, и в таком случае используются переменные, значение которых коррелирует с этой неизвестной переменной.

Скажем, работодатели, подыскивая сотрудника, хотят знать, насколько добросовестен, ответственен и порядочен тот или иной кандидат. Действительно затруднительно измерить эти важные человеческие качества… Многие американские компании используют в качестве замещающей переменной кредитный рейтинг – число, характеризующее вероятность возврата долга заемщиком. Хорошая кредитная история становится необходимой, чтобы получить приличную работу. Казалось бы, в этом есть здравый смысл: добросовестный человек, скорее всего, будет вовремя платить по счетам и выполнять свои финансовые обязательства. Однако не так уж всё однозначно. Вполне порядочный человек может запросто попасть в долговую яму и даже обанкротиться. Например, потеряв работу (а это может произойти по не зависящим от человека причинам, особенно в период финансового кризиса), средний американец теряет одновременно и медицинскую страховку. Травма или внезапная болезнь способны разорить человека, и большинство банкротств частных лиц в США связаны именно с медицинскими расходами.

В каком-то смысле такая модель работает как “самоисполняющееся пророчество” – кредитная история испорчена, человеку трудно найти работу, в результате долги растут, и трудоустроиться становится всё сложнее. У вполне добропорядочного гражданина затягивается на шее удавка.

Более того, замещающие переменные используются даже в тех случаях, когда есть гораздо более достоверные данные. Например, в штате Флорида сумма автостраховки зависит от кредитной истории даже в большей степени, чем от истории вождения: водитель без единого нарушения, но с низким кредитным рейтингом заплатит за автостраховку на $1552 больше, чем водитель с отличным кредитным рейтингом и случаем пьяного вождения в “анамнезе”. Более надежный показатель попросту игнорируется. Есть ли в этом справедливость и здравый смысл? Вопрос риторический…

Еще один пример, который приводит О’Нил в своей книге – система оценки учителей, которая широко применяется во многих школах. Учителей оценивали в зависимости от того, насколько улучшились за предыдущий год знания их учеников. Тех, кого оценили недостаточно высоко, попросту увольняли. Прогресс учеников замеряли по результатам тестов в конце учебного года.

На первый взгляд этот подход может показаться осмысленным. Но если задуматься серьезнее, то становится очевидным, что успеваемость учеников зависит далеко не только от профессиональных и личных качеств учителя, и отделить вклад учителя от других факторов – нетривиальная задача. С точки зрения статистики, выборка смехотворна мала: учителей оценивали на основе результатов тестов 25-30 учеников. Это ничтожное число. Чтобы проанализировать и сравнить успешность учителей статистически достоверно, нужно было бы проверить их на тысячах, если не на миллионах случайно отобранных учеников, по словам Кэти О’Нил. Разумеется, сделать это попросту невозможно. Сама по себе выбранная модель более чем сомнительна. Тем не менее на основе оценок, выданных этой системой, увольняли реальных людей, вполне возможно, далеко не плохих учителей.

Еще один побочный эффект – входные данные могут быть фальсифицированы, и у оцениваемых людей есть серьезная мотивация это делать. Собственно, именно это и произошло – были вскрыты факты подделки результатов ежегодных тестов во многих американских школах. Таким образом учителя пытались защитить себя от увольнения или даже заработать премию.

Также О’Нил затрагивает такую тему, как таргетированная реклама. На первый взгляд, довольно безобидная штука. Ну что ужасного в том, что нам предлагают купить именно то, что мы недавно гуглили? Однако наряду со вполне легитимными и приемлемыми примерами использования, существуют и злоупотребления, граничащие с мошенничеством. Например, организаторы рекламных кампаний специально отслеживают бедные и уязвимые группы населения, чтобы подсунуть им краткосрочные кредиты с завышенными процентными ставками (при том что они могли бы на самом деле получить гораздо более выгодный кредит).

Еще более опасным О’Нил представляется использование таргетированных объявлений для политической агитации. Прошли те времена, когда кандидаты в президенты должны были обращаться ко всему американскому народу с единой программой. Современные технологии позволяют доставить каждому гражданину персонализированное послание и пообещать именно то, что, скорее всего, понравится ему или ей. Один месседж – для озабоченных экологией, другой – для обеспокоенных наплывом мигрантов, молодым выпускникам колледжей можно пообещать совсем не то, что пожилым фермерам… А полной картины нет ни у кого. И даже если вы зайдете на официальный сайт кандидата, совершенно не факт, что вы увидите там ровно то же, что увидит ваша соседка. В сущности, неограниченный простор для манипуляций электоратом.

В последней главе О’Нил останавливается на том, какие огромные возможности для воздействия на общественное сознание имеют интернет-гиганты Facebook и Google. Что увидят пользователи в своей ленте или в результатах поиска – в их руках. Что если они захотят в своих интересах повлиять на выборы? О’Нил не обвиняет их ни в чем, по ее словам, никаких доказательств, никаких причин считать, что они уже делали нечто подобное, нет. Но такая возможность, по ее мнению, у них есть. И, пожалуй, трудно с ней не согласиться.

Обзор не претендует на полноту, в книге приведено намного больше реальных кейсов. Советую читать целиком :)

Последние статьи в блоге

Платформа сертификации IBS признана лучшим digital-решением для корпоративного обучения

Центр сертификации IBS стал обладателем Гран-при премии «Смарт пирамида» — одной из самых престижных российских премий за достижения в области обучения и развития человеческого капитала.

20 декабря 2024

Учебный центр IBS получил сертификат ГОСТ Р ИСО 9001-2015

В октябре 2024 года Учебный центр IBS получил сертификат соответствия ГОСТ Р ИСО 9001-2015. Это важное достижение подтверждает, что мы придерживаемся высоких стандартов качества и результативно управляем образовательными процессами организации.

19 декабря 2024

9 курсов со скидкой до 50%

Друзья, в январе стартует 9 курсов, обучение на которых можно купить со скидкой до 50%*! 

15 декабря 2024

8 заблуждений про тестирование

Тестирование программного обеспечения окружено множеством заблуждений. Эти стереотипы нередко приводят к недопониманию его реальной роли и важности для успешного создания продуктов. Рассмотрим восемь самых распространенных мифов о тестировании и объясним, почему они не соответствуют действительности.

15 декабря 2024

Путь к Fullstack-тестировщику: что нужно знать о ручном и автоматизированном тестировании?

Тестирование программного обеспечения — одна из самых востребованных областей в IT. И часто новички и даже опытные специалисты, желающие строить свою карьеру в этом направлении, часто сталкиваются с вопросом: какое тестирование выбрать — ручное, автоматизированное или Fullstack? У каждого из этих направлений свои особенности, преимущества и требования к знаниям. В этой статье рассмотрим каждое из направлений, их плюсы и минусы, области применения и навыки, необходимые для успеха.

15 декабря 2024

Совет по развитию сертификации ИТ-специалистов при АПКИТ аккредитовал «Платформу сертификации IBS»

Директор департамента обучения и развития IBS Владимир Гернер участвовал в заседании Совета по сертификации ИТ-специалистов при АПКИТ.

Новости Жизнь компании
08 октября 2024

Java-сертификация: IBS в сравнении с Oracle

Игорь Судакевич рассказывает, почему сертификаты могут стать важным инструментом для достижения карьерных целей.

Новости
04 октября 2024

Исследование IBS: число новых ИТ-решений в реестре ПО выросло в 2023 году более чем на треть

Анализируем ситуацию на рынке российского ПО.

Жизнь компании
01 октября 2024

6 суперспособностей Fullstack-тестировщиков, которые напоминают навыки животных

Читайте о скиллах, которые делают тестировщиков востребованными на рынке труда.

27 сентября 2024

5 мифов о системных аналитиках

Вместе с Екатериной Тихомировой, специалистом по системному и бизнес-анализу, разбираемся, чем занимаются системные аналитики.

20 сентября 2024

Методология 12 факторов: как успешно разрабатывать облачные приложения

Андрей Бирюков рассказывает о методологии, которая помогает разрабатывать качественные, устойчивые и эффективные веб-приложения.

12 сентября 2024

Баги, которые стали фичами

Многие вещи, которые мы используем ежедневно, были случайно открыты. В честь дня тестировщика рассказываем про 5 багов, которые стали фичами.

09 сентября 2024

Шаблоны облачного проектирования

Читайте про наиболее популярные шаблоны облачного проектирования: шаблон Bulkhead и шаблон Sidecar.

06 сентября 2024

Бесплатные мини-курсы ко Дню знаний

Друзья, поздравляем с Днём знаний! Желаем любопытства, открытий и новых побед!

02 сентября 2024

5 курсов со скидкой 30%

Друзья, в сентябре стартует 5 курсов со скидкой 30%*

29 августа 2024

Исследование IBS: на одну вакансию в Java-разработке приходится 4 резюме

По данным исследования рекрутингового центра IBS, наибольшая конкуренция среди соискателей наблюдается среди Python-разработчиков: на одну вакансию приходится 10 резюме. В менее конкурентной среде находятся Java-разработчики (4 резюме на одну вакансию). Самыми дефицитными являются специалисты по языку Go: менее 2 резюме на одну вакансию.

28 августа 2024

Индексирование баз данных в PostgreSQL: погружение в тему

В продолжение серии статей об устройстве системы управления базами данных (СУБД) PostgreSQL (раз, два) смотрим, как ускорить выполнение запросов к базе данных с помощью индексов.

28 августа 2024

Книги для системных и бизнес-аналитиков, а также будущих и нынешних архитекторов

Наш коллега, архитектор информационных систем Сергей Политыко, поделился полезными книжными рекомендациями.

Жизнь компании
19 августа 2024

Сценарии кибератак с использованием ИИ. Внутренний периметр.

Кибератаки, направленные на внутренние периметры организаций, становится особенно актуальной темой. Внутренние атаки могут происходить как от злоумышленников с доступом к ресурсам, так и извне, используя уязвимости внутренней инфраструктуры. Использование ИИ в таких атаках позволяет автоматизировать и улучшить процесс поиска уязвимостей, создать вредоносный код и разработать методы социальной инженерии, что увеличивает скорость и масштаб атак. Расскажем про сценарии таких атак подробнее.

16 августа 2024

Сценарии кибератак с использованием ИИ. Внешний периметр

Сценарии кибератак по внешнему периметру представляют собой модели и методы, которые злоумышленники используют для незаконного доступа к информационным системам и данным компаний через их внешние интерфейсы и сети. Это как если бы ваша компания была неприступной крепостью, а за ее воротами стояла бы армия хорошо обученных солдат-магов, которые способны разрушить крепость по щелчку пальцев. Вы уверены, что ваши высокие стены и глубокие рвы вас спасут от подобной армии?

09 августа 2024

Не нашли, что искали? — Просто напишите, и мы поможем

Продолжая, я подтверждаю, что ознакомлен с Условиями использования и Порядком обработки персональных данных
Корпоративное обучение Оценка персонала Сертификация О нас Стань тренером Блог
Пользователь только что записался на курс ""
Спасибо!
Форма отправлена успешно.