Оружие математического поражения

9 января 2018 3287

Мы живем в эпоху ускоряющегося технического прогресса. Высокие технологии и “большие данные” всё больше влияют на нашу повседневную жизнь. Но всегда ли это влияние положительное? Делают ли новые технические возможности наш мир лучше, комфортнее, справедливее, наконец, или же бывает и наоборот? Над такими вопросами заставляет задуматься книга Кэти О’Нил.

Сама она – математик и специалист в области анализа финансовых рынков. Собственный опыт, наблюдения и исследования привели ее к мысли о том, что в некоторых случаях алгоритмы, основанные на “больших данных” и машинном обучении, усугубляют неравенство и даже угрожают демократии.

Почему и как это происходит?

Всё чаще важные решения, влияющие на жизнь людей, принимают не люди, а машины. Поступит ли абитуриент в колледж, позовут ли на собеседование того или иного кандидата, кого уволить при сокращении штатов, выдавать или не выдавать кредит, во сколько обойдется медицинская страховка - зачастую эти решения принимаются на основе математических моделей.

Однако любая модель по определению представляет собой некое упрощение. Что включить в модель, а что выкинуть как несущественное - зависит от тех, кто эту модель создает. Как говорит Кэти О’Нил, “модели – это мнения, воплощенные в математике”. И не все модели одинаково хороши.

Одна из существенных проблем, на которые указывает О’Нил, – использование замещающих переменных (proxy variables). Нередко нет возможности получить данные о неком желаемом свойстве, и в таком случае используются переменные, значение которых коррелирует с этой неизвестной переменной.

Скажем, работодатели, подыскивая сотрудника, хотят знать, насколько добросовестен, ответственен и порядочен тот или иной кандидат. Действительно затруднительно измерить эти важные человеческие качества… Многие американские компании используют в качестве замещающей переменной кредитный рейтинг – число, характеризующее вероятность возврата долга заемщиком. Хорошая кредитная история становится необходимой, чтобы получить приличную работу. Казалось бы, в этом есть здравый смысл: добросовестный человек, скорее всего, будет вовремя платить по счетам и выполнять свои финансовые обязательства. Однако не так уж всё однозначно. Вполне порядочный человек может запросто попасть в долговую яму и даже обанкротиться. Например, потеряв работу (а это может произойти по не зависящим от человека причинам, особенно в период финансового кризиса), средний американец теряет одновременно и медицинскую страховку. Травма или внезапная болезнь способны разорить человека, и большинство банкротств частных лиц в США связаны именно с медицинскими расходами.

В каком-то смысле такая модель работает как “самоисполняющееся пророчество” – кредитная история испорчена, человеку трудно найти работу, в результате долги растут, и трудоустроиться становится всё сложнее. У вполне добропорядочного гражданина затягивается на шее удавка.

Более того, замещающие переменные используются даже в тех случаях, когда есть гораздо более достоверные данные. Например, в штате Флорида сумма автостраховки зависит от кредитной истории даже в большей степени, чем от истории вождения: водитель без единого нарушения, но с низким кредитным рейтингом заплатит за автостраховку на $1552 больше, чем водитель с отличным кредитным рейтингом и случаем пьяного вождения в “анамнезе”. Более надежный показатель попросту игнорируется. Есть ли в этом справедливость и здравый смысл? Вопрос риторический…

Еще один пример, который приводит О’Нил в своей книге – система оценки учителей, которая широко применяется во многих школах. Учителей оценивали в зависимости от того, насколько улучшились за предыдущий год знания их учеников. Тех, кого оценили недостаточно высоко, попросту увольняли. Прогресс учеников замеряли по результатам тестов в конце учебного года.

На первый взгляд этот подход может показаться осмысленным. Но если задуматься серьезнее, то становится очевидным, что успеваемость учеников зависит далеко не только от профессиональных и личных качеств учителя, и отделить вклад учителя от других факторов – нетривиальная задача. С точки зрения статистики, выборка смехотворна мала: учителей оценивали на основе результатов тестов 25-30 учеников. Это ничтожное число. Чтобы проанализировать и сравнить успешность учителей статистически достоверно, нужно было бы проверить их на тысячах, если не на миллионах случайно отобранных учеников, по словам Кэти О’Нил. Разумеется, сделать это попросту невозможно. Сама по себе выбранная модель более чем сомнительна. Тем не менее на основе оценок, выданных этой системой, увольняли реальных людей, вполне возможно, далеко не плохих учителей.

Еще один побочный эффект – входные данные могут быть фальсифицированы, и у оцениваемых людей есть серьезная мотивация это делать. Собственно, именно это и произошло – были вскрыты факты подделки результатов ежегодных тестов во многих американских школах. Таким образом учителя пытались защитить себя от увольнения или даже заработать премию.

Также О’Нил затрагивает такую тему, как таргетированная реклама. На первый взгляд, довольно безобидная штука. Ну что ужасного в том, что нам предлагают купить именно то, что мы недавно гуглили? Однако наряду со вполне легитимными и приемлемыми примерами использования, существуют и злоупотребления, граничащие с мошенничеством. Например, организаторы рекламных кампаний специально отслеживают бедные и уязвимые группы населения, чтобы подсунуть им краткосрочные кредиты с завышенными процентными ставками (при том что они могли бы на самом деле получить гораздо более выгодный кредит).

Еще более опасным О’Нил представляется использование таргетированных объявлений для политической агитации. Прошли те времена, когда кандидаты в президенты должны были обращаться ко всему американскому народу с единой программой. Современные технологии позволяют доставить каждому гражданину персонализированное послание и пообещать именно то, что, скорее всего, понравится ему или ей. Один месседж – для озабоченных экологией, другой – для обеспокоенных наплывом мигрантов, молодым выпускникам колледжей можно пообещать совсем не то, что пожилым фермерам… А полной картины нет ни у кого. И даже если вы зайдете на официальный сайт кандидата, совершенно не факт, что вы увидите там ровно то же, что увидит ваша соседка. В сущности, неограниченный простор для манипуляций электоратом.

В последней главе О’Нил останавливается на том, какие огромные возможности для воздействия на общественное сознание имеют интернет-гиганты Facebook и Google. Что увидят пользователи в своей ленте или в результатах поиска – в их руках. Что если они захотят в своих интересах повлиять на выборы? О’Нил не обвиняет их ни в чем, по ее словам, никаких доказательств, никаких причин считать, что они уже делали нечто подобное, нет. Но такая возможность, по ее мнению, у них есть. И, пожалуй, трудно с ней не согласиться.

Обзор не претендует на полноту, в книге приведено намного больше реальных кейсов. Советую читать целиком :)

Последние статьи в блоге

Почему Python? Полный разбор Python vs Java в ML

«Когда 9 из 10 курсов по машинному обучению используют Python — это не случайность. Это результат десятилетия эволюции инструментов, сообщества и образовательной экосистемы».

21 июля 2025

Что должен знать и уметь архитектор ПО в 2025 году

Представьте профессию, в которой нужно одновременно мыслить как инженер, говорить как консультант и чувствовать бизнес как продакт. Архитектор ПО — это не просто старший разработчик с модным названием должности, а человек, который соединяет технологии, людей и цели в устойчивую, масштабируемую систему. Но какими навыками он должен владеть сегодня, чтобы быть действительно востребованным?

21 июля 2025

Памятка по документированию архитектурных решений

Отсутствие качественного архитектурного описания в сложных ИТ-проектах создает серьезные риски: фрагментированное понимание системы, накопление «архитектурного долга», трудности интеграции, масштабирования и онбординга. Это ведет к срывам сроков, перерасходу бюджета, снижению качества и росту затрат на поддержку, подвергая проект риску неоптимальных решений и критических уязвимостей.

Новости

18 июля 2025

Летняя акция: учитесь онлайн с выгодой, не выходя из отпуска! До конца августа второй курс со скидкой 50%

Проведите лето с пользой для карьеры – второй курс со скидкой 50%!

09 июля 2025

5 курсов июля со скидкой 30%

Друзья, у нас остались последние места на курсах, которые стартуют в июле. Сейчас есть возможность записаться на обучение со скидкой 30%!

Новости

04 июля 2025

Карьерный трек аналитика: от базы к экспертизе

Системные и бизнес-аналитики аналитики играют ключевую роль в digital-развитии продуктов. Эти специалисты выступают связующим звеном между бизнес-задачами и техническими решениями, обеспечивая эффективную коммуникацию между заинтересованными сторонами. Рассмотрим карьерные пути в аналитике, актуальные требования рынка и перспективы профессионального роста.

27 июня 2025

Почему именно сейчас стоит учиться на бизнес-аналитика уровня Middle. «Руководство BABOK» в подарок участникам программы!

Вы в ИТ, вам за 30. Вроде бы всё хорошо — есть работа, скиллы, стабильность. Но в воздухе — тревожность. Проекты замораживаются. Бизнес урезает бюджеты. От ИТ ждут не просто задач, а конкретного влияния на прибыль.

25 июня 2025

Уничтожит ли ИИ-генератор кода профессию разработчика?

С появлением ИИ-инструментов, а также в связи недавним анонсом Canva Code, который генерирует код за пару кликов, многие задумались: не станут ли такие инструмент угрозой для разработчиков? Давайте разберемся, есть ли здесь реальные риски, или это все же преувеличения.

23 июня 2025

Проектное резюме консультанта 1С: карьерный инструмент, чтобы выделиться среди других кандидатов

Рассказываем о продвинутой альтернативе привычного резюме для консультантов 1C и других специалистов с проектной занятостью.

Новости

19 июня 2025

Выбор карьеры: Менеджер бизнес-процессов или Бизнес-аналитик уровня Middle?

В мире цифровой трансформации пути развития аналитиков и менеджеров проектов все чаще расходятся: кому-то ближе работа с требованиями и API, а кому-то — выстраивание системной эффективности на уровне всей компании. Какой путь выбрать лично вам?

Новости

18 июня 2025

В Учебном центре IBS планируется запуск курсов по продуктам TData

Читайте о стратегическом соглашении TData и IBS и наших новых курсах

11 июня 2025

Компетенции бизнес-аналитиков: Junior и Middle в сравнении

В условиях динамично развивающейся ИТ-индустрии важно чётко понимать, какие навыки и знания необходимы для успешной работы на каждом этапе карьерного пути. Сегодня обсудим разницу в компетенциях ИТ бизнес-аналитиков уровней Junior и Middle. Если вы только начинаете свой путь в ИТ бизнес-анализе или, наоборот, уже обладаете некоторым опытом, этот материал поможет вам понять, какие навыки необходимы на каждом уровне и как развиваться дальше.

Новости

05 июня 2025

Лимит на сбои. Как понять, что система перегружена, а не просто плохо сделана?

Оценить производительность системы непросто, а контролировать еще сложнее. Как сделать так, чтобы внедряемая или уже эксплуатируемая система справлялась с нагрузками? Можно ли в этом вопросе полностью положиться на разработчиков ПО или вендоров? И кто в итоге будет отвечать за все простои системы? Рассказывает Николай Марченко, директор отделения нагрузочного тестирования компании IBS. Начать следует с того, что разбираться с последствиями возможных сбоев в любом случае придется тем, кто работает непосредственно с системой. Поэтому о вопросах производительности лучше задуматься еще на этапе внедрения.

Новости

03 июня 2025

Кто такой аналитик 1С?

Аналитик 1С — это специалист, который занимается оптимизацией бизнес-процессов с использованием программного обеспечения 1С. Его задача — анализировать существующие процессы, выявлять недостатки и разрабатывать решения для повышения эффективности. Аналитик переводит бизнес-требования в технические задания для разработчиков, становясь мостом между пользователями и ИТ-отделом. Эта роль требует как технических знаний, так и навыков коммуникации, что позволяет вносить значительный вклад в развитие компании и улучшение её конкурентоспособности.

Новости

28 мая 2025

Разбор задачи: UML-диаграмма классов для системы регистрации на курсы

Несколько дней назад мы предложили вам решить задачу — спроектировать диаграмму классов для системы регистрации студентов на учебные курсы в университете. Сегодня публикуем один из возможных вариантов решения. Сравните его с вашим и оцените, какие элементы вы отразили верно, а где можно усилить проработку.

22 мая 2025

Бизнес-аналитик и системный аналитик в ИТ: кто есть кто и в чем разница

Современные ИТ-проекты — будь то корпоративные решения, мобильные приложения или интеграционные платформы — требуют точного понимания как бизнес-целей, так и технических ограничений. На пересечении этих задач появляются две ключевые роли: бизнес-аналитик (БА) и системный аналитик (СА). Несмотря на схожесть направлений деятельности, эти специалисты действуют на разных уровнях и выполняют разные функции. Рассмотрим, кто они, каковы их зоны ответственности, чем они похожи, а чем принципиально отличаются.

21 мая 2025

5 распространенных ошибок в работе системных аналитиков

Ошибки системных аналитиков редко видны сразу, но последствия могут быть весьма заметными. Срыв сроков, недовольство заказчика, бесконечные правки требований, ощущение, что проект «расползается» — это часто не проблема менеджмента, а не выявленные вовремя аналитические ошибки и риски. Мы регулярно анализируем дипломные проекты выпускников курса «Системный аналитик» — не ради оценок, а чтобы понять, какие трудности реально возникают на практике, и обозначить направления для дальнейшего развития навыков. Даже у мотивированных специалистов с практическим опытом есть «слепые» зоны. Где-то не хватает чёткости в декомпозиции, где-то — качества проработки связей между сущностями, понимания архитектуры. Даже отсутствие умения аргументировать выбор решений перед бизнесом может негативно повлиять на проект. Мы вместе с Екатериной Тихомировой — практикующим аналитиком с более чем десятилетним опытом — разобрали некоторые типичные ошибки и риски, и способы, как их предотвратить.

20 мая 2025

Итоги работы Центра сертификации IBS

Центр сертификации IBS начал свою работу в апреле 2023 года, поэтому мы традиционно подводим итоги работы в апреле-мае. Прошедший год стал для нас периодом важных изменений. В 2024 году произошло несколько знаковых событий: наша команда обновила программы сертификации системных аналитиков и Java-разработчиков, подготовила к запуску сертификацию бизнес-аналитиков, получила аккредитацию от АПКИТ и стала обладателем Гран-при премии «Смарт пирамида». Рассказываем подробнее, каких результатов мы достигли в уходящем году и как это отразилось на нашей работе.

Новости

19 мая 2025

Какой метод тестирования выбрать: черный, белый или серый ящики?

При разработке программного обеспечения важно правильно подобрать методы тестирования. Это ключевой шаг для того, чтобы гарантировать высокое качество продукта. Понимание различных подходов, таких как тестирование черного, белого и серого ящика, помогает специалистам лучше находить ошибки и улучшать функциональность. Рассмотрим особенности, преимущества и варианты использования этих подходов.

14 мая 2025

Удостоверение, диплом и сертификат: в чем разница и что выбрать

В условиях стремительного развития технологий и постоянных изменений в бизнесе профессиональное развитие стало необходимостью. Особенно это актуально для специалистов в сфере IT и смежных отраслях. После прохождения курсов в учебных центрах слушатели могут получить один из трех типов документов: удостоверение о повышении квалификации, диплом о профессиональной переподготовке или сертификат. Несмотря на внешнюю схожесть, эти документы различаются по юридической силе, назначению и значимости для карьеры. Разберемся в этом подробнее.

12 мая 2025

Оружие математического поражения

Последние статьи в блоге

Почему Python? Полный разбор Python vs Java в ML

Что должен знать и уметь архитектор ПО в 2025 году

Памятка по документированию архитектурных решений

Летняя акция: учитесь онлайн с выгодой, не выходя из отпуска! До конца августа второй курс со скидкой 50%

5 курсов июля со скидкой 30%

Карьерный трек аналитика: от базы к экспертизе

Почему именно сейчас стоит учиться на бизнес-аналитика уровня Middle. «Руководство BABOK» в подарок участникам программы!

Уничтожит ли ИИ-генератор кода профессию разработчика?

Проектное резюме консультанта 1С: карьерный инструмент, чтобы выделиться среди других кандидатов

Выбор карьеры: Менеджер бизнес-процессов или Бизнес-аналитик уровня Middle?

В Учебном центре IBS планируется запуск курсов по продуктам TData

Компетенции бизнес-аналитиков: Junior и Middle в сравнении

Лимит на сбои. Как понять, что система перегружена, а не просто плохо сделана?

Кто такой аналитик 1С?

Разбор задачи: UML-диаграмма классов для системы регистрации на курсы

Бизнес-аналитик и системный аналитик в ИТ: кто есть кто и в чем разница

5 распространенных ошибок в работе системных аналитиков

Итоги работы Центра сертификации IBS

Какой метод тестирования выбрать: черный, белый или серый ящики?

Удостоверение, диплом и сертификат: в чем разница и что выбрать

Не нашли, что искали? — Просто напишите, и мы поможем