В наши дни огромные базы данных, основанные на данных пользователей, становятся незаменимыми для развития искусственного интеллекта и машинного обучения. Однако риск утечки личной информации вызывает серьёзные опасения. Команда исследователей Google, во главе с Джастином Ю Ченом и Мортезой Задимогхаддам, представила новый алгоритм, который улучшает защиту конфиденциальности пользователей благодаря «дифференциально приватному выбору партиций».
Этот процесс позволяет безопасно делиться значительными наборами данных, сохраняя при этом анонимность пользователей. Алгоритм, названный MaxAdaptiveDegree (MAD), применяет адаптивную переработку весов, чтобы обеспечить более высокий уровень защиты, не теряя при этом полезность данных. В отличие от традиционных методов, MAD эффективно обрабатывает множества данных, достигая выдающихся результатов на наборах, содержащих сотни миллиардов элементов.
Эти новшества помогут специалистам по данными эффективно работать с большими объемами информации без ущерба для конфиденциальности. Исследователи надеются, что алгоритм будет способствовать росту числа уникальных элементов в выдаче, что, в свою очередь, повысит качество аналитики и машинного обучения.
*компания Meta Platforms Inc. признана экстремистской организацией, ее деятельность на территории России запрещена
