+38/050/370-3627
+38/093/220-0872
+38/044/257-2444
Новости

Google опубликовала исходные тексты библиотеки Differential Privacy

Google опубликовала исходные тексты библиотеки Differential Privacy

Google опубликовала исходные тексты библиотеки "Differential Privacy" с реализацией методов дифференциальной приватности, позволяющих с достаточно высокой точностью выполнять статистические операции над набором данных без возможности идентификации отдельных записей в нём. Код библиотеки написан на языке C++ и открыт под лицензией Apache 2.0.

Анализ с использованием методов дифференциальной приватности даёт возможность организациям производить аналитические выборки из статистических БД, не позволяя разделить данные и выделить из общей информации параметры конкретных лиц. Например, для выявления различий в уходе за больными, исследователям можно предоставить информацию, позволяющую сравнить среднее количество времени пребывания пациентов в больницах, но при этом сохраняющую конфиденциальность пациентов и не допускающую выделения сведений о них.

Предложенная библиотека включает реализацию нескольких алгоритмов для формирования агрегированной статистики на основе наборов числовых данных, включающих конфиденциальные сведения. Для проверки корректности работы алгоритмов предоставляется стохастический пробник. Алгоритмы позволяют выполнять над данными операции суммирования, подсчёта, вычисления средних значений, среднеквадратического отклонения, дисперсии и порядковой статистики, включая определение минимума, максимума и медианы. В состав также входит реализация механизма Лапласа, который может использоваться для вычислений, не охватываемых предопределёнными алгоритмами.

Библиотека использует модульную архитектуру, позволяющую расширять имеющуюся функциональность и добавлять дополнительные механизмы, агрегатные функции и средства управления уровнем конфиденциальности. На базе библиотеки для СУБД PostgreSQL 11 подготовлено расширение с набором анонимных агрегатных функций, использующих методы дифференциальной приватности - ANON_COUNT, ANON_SUM, ANON_AVG, ANON_VAR, ANON_STDDEV и ANON_NTILE.

Другие новости