Предварительная обработка данных

Понятие БПД

Персональные данные — это любая информация, относящаяся к прямо или косвенно определенному или определяемому физическому лицу (субъекту персональных данных) (п. 1 ст. 3 Закона о персональных данных).

БПД — это персональные данные, отвечающие двум критериям (ч. 1 ст. 11 Закона о персональных данных):

  • они характеризуют физиологические и биологические особенности человека, на основании которых можно установить его личность;
  • они используются оператором данных для установления личности субъекта персональных данных.

Государственные, муниципальные учреждения признаются операторами персональных данных. (Подробнее это понятие будет рассмотрено в следующем разделе статьи.)

Какие именно персональные данные могут относиться к БПД?

Например, в п. 4 Порядка обработки биометрических персональных данных <1> к БПД отнесены изображение лица и голос.

<1> Порядок обработки, включая сбор и хранение, параметров биометрических персональных данных в целях идентификации, порядок размещения и обновления биометрических персональных данных в единой биометрической системе, а также требования к информационным технологиям и техническим средствам, предназначенным для обработки биометрических персональных данных в целях проведения идентификации, утв. Приказом Минкомсвязи РФ от 25.06.2018 N 321.

Приказ Минкомсвязи РФ N 484, Правила обработки персональных данных в Федеральном медико-биологическом агентстве <2> устанавливают, что к БПД относятся:

  • цветное цифровое фотографическое изображение лица, полученное при приеме на работу;
  • копия фотографического изображения лица, содержащаяся в паспорте;
  • собственноручная подпись.

<2> Утверждены Приказом ФМБА РФ от 24.05.2017 N 89.

Методические рекомендации по исполнению запросов социально-правового характера <3> относят к БПД сведения о физиологических особенностях человека, на основе которых можно установить его личность. Это отпечатки пальцев, цифровая фотография, форма пальцев, носа, ушей, почерк, походка, распознавание голоса, радужной оболочки глаза, анализ ДНК и др.

<3> Утверждены Росархивом.

В Разъяснениях Роскомнадзора «О вопросах отнесения фото- и видеоизображения, дактилоскопических данных и иной информации к биометрическим персональным данным и особенности их обработки» (далее — Разъяснения Роскомнадзора) к БПД отнесены физиологические данные (дактилоскопические данные, радужная оболочка глаз, анализы ДНК, рост, вес и др.) и иные физиологические или биологические характеристики человека, в том числе его изображение (фотография и видеозапись), которые позволяют установить его личность и используются оператором для установления личности субъекта.

Вопрос: В каких случаях фотография работника относится к персональным данным, но не относится к БПД?

Согласно определению БПД одним из критериев отнесения информации (например, фотографии) о сотруднике к БПД является использование ее учреждением для установления личности субъекта персональных данных. Поэтому если учреждение не использует фотографию работника для установления его личности, то фото не признается БПД.

Аналогичный подход применен в Разъяснениях Роскомнадзора

В них указано, что необходимо принимать во внимание цель, которую преследует оператор при осуществлении действий, связанных с обработкой персональных данных, содержащихся в паспорте, в том числе фотографического изображения. Если оно используется для установления личности субъекта персональных данных, это БПД

Следовательно, когда учреждение осуществляет сканирование паспорта для подтверждения определенных действий конкретного лица (например, заключения договора об оказании услуг, в том числе банковских, медицинских) без проведения процедур идентификации (установления личности), данные действия не могут считаться обработкой биометрических персональных данных и фотография в паспорте не признается БПД.

Вопрос: Относятся ли к БПД фотографии сотрудников в анкетах и делах, хранящихся в отделе кадров, а также подписи в них?

В Разъяснениях Роскомнадзора указано, что не считаются БПД фотографическое изображение, содержащееся в личном деле работника, подпись лица, наличие которой в различных договорных отношениях является обязательным требованием, и почерк, в том числе анализируемый уполномоченными органами в рамках почерковедческой экспертизы. Они не относятся к БПД, поскольку действия с использованием таких данных направлены на подтверждение их принадлежности конкретному физическому лицу, чья личность уже определена и чьи персональные данные уже имеются в распоряжении оператора.

Таким образом, указанные в вопросе персональные данные не признаются БПД.

Что это за профессия — таможенное дело

Бизнес и финансы

БанкиБогатство и благосостояниеКоррупция(Преступность)МаркетингМенеджментИнвестицииЦенные бумагиУправлениеОткрытые акционерные обществаПроектыДокументыЦенные бумаги — контрольЦенные бумаги — оценкиОблигацииДолгиВалютаНедвижимость(Аренда)ПрофессииРаботаТорговляУслугиФинансыСтрахованиеБюджетФинансовые услугиКредитыКомпанииГосударственные предприятияЭкономикаМакроэкономикаМикроэкономикаНалогиАудитМеталлургияНефтьСельское хозяйствоЭнергетикаАрхитектураИнтерьерПолы и перекрытияПроцесс строительстваСтроительные материалыТеплоизоляцияЭкстерьерОрганизация и управление производством

Ответственный за обработку персональных данных в организации

Ответственный за обработку персональных данных – это определенный сотрудник организации, на которого в официальном порядке были возложены важнейшие обязательства в отношении надлежащего сбора и хранения личных сведений.

Сразу следует отметить, что никаких особых требований к вышеуказанному лицу действующими законодательными нормами установлено не было. Это означает, что работодатель сам вправе принять решение о том, на кого именно из сотрудников будут возложены соответствующие обязательства. Как показывает современная практика, в большинстве случаев они возлагаются на сотрудников кадрового делопроизводства. Это вполне объяснимо, ведь именно работники кадровых отделов чаще всего имеют дело с личными сведениями сотрудников. Сюда можно отнести, например, информацию, которая содержится в их трудовых книжках, личных карточках учета, а также в иных материалах.

Вне зависимости от того, какой именно сотрудник был выбран работодателем в качестве ответственного за персональную обработку данных, сама процедура возложения на него соответствующих обязательств всегда должна осуществляться в официальном порядке. Для этого работодателем составляется письменное распоряжение, с помощью которого и происходит возложение всех обязательств.

К основным из них можно отнести следующие:

  1. Проведение с членами коллектива регулярных инструктажей, в которых будет содержаться информация относительно действующих законодательных правил по вопросам хранения и обработки конфиденциальных данных. Сюда также можно отнести и регулярное ознакомление служащих с любыми изменениями, которые появились по данным вопросам.
  2. Осуществление постоянного контроля над соблюдением установленных правил обработки конфиденциальной информации в конкретном учреждении. Сюда можно отнести, например, регулярные проверки сохранности носителей личных данных, заполнения всех важных документов и т.д.
  3. Организацию работы по приему официальных обращений от различных надзорных организаций, а также от граждан.
  4. Принятие активного участия в разработке и последующем утверждении различных внутренних документов компании, которые будут иметь прямое отношение к вопросу обработки конфиденциальных сведений.
  5. Оформление официальных допусков к конфиденциальной информации, содержащейся на соответствующих носителях.

История развития технологии обработки информации

История прогресса информационных технологий состоит из ряда этапов, которые связаны с революционными переменами в области переработки информации. Первый этап сопряжён с появлением письменности. В качестве средств для сбора, сохранения и переработки информации выступали перо, чернила, бумага и книги. Производительность обработки информации на данном этапе была очень низка. В шестнадцатом веке люди изобрели печатание книг, что сильно увеличило эффективность работы с информацией. В конце девятнадцатого века появились телеграф, телефон и радио, то есть возникла новая «механическая» технология, которая дала возможность быстро обмениваться информацией.

Изобретение электрических пишущих машинок, телевизионных станций, магнитофонов, копировальных аппаратов в середине двадцатого века послужило началом появления «электрических» информационных технологий.

Во второй половине двадцатого века были созданы электронные вычислительные машины, а далее и персональные компьютеры, которые ознаменовали начало «электронного» этапа в информационных технологиях.

Сфера применения закона и терминология

Учитывая, что довольно серьезные споры в части применения Федерального закона № 152-ФЗ разгорались вокруг понятия обработки данных «с использованием средств автоматизации», то в первую очередь, проводя анализ внесенных изменений, следует обратить внимание именно на расшифровку данного термина. Так, под автоматизированной обработкой ПДн понимается обработка персональных данных с помощью средств вычислительной техники (далее — СВТ), однако термин «средства вычислительной техники» не конкретизируется

В связи с этим возникает необходимость обратиться к иным источникам информации, в частности к ГОСТ 26553-85, в котором СВТ определены как совокупность элементов систем обработки данных, способных функционировать самостоятельно или в составе других систем. При этом различают СВТ, реализованные в виде технических устройств, и СВТ, реализованные в виде программ. С учетом данных определений, обработку данных с использованием любого электронного вычислительного средства следует рассматривать как автоматизированную обработку информации. Также в внесенными изменениями уточнено, что данным законом регулируются отношения, связанные с обработкой ПДн, осуществляемой с использованием средств автоматизации, «в том числе в информационно-телекоммуникационных сетях». Также в данной норме уточнено, в каком случае регулируется обработка ПДн без использования средств автоматизации. Напомним, что под действие закона попадает обработка данных без использования средств автоматизации, если такая обработка соответствует характеру действий (операций), совершаемых с персональными данными с использованием средства автоматизации. И далее Федеральным законом разъяснено: «то есть позволяет осуществлять в соответствии с заданным алгоритмом поиск зафиксированных на материальном носителе персональных данных, содержащихся в картотеках или иных систематизированных собраниях, и (или) доступ к таким персональным данным».

Также изменения затронули следующие термины:

1. Введено новое определение «персональных данных» — это любая информация, относящаяся к прямо или косвенно к определенному или определяемому физическому лицу (субъекту персональных данных). Как нетрудно заметить, из определения исчезло перечисление «реквизитов» физического лица, т. е. фамилия, имя, отчество, дата рождения и т. п. В тоже время уточнено, что следует учитывать любую информацию, относящуюся прямо или косвенно к физическому лицу.

2. В части термина «оператор» уточнено, что это государственный орган, муниципальный орган, юридическое или физическое лицо, самостоятельно или совместно с другими лицами организующее и (или) осуществляющее обработку ПДн, а также определяющее цели обработки ПДн. Т. е. предусмотрена возможность организации оператором обработки данных с участием других лиц. Кроме того «исчезла» норма, в соответствии с которой оператор определял содержание обработки ПДн.

3. Уточнено определение «обработки ПДн». С учетом новой формулировки обработка ПДн — это любое действие (операция) или совокупность действий, совершаемых с использованием средств автоматизации или без использования таких средств с персональными данными, включая сбор, запись, систематизацию, накопление, хранение, уточнение (обновление, изменение), извлечение, использование, передачу (распространение, предоставление, доступ), обезличивание, блокирование, удаление, уничтожение персональных данных.

4. Существенно упрощен термин «распространение персональных данных», под которым понимаются действия, направленные на раскрытие персональных данных неопределенному кругу лиц.

5. Введено понятие «предоставление персональных данных», т. е. действия, направленные на раскрытие персональных данных определенному лицу или определенному кругу лиц.

6. Коренным образом изменен подход к понятию «обезличивание персональных данных». Если с учетом ранее применяемого определения мы говорили, что в результате обезличивания не представляется никоим образом определить принадлежность ПДн, то с учетом внесенных изменений допускается следующая возможность: используя дополнительную информацию, можно определить принадлежность тех или иных данных к конкретном субъекту ПДн. Т. е. обезличивание нельзя рассматривать, как исключительно односторонний процесс.

7. Более четко изложено понятие «информационной системы персональных данных», под которой понимается совокупность содержащихся в базах данных ПДн и обеспечивающих их обработку информационных технологий и технических средств.

8. Исключены понятие «конфиденциальность персональных данных» и «общедоступные персональные данные».

Способы защиты ПДН

Выявление нарушений Роскомнадзором влечет утрату репутации и наложении высоких штрафных санкций. При возбуждении дела по статье УК России сайт подвергается блокировке. Подобная ситуация произошла с соцсетью LinkedIn.

Защита личной информации — это комплекс мер, направленных на обеспечение безопасности сведений о субъекте, на основании которых можно его идентифицировать.

В Российской Федерации защитные меры от угрозы передачи в свободный доступ ИСПДН проводится за счет специального режима переработки материалов. В состав процедуры включены следующие операции:

  • формирование внутренних документов для работы оператора;
  • установки технических средств защиты;
  • получение лицензии от уполномоченного органа — ФСТЭК, ФСБ;
  • получение сертификата для защиты информационных пакетов данных через аналогичные органы контроля.

Бонус!

прекрасный курс по Deep Learning

Программа курса

  1. Python: основы, Google Colab;
  2. Введение в линейную алгебру. Векторы. Матрицы и операции с ними. Библиотека NumPy;
  3. Библиотеки Pandas и MatPlotlib. Основы машинного обучения;
  4. Элементы теории оптимизации. Градиент. Градиентный спуск. Линейные модели;
  5. Введение в глубокое обучение. Перцептрон. Нейрон с сигмоидой (и другими функциями активации). Основы ООП в Python;
  6. Библиотека PyTorch. Многослойные нейросети;
  7. Обучение нейронных сетей на практике. Cifar10, notMNIST;
  8. Сверточные нейросети. Сверточный слой. Пулинг слой;
  9. Практика обучения нейросетей. Классификация дорожных знаков;
  10. Transfer Дearning. Популярные в Computer Vision архитектуры;
  11. Сегментация картинок. U-Net;
  12. Участие в соревнованиях на Kaggle;
  13. Object Detection. YOLOv3;
  14. Классический GAN. Нейронный перенос стиля;
  15. Базовые методы обработки текста;
  16. Word Embeddings;
  17. Рекуррентные нейронные сети;
  18. LSTM, GRU ячейки;
  19. Языковые модели;
  20. Машинный перевод;
  21. Text2Speech;
  22. SuperResolution.

Youtube-каналХабреНейрон

Уровни защищенности ПДн

В ПП № 1119 от 1 ноября 12 года утверждены уровни защиты личных материалов пользователей информационных сетей. Для каждого этапа предусмотрены отдельные требования, подлежащие выполнению. Для подбора необходимого уровня нужно выявить параллельные условия, а именно:

  • категория данных;
  • форма взаимоотношений между физическим и юридическим лицом;
  • численность субъектов;
  • возможные виды угроз.

После сопоставления сведений владелец сайта получает представление о том, какой уровень защиты в соответствии с Федеральным законом № 152 Российской Федерации требуется.

При нарушении положений нормативно-правового акта предусмотрена ответственность в отношении оператора. Размер санкций прописан в статье № 13.11 КоАП России. Например, в отношении должностных лиц вводится сначала предупреждение, затем штраф в объеме 1000-3000 руб. Для ИП наказание предусмотрено в размере 5000-10000 рублей, а для юридических лиц — 30000-50000 р.

https://youtube.com/watch?v=n_jgRNKgdvo%3F

Права работников в вопросах обработки персональных данных

Операторы, осуществляющие любые виды деятельности с данными личного характера, должны руководствоваться в своей деятельности в том числе и трудовым законодательством. Прежде всего, каждый работник организации вправе знать какие именно характеризующие его данные стали известны работодателю, а также иметь свободный и беспрепятственный доступ в любое время к этим данным.

Работник может затребовать от своего руководства корректировки неточностей и ошибок в персональных данных, их уточнения при необходимости, в том числе если функция обработки данных передана оператором третьим лицам. Сотрудник, кроме того, может назначить представителя для осуществления действий по защите своих личных данных в порядке, установленном в законе.

Если имело место нарушение или ущемление в любой форме прав работника, он вправе обратиться для защиты своих интересов в правоохранительные органы.

Таким образом, обработка, передача и хранение персональных данных физических лиц должна осуществляться в четком соответствии с нормами законодательства, нарушение которых может повлечь привлечение виновных лиц к ответственности, в том числе уголовной.

Примеры задач, эффективно решаемых при помощи MapReduce

Word Count

Начнём с классической задачи – Word Count. Задача формулируется следующим образом: имеется большой корпус документов. Задача – для каждого слова, хотя бы один раз встречающегося в корпусе, посчитать суммарное количество раз, которое оно встретилось в корпусе.

Решение:

Раз имеем большой корпус документов – пусть один документ будет одной входной записью для MapRreduce–задачи. В MapReduce мы можем только задавать пользовательские функции, что мы и сделаем (будем использовать python-like псевдокод):

Функция map превращает входной документ в набор пар (слово, 1), shuffle прозрачно для нас превращает это в пары (слово, ), reduce суммирует эти единички, возвращая финальный ответ для слова.

Обработка логов рекламной системы

Второй пример взят из реальной практики Data-Centric Alliance.

Задача: имеется csv-лог рекламной системы вида:

Решение:

Функция map проверяет, нужна ли нам данная запись – и если нужна, оставляет только нужную информацию (город и размер платежа). Функция reduce вычисляет финальный ответ по городу, имея список всех платежей в этом городе.

Об алгоритмах

Для обозначения формализованных правил, определяющих последовательность шагов обработки информации, в информатике используется понятие алгоритма.

Из курса информатики основной школы вы знаете, что слово «алгоритм» произошло от имени выдающегося математика средневекового Востока Мухаммеда аль-Хорезми (780-850 гг. н. э.), описавшего еще в IX веке правила выполнения вычислений с многозначными десятичными числами. Правила сложения, вычитания, умножения столбиком, деления «уголком», которым вас учили в младших классах, — это алгоритмы аль-Хорезми.

С понятием алгоритма в математике ассоциируется известный способ вычисления наибольшего общего делителя (НОД) двух натуральных чисел, который называют алгоритмом Евклида. В словесной форме его можно описать так:

  1. Если числа не равны, то большее из них заменить на разность большего и меньшего из чисел.

  2. Если два числа равны, то за НОД принять любое из них, иначе перейти к выполнению пункта 1.

Первоклассник, который не знает, что такое НОД, но умеет сравнивать целые числа и выполнять вычитание, сможет исполнить алгоритм. Действовать при этом он будет формально.

Такой формализованный алгоритм легко запрограммировать для современного компьютера. Мечта создать машину — автоматическое устройство, которое сможет без вмешательства человека производить расчеты, появилась очень давно. Для ее реализации требовались не только технические возможности, но и глубокое понимание сущности алгоритмов обработки информации и разработка формализованного способа представления таких алгоритмов.

Статьи по теме свернуть ↑

8.1.КОЛИЧЕСТВЕННЫЕ МЕТОДЫ

Косновным методам количественного анализа (и синтеза) в психологии относятся следующие:

1.Методы первичной обработки данных (табулирование,

построение диаграмм, гистограмм, полигонов и кривых распределения). 2. Методы вторичной обработки данных (вычисление статистик).

3.Корреляционный анализ.

4.Дисперсионный анализ.

5.Регрессионный анализ.

6.Факторный анализ.

7.Таксономический (кластерный) анализ.

8.Шкалирование.

Выше при освещении этапа обработки данных в психологическом исследовании приводились краткие характеристики всех перечисленных методов кроме двух последних. Восполним этот пробел.

Таксономический анализ Метод представляет собой математический прием группировки данных в классы (таксоны,

кластеры) таким образом, чтобы объекты, входящие в один класс, были более однородны по какому-либо признаку по сравнению с объектами, входящими в другие классы. В итоге появляется возможность определить в той или иной метрике расстояние между изучаемыми объектами и дать упорядоченное описание их взаимоотношений на количественном уровне . В силу недостаточной проработанности критерия эффективности и допустимости кластерных процедур данный метод применяется обычно в сочетании с другими способами количественного анализа данных. С другой стороны, и сам таксономический анализ используется как дополнительная страховка надежности результатов, полученных с использованием других количественных методов, в частности факторного анализа. Суть кластерного анализа позволяет рассматривать его как метод, явно совмещающий количественную обработку данных с их качественным анализом. Поэтому причислить его однозначно к разряду количественных методов, видимо, не правомерно. Но поскольку процедура метода по преимуществу математическая и результаты могут быть представлены численно, то и метод в целом будем относить к категории количественных.

Шкалирование Шкалирование в еще большей степени, чем таксономический анализ, совмещает в себе

черты количественного и качественного изучения реальности. Количественный аспект шкалирования состоит в том, что в его процедуру в подавляющем большинстве случаев входят измерение и числовое представление данных. Качественный аспект шкалирования выражается в том, что, во-первых, оно позволяет манипулировать не только количественными данными, но и данными, не имеющими единиц измерения, а во-вторых, включает в себя элементы качественных методов (классификации, типологизации, систематизации).

Еще одной принципиальной особенностью шкалирования, затрудняющей определение его места в общей системе научных методов, является совмещение в нем процедур сбора данных и их обработки. Можно даже говорить о единстве эмпирических и аналитических процедур при шкалировании. Не только в конкретном исследовании трудно указать на последовательность и разнесенность этих процедур (они часто совершаются одновременно и совместно), но и в теоретическом плане не удается обнаружить стадиальную иерархию (невозможно сказать, что первично, а что вторично).

Третий момент, не позволяющий однозначно отнести шкалирование к той или иной группе методов, – это его органическое «врастание» в специфические области знания и приобретение им наряду с признаками общенаучного метода признаков узкоспецифических. Если другие методы общенаучного значения (например, наблюдение или эксперимент) можно довольно легко представить как в общем виде, так и в конкретных модификациях, то шкалирование на уровне всеобщего без потери необходимой информации охарактеризовать весьма непросто. Причина этого очевидна: совмещение в шкалировании эмпирических процедур с обработкой данных. Эмпирика конкретна, математика абстрактна. Поэтому срастание общих принципов математического анализа со специфическими приемами сбора данных дает указанный эффект. Неплохой иллюстрацией этому служит неясность с научными истоками шкалирования. Сразу несколько наук могут претендовать на звание его «родителя». Среди них и психология, где над теорией и практикой шкалирования работали такие выдающиеся ученые, как Л. Терстон , С.

Оцените статью
Рейтинг автора
5
Материал подготовил
Андрей Измаилов
Наш эксперт
Написано статей
116
Добавить комментарий