Важнейшие структуры данных, которые вам следует знать к своему собеседованию по программированию

Законодательное регулирование

Персональные данные подпадают под действие многих государственных нормативов, основной из которых – Конституция РФ. Основополагающим законом в этой сфере считается ФЗ № 152, действующий с 27.01.06 г. В этом документе разъясняется термин «персональные данные», а также из чего состоит это понятие. Выполнение требований этого норматива – прямая обязанность юридических и частных лиц.

К персональным данным (ПД) относят сведения, характеризующие прямо или косвенно субъекта – физическое лицо. По таким данным можно наиболее точно установить личность конкретного гражданина.

Конституция РФ (ст. 23–24) гарантирует физлицам право на соблюдение тайны их частной жизни, создает все необходимые предпосылки для неприкосновенности и необходимой защиты. Владельцу ПД принадлежит все, из чего состоит это понятие, в связи с этим такая информация не должна контролироваться третьими лицами или правительственными органами.

Физлица самостоятельно распоряжаются своими данными и вольны решать – воспрепятствовать их распространению или предоставить по требованию. Государство предоставляет определенные гарантии и защиту для получения этой возможности. В з-не № 152-ФЗ указаны условия, правила и круг лиц, которые могут использовать ПД кроме их владельца.

Носитель ПД может разрешить операторам получать и осуществлять обработку его личной информации. Это позволит на законных основаниях выполнять определенные действия с ней. Во время оформления заявлений на получение займа, при оформлении на работу, при проведении анкетирования физическое лицо самостоятельно предоставляет свое согласие, добровольно подписывая соглашение о разрешении проверять его личные данные.

Служебные лица могут воспользоваться доступом к определенному объему личной информации, необходимой для выполнения конкретных действий. У них нет права на хранение и применение ПД после достижения результата. В случае нарушения такого требования оператор отвечает за их намеренное разглашение.

В определенных случаях используется особое требование по работе с ПД, если они:

  • необходимы для решения вопросов семейного или личного характера (в случае если распространение данных не приводит к ущемлению прав других лиц);
  • находятся в архивной документации;
  • принадлежат к данным, составляющим государственную тайну;
  • должны быть предоставлены по судебному акту.

Разновидности ПД

В Федеральном з-не № 152 обозначены конкретные виды ПД. Они могут классифицироваться по степени секретности, сложности их сбора, возможности применения третьей стороной. Их подразделяют на следующие виды:

  • общие;
  • биометрические;
  • специальные;
  • обезличенные.

Общие

К общим относят персональную информацию, составляющую базовые данные о ее носителе:

  • фамилию, имя, отчество;
  • место регистрации и жительства;
  • информацию из паспорта;
  • сведения об имеющемся образовании;
  • информацию о месте работы;
  • сведения о получаемых доходах и др.

Взятые по отдельности данные общего характера не все могут быть отнесены к информации о человеке, которая может считаться персональной. К примеру, в законе не содержится определенных трактовок относительно того, можно ли считать одной из составляющих ПД номер телефона физлица. Как разъясняют в Роскомнадзоре, эти данные не являются информацией, позволяющей произвести точную идентификацию человека, номер не персонален. Но при совместном использовании с фамилией, именем, данными о прописке он составляет ПД.

Информация о человеке, являющаяся общей, указана в паспорте, ее вносят в военный билет, в документ об образовании, а также в личную карту сотрудника предприятия, трудовую книжку и др. Чтобы использовать такие данные, не нужно брать у сотрудника письменное разрешение с целью их получить. Достаточно того, чтобы человек косвенно, путем проставления галочки в соответствующем поле, подтвердил право на такие действия со стороны получателя этой информации в письменно составленной или онлайн-анкете.

Получить такие ПД очень просто, а это зачастую приводит к проблемам: начинают рассылать навязчивые рекламные предложения или, еще хуже, пытаются шантажировать, подделывать заявки на получение займа и др.

От неразглашения личные данные каждого физлица, содержащие в себе определенные разновидности секретных сведений (об усыновлении, наличии заболеваний и др.), защищаются ст. 137 УК РФ.

Биометрические

Есть персональные данные, которые характеризуют носителя по биологическому и физиологическому принципу. К ним относят:

  • дактилоскопические;
  • анализ ДНК;
  • группу крови;
  • рост, цвет глаз, вес и др.

К биометрическим персональным данным причисляют информацию, получаемую в результате видео- и фотозаписи с участием человека. Данные биометрии наиболее часто востребованы во время проведения лечения, при оформлении на работу в госструктуры, при изготовлении загранпаспорта и визовых документов.

Специальные

К специальным ПД отнесены национальная принадлежность и раса, а также вероисповедание, убеждения философского характера, информация о судимостях, состоянии здоровья, предпочтениях в сексуальной, интимной жизни. Эти сведения можно найти в личных делах, медицинской документации и пр. Они необходимы во время проведения политических мероприятий, используются при вступлении в ряды вооруженных сил. Чтобы третьи лица могли получить доступ и воспользоваться этими ПД, необходимо получить разрешение их владельца.

Обезличенные

К обезличенным данным относят ПД, имеющие общую доступность. Их можно найти в адресных книгах, справочной документации, в средствах массовой информации. Информация, являющаяся общедоступной, может легко быть использована заинтересованными лицами. Общедоступными являются данные о материальном положении политических деятелей, представителей власти, чиновников, занимающих руководящие посты.

Классификация

Структуры данных бывают физические и логические. В отличие от последних, физические отражают, по сути, способ представления данных в памяти ЭВМ, поэтому их называют еще и внутренними.

По своему составу структуры данных классифицируют на следующие типы:

— простые. Их нельзя разделить на составные части, которые больше, чем биты, то есть мы говорим о неделимых единицах. Для простого типа ясно определен размер и способ размещения структуры в памяти ПК;

— сложные, они же интегрированные. Состоят из других структур данных, которые бывают как простые, так и, в свою очередь, тоже сложные. 

По наличию связей структуры бывают:

— несвязные: массивы, векторы, строки, стеки (Last In, First Out), очереди (First In, First Out);

— связные (к примеру, связные списки).

Также существует понятие изменчивости — это изменение количества элементов либо связей между ними. По признаку изменчивости структуры бывают:

— статические;

— полустатические;

— динамические.

Классификацию можно посмотреть на картинке ниже:

Здесь отдельного упоминания заслуживают файлы как структуры данных. Файлами называют, к примеру, совокупность записей, структурированных одинаково. Файлы бывают:

— последовательные;

— прямого или комбинированного доступа;

— организованные разделами.

Следующий критерий — характеристика упорядоченности элементов. По признаку упорядоченности структуры бывают:

— нелинейные: деревья, графы, многосвязные списки;

— линейные. По характеру распределения компонентов в памяти ЭВМ они могут иметь последовательное распределение (строки, векторы, массивы, стеки, очереди) и произвольное связное распределение (односвязные и двусвязные списки).

Когда мы указываем тип данных, мы четко определяем:

— размер памяти, который отводится под конкретную структуру;

— способ размещения структуры в памяти;

— значения, которые допустимы для этого типа данных;

— операции, которые поддерживаются.

Кто использует большие данные

Наибольший прогресс отрасли наблюдается в США и Европе. Вот крупнейшие иностранные компании и ведомства, которые используют Big Data:

• HSBC повышает безопасность клиентов пластиковых карт. Компания утверждает, что в 10 раз улучшила распознавание мошеннических операций и в 3 раза – защиту от мошенничества в целом.

• Суперкомпьютер Watson, разработанный IBM, анализирует финансовые транзакции в режиме реального времени. Это позволяет сократить частоту ложных срабатываний системы безопасности на 50% и выявить на 15% больше мошеннических действий.

• Procter&Gamble проводит с использованием Big Data маркетинговые исследования, более точно прогнозируя желания клиентов и спрос новых продуктов.

• Министерство труда Германии добивается целевого расхода средств, анализируя большие данные при обработке заявок на пособия. Это помогает направить деньги тем, кто действительно в них нуждается (оказалось, что 20% пособий выплачивались нецелесообразно). Министерство утверждает, что инструменты Big Data сокращают затраты на €10 млрд.

Среди российских компаний стоит отметить следующие:

• Яндекс. Это корпорация, которая управляет одним из самых популярных поисковиков и делает цифровые продукты едва ли не для каждой сферы жизни. Для Яндекс Big Data – не инновация, а обязанность, продиктованная собственными нуждами. В компании работают алгоритмы таргетинга рекламы, прогноза пробок, оптимизации поисковой выдачи, музыкальных рекомендаций, фильтрации спама.

• Мегафон

Телекоммуникационный гигант обратил внимание на большие данные примерно пять лет назад. Работа над геоаналитикой привела к созданию готовых решений анализа пассажироперевозок

В этой области у Мегафон есть сотрудничество с РЖД.

• Билайн. Этот мобильный оператор анализирует массивы информации для борьбы со спамом и мошенничеством, оптимизации линейки продуктов, прогнозирования проблем у клиентов. Известно, что корпорация сотрудничает с банками – оператор помогает анонимно оценивать кредитоспособность абонентов.

• Сбербанк. В крупнейшем банке России супермассивы анализируются для оптимизации затрат, грамотного управления рисками, борьбы с мошенничеством, а также расчёта премий и бонусов для сотрудников. Похожие задачи с помощью Big Data решают конкуренты: Альфа-банк, ВТБ24, Тинькофф-банк, Газпромбанк.

И за границей, и в России организации в основном пользуются сторонними разработками, а не создают инструменты для Big Data сами. В этой сфере популярны технологии Oracle, Teradata, SAS, Impala, Apache, Zettaset, IBM, Vowpal.

Читайте: Что такое интернет вещей, как он работает и чем полезен

Определение понятия

Если перевести сам термин информация с латинского языка, то он будет означать изложение или сведение. В настоящее время наука до сих пор ищет общие свойства и закономерности, которые являются присущими информации, однако, данные в информатике являются неким интуитивным понятием, которое несет различные смыслы в различных сферах деятельности человека.

Несмотря на то что в настоящее время существует огромное количество определений данного термина, необходимо выделить наиболее общие и понятные из них. Данные являются отражением окружающего мира методом каких-то знаков и сигналов. Ценность сообщения, которую несут сведения, заключается в новых знаниях, содержащихся в данном сообщении.

Типы информации

Они могут отличаться в зависимости от способа восприятия. Данные могут восприниматься с помощью наших чувств. Способы получения информации:

  • Органы слуха,
  • Зрение,
  • Осязание,
  • Вкус,
  • Обоняние.

Кроме этого, сведения разделяют и относительно их формы. По форме они могут быть:

  • Текстовыми,
  • Числовыми,
  • Графическими,
  • Звуковыми.

Сюда также можно отнести и видеоинформацию.

Информация и физика

В физике есть понятие «энтропия системы», которое является мерой хаоса, беспорядка для термодинамической системы, информация же (антиэнтропия) – это мера ее сложности и упорядоченности. Если увеличивается ее сложность, то величина энтропии становится меньше, а величина информации растет. Подобный процесс, при котором увеличивается информация, возникает в открытых, саморазвивающихся, обменивающихся энергией и веществом с окружающей средой системах живой природы (белковые организмы и молекулы, популяции животных). Можно сказать, что в физике информацию рассматривают как антиэнтропию.

Полустатические структуры

Характеристики:

— переменная длина;

— поддержка простых способов изменения этой длины;

— изменение длины возможно не в произвольных, а в определенных пределах, которые не будут превышать максимально-допустимые (предельные) значения.

С точки зрения логики полустатическая структура — это последовательность данных, связанная отношениями линейного списка. Доступ к элементу возможен по порядковому номеру.

С физической точки зрения полустатические структуры представлены в виде вектора, располагаясь в непрерывной области памяти ПК. Также их можно представить в качестве однонаправленного связного списка, где каждый последующий компонент адресуется указателем, который находится в текущем компоненте.

Примеры: стеки, строки, очереди, деки.

Способы передачи информации

Передачей информационных данных называется процесс их доставки от источника к получателю.

Универсальной системой передачи данных, независимо от их классификации, является следующая цепочка: источник сообщения — кодирующее устройство — канал связи — декодирующее устройство — получатель сообщения.

Чтобы ее перенести в пространстве и времени, необходимо определенным образом оформить, закодировать. Еще в древние времена люди научились передавать информацию на расстоянии с помощью звуковых (гонг, набат, колокол, рупор) и световых (огонь, маяк) сигналов.

Широкое распространение получила знаковая система передачи информации посредством написанного или напечатанного текста, различных изображений (рисунков, картинок, схем, чертежей, графиков). Сюда же можно отнести предметы, несущие смысловую нагрузку.

Раньше передача подобных символов осуществлялась курьерскими средствами доставки. Сейчас это возможно сделать гораздо быстрее с помощью интернета. Даже объемные предметы можно мгновенно передать на большое расстояние и распечатать на 3D-принтере

Последний способ передачи информации основан на свойствах электромагнитных колебаний (радиоволны, световые, электрические импульсы). Прежде чем появился интернет, с их помощью заработали телеграф, факс, телефон, радио и телевидение.

К этому же периоду можно отнести и появление магнитной записи на специальных намагниченных носителях, которые можно было долго хранить. Недостаток заключался в необходимости предохранять записи от размагничивания.

Человек способен считывать информацию, переданную посредством:

  • нервных импульсов — они посылаются в мозг органами чувств под воздействием раздражающих факторов, благодаря чему информация запечатлевается, обрабатывается и хранится в нем;
  • мимики и жестов, изображаемых другим человеком;
  • запаха и вкуса, которые могут указывать на характерные свойства объекта.

В природе носителями генетической информации, передаваемой по наследству, являются хромосомы. Именно они служат местом хранения генетического материала предков, обеспечивают его передачу следующему поколению и реализуют воспроизводство наследственных признаков у потомства. 

Характерные свойства информации

Информация должна быть доступной

Свойства информации:

  1. Независимость информации. Понятие объективность является относительным, потому что более объективной считается та информация, которая в методы обработки привносит меньше субъективизма. В период информационных процессов объективность информации всегда становится ниже.
  2. Обширность информации. Такое свойство как полнота информации может характеризовать достаточное количество данных для принятия устройством различных решений. Чем шире данные, тем шире область и интервал методов обработки, а соответственно намного проще выбрать способ, который содержит минимальное значение погрешности в информационном процессе.
  3. Нормальность информации. Это уровень ее пригодности к реальному течению дел. Информация, которая не соответствует реальности, может возникать во время создания новой информации на основе неправильных, лживых данных, но полные, то есть обширные данные приводят к возникновению неадекватной информации только тогда, когда к ним применяют неадекватные способы и методы информационных и технологических процессов.
  4. Доступность. Это критерий получения информации. Невозможность доступа к сведениям или полное отсутствие нормальных способов их переработки могут привести к тому, что информация окажется недоступной.
  5. Современность, актуальность информации. Это уровень аналогичности информации по отношению к происходящим действиям в данный момент. Так как информационные процессы зачастую растягиваются во временных рамках, то правдивая и адекватная, но неактуальная, то есть устаревшая, информация приводит к ошибочным решениям системы. Востребованность поиска либо создания нормального метода обработки данных приводит к приостановке в приобретении информации, поэтому она становится бесполезной.

Непосредственно в информатике выделяется более узкий круг свойств информации:

  1. Запоминаемость. Важнейшее свойство информации.
  2. Передаваемость. Умение информации размножаться, то есть свойство копирования.
  3. Воспроизводимость. Характеристика бесконечности информации, то есть во время копирования информация остается равна сама себе.
  4. Преобразуемость. Данные могут изменять метод и форму своего бытования.
  5. Стираемость. Это свойство имеет отношение к процессу, при котором количественные характеристики становятся меньше либо практически равны нулю.

На свойства информации в информатике могут влиять как признаки данных, так и свойства методов обработки информации.

Использование фискальников в составе онлайн-касс

Онлайн-касса – это разновидность контрольно-кассовой техники, отличием которой является возможность передачи данных о совершаемых клиентами организации платежах в Налоговую службу в режиме реального времени. Связь контролирующих органов с коммерческими фирмами через интернет позволяет им отказаться от периодических проверок и сопоставления данных фискальных регистраторов со сведениями, занесенными в налоговые декларации. По сути онлайн-касса и представляет собой фискальный регистратор, подключаемый к облачному сервису, в который выгружается вся информация о производимых операциях.

Чтобы фискальный регистратор мог использоваться в качестве онлайн-кассы, он должен быть оснащен комплектом дополнительного оборудования. Важнейшим компонентом является фискальный накопитель, отвечающий за обмен данными через интернет. Многие аппаратные модули уже имеют этот элемент. Некоторые модели могут быть доработаны производителем или специалистами сторонних организаций.

Виды баз данных

  1. Фактографическая – содержит краткую информацию об объектах некоторой системы в строго фиксированном формате;
  2. Документальная – содержит документы самого разного типа: текстовые, графические, звуковые, мультимедийные;
  3. Распределённая – база данных, разные части которой хранятся на различных компьютерах, объединённых в сеть;
  4. Централизованная – база данных, хранящихся на одном компьютере;
  5. Реляционная – база данных с табличной организацией данных;
  6. Неструктурированная (NoSQL) — база данных, в которой делается попытка решить проблемы масштабируемости и доступности за счёт атомарности (англ. atomicity) и согласованности данных, но не имеющих четкой (реляционной) структуры.

Одно из основных свойств БД – независимость данных от программы, использующих эти данные. Работа с базой данных требует решения различных задач, основные из них следующие:

  • создание базы;
  • запись данных в базу;
  • корректировка данных;
  • выборка данных из базы по запросам пользователя.

Задачи этого списка называются стандартными.

Следующее понятие, связанное с базой данных: программа для работы с базой данных – это программа, которая обеспечивает решение требуемого комплекса задач. Любая подобная программа должна уметь решать все задачи стандартного набора.

База данных в разных системах имеет различную структуру.

В ПВЭМ обычно используются реляционные БД – в таких базах файл является по структуре таблицей. В ней столбцы называются полями, строки – записями.

В БД содержатся банные некоторого множества объктов. Каждая запись содержит данные одного объекта. Каждая такая БД определяется именем файла, списком полей, шириной полей. Например, БД Школа (Ученик, Класс, Адрес).

Примером БД может служить расписание движения поездов или автобусов. Здесь каждая строчка – запись отражает данные строго одного объекта. База включает поля: номер рейса, маршрута следования, время отправления и т.д.

Классическим примером БД является и телефонный справочник. Запрос к базе данных – это предписание, указывающее, какие данные пользователь желает получить из базы.

Некоторые запросы могут представлять собой серьёзную задачу, для решения которой потребляется составлять сложную программу. Например, запрос к базе – автобусному расписанию: определить разницу в среднем интервале отправления автобусов из Ростова в Таганрог и из Ростова в Шахты.

Объекты для работы с базами данных

Для создания приложения, позволяющего просматривать и редактировать базы данных, нам потребуется три звена:

  • набор данных
  • источник данных
  • визуальные элементы управления

В нашем случае эта триада реализуется в виде:

  • Table
  • DataSource
  • DBGrid

Table подключается непосредственно к таблице в базе данных. Для этого нужно установить псевдоним базы в свойстве DataBaseName и имя таблицы в свойстве TableName, а затем активизировать связь: свойство .

Однако, поскольку Table является невизуальным компонентом, хотя связь с базой и установлена, пользователь не в состоянии увидеть какие – либо данные. Поэтому необходимо добавить визуальные компоненты, отображающие эти данные. В нашем случае это сетка DBGrid. Сетка сама по себе «не знает», какие данные ей нужно отображать, её нужно подключить к Table, что и делается через компонент – посредник .

А зачем нужен компонент – посредник? Почему бы сразу не подключаться к Table?

Допустим, несколько визуальных компонентов – таблица, поля ввода и т.п. подключены к таблице. А нам нужно быстро переключить их все на другую подобную таблицу. С DataSource это сделать несложно — достаточно просто поменять свойство t, а вот без пришлось бы менять указатели у каждого компонента.

Приложения баз данных – нить, связывающая БД и пользователя:

БД => набор данных –=> источник данных => визуальные компоненты => пользователь

Набор данных:

  • Table(таблица, навигационный доступ)
  • Query(запрос, реляционный доступ)

Визуальные компоненты:

  • Сетки DBGrid, DBCtrlGrid
  • Навигатор DBNavigator
  • Всяческие аналоги Lable, Editи т.д.
  • Компоненты подстановки

Индийский штамм коронавируса: более опасный

Вирусы постоянно мутируют. Некоторые варианты могут быть более заразными. Чтобы избежать привязки к какой-либо территории и связанных с этим негативных ассоциаций, ВОЗ ввела буквенные обозначения для новых опасных штаммов вирусов: альфа (британский), бета (южно-африканский), гамма (бразильский), дельта (индийский). В мае в связи с распространением варианта «Дельта» ВОЗ причислила его к вариантам вирусов, «вызывающих беспокойство».

В мае 2021 года в геномном анализе штамма B.1.617 индийские ученые из Национального института вирусологии (NIV) идентифицировали восемь мутаций в шиповом белке вируса, благодаря которому он проникает в клетки. Две из них позволяют вирусу распространяться с более высокой скоростью. Третья мутация имеет схожесть с аналогичной у бразильского штамма P.1 (вариант «гамма») и помогает вирусу частично ускользать от иммунитета.

Английские эксперты считают, что B.1.617.2 на 50% более заразен. Немецкие вирусологи получили схожие данные — «Дельта» быстрее распространяется и более эффективно ускользает от действия антител.

В России также идет вспышка нового варианта. 90% случаев новых заражений коронавирусной инфекцией в Москве приходится на «Дельту». Самые крупные очаги РФ на 25 июня: Москва и Подмосковье, Санкт-Петербург, Нижегородская область.

Когда один вариант распространяется быстрее других, это может быть вызвано не только большей заразностью штамма, но и различиями в дистанции между людьми и разными уровнями вакцинации. Например, в Великобритании было , что в наиболее пострадавших районах очень малая доля жителей работает из дома.

Большие города: влияет ли плотность населения на распространение эпидемии