1.1. Понятие информации. Количество информации. Единицы измерения информации

Информация  является  одним из фундаментальных  понятий  современной науки наряду с такими понятиями, как «вещество» и «энергия».

Общее определение этому термину дать  невозможно. Однако в раз-личных предметных областях даётся специализированное определение информации, подходящее для данной предметной области. В рамках этого задания мы будем говорить о математической теории информации и рассмотрим два подхода - содержательный (Клод Шеннон) и алфавитный (А.Н.Колмогоров). Начнём с определения понятия «инфор-мация» в каждом из этих подходов.

Определение 1

В содержательном подходе, информация - это снятая неопределённость. Неопределённость некоторого события - это количество возможных результатов (исходов) данного события.

Например, если мы подбрасываем вверх монету, то она может упасть двумя различными способами (орлом вверх или решкой вверх). Соответственно, у данного события два возможных исхода. Если же подбрасывать игральный кубик, то исходов будет шесть. 

Определение 2

В алфавитном подходе информация - это сообщение (последовательность символов некоторого алфавита). Причём существенными являются только размер алфавита и количество символов в сообщении. Конкретное содержание сообщения интереса не представляет. Чаще всего алфавит является двоичным (состоит из `2` символов – «`0`» и «`1`»).

После таких определений понятия «информация» можно говорить об её измерении. Введём несколько основных единиц измерения информации.

Чаще всего в качестве основной единицы измерения информации используется бит. При алфавитном подходе один бит - это количество информации, которое можно передать в сообщении, состоящем из одного двоичного знака (`«0»` или `«1»`). С точки же зрения содержательного подхода один бит - это количество информации, уменьшающее неопределённость знания в два раза.

Наряду с битами можно использовать и другие единицы измерения информации, например, триты или диты. При алфавитном подходе один трит - это количество информации, которое можно передать в сообщении, состоящем из одного троичного знака `(«0»`, `«1»` или `«2»)`. С точки же зрения содержательного подхода один трит - это количество информации, уменьшающее неопределённость знания в три раза. Соответственно, один дит - это количество информации, уменьшаю-щее неопределённость знания в десять раз, и количество информации, которое можно передать в сообщении, состоящем из одного десятичного знака (арабской цифры). В некоторых задачах (например, в задаче взлома кодового замка) удобнее в качестве основной единицы измерения информации использовать не биты, а диты, поскольку угадывание каждой цифры из кода уменьшает количество комбинаций в `10` раз.

Для каждой основной единицы измерения информации существуют производные более крупные единицы измерения. Поскольку чаще всего мы будем использовать в качестве основной единицы бит, рассмотрим производные единицы измерения для бита. На практике чаще всего используется не бит, а байт.

`1` байт (`1`B) `= 8` бит;

Далее существует две линейки производных единиц для байта – линейка десятичных приставок и линейка двоичных приставок. В случае десятичных приставок каждая следующая единица измерения равна `1000` предыдущих единиц. Обозначаются десятичные приставки латинскими буквами (буква префикса из системы СИ и заглавная «B», обозначающая «байт») Итак:

`1` килобайт (`1` kB) `= 1000` B (1000 байт);

`1` мегабайт (`1` MB) `= 1000` kB ;

`1` гигабайт (`1` GB) `= 1000`  MB;

`1` терабайт (`1` TB) `= 1000`  GB;

`1` петабайт (`1` PB) `= 1000`  TB;

`1` эксабайт (`1` EB) `= 1000`  PB;

`1` зеттабайт (`1` ZB) `= 1000` EB;

`1` йоттабайт(`1` YB) `= 1000` ZB.

Более крупных единиц на настоящий момент не введено.

При использовании двоичных приставок, каждая следующая едини-ца измерения равна 1024 предыдущих единиц. В России принято обозначать двоичные приставки, записывая префикс заглавной русской буквой и после него слово «байт» целиком и тоже русскими буквами. За рубежом для обозначения двоичных приставок между префиксом и «B» добавляется маленькая буква «i» (от слова «binary»). Кроме того, все префиксы записываются заглавными буквами. Итак:

`1` кибибайт (`1` Кбайт, `1` KiB) `=2^10` байт `= 1024` байт;

`1` мебибайт (`1` Мбайт, `1` MiB) `=2^20` байт `= 1024` Кбайт;

1 гибибайт (`1` Гбайт, `1` GiB) `=2^30` байт `= 1024` Мбайт;

1 тебибайт (`1` Тбайт, `1` TiB) `=2^40` байт `= 1024` Гбайт;

1 пебибайт (`1` Пбайт, `1` PiB) `=2^50` байт `= 1024` Тбайт;

1 эксбибайт (`1` Эбайт, `1`EiB) `=2^60` байт `= 1024`  Пбайт;

1 зебибайт (`1` Збайт, `1` ZiB) `=2^70` байт `= 1024` Эбайт;

1 йобибайт (`1` Йбайт, `1` YiB) `=2^80` байт `= 1024` Збайт.