При угадывании целого числа в диапазоне от 1 до N было получено 8 бит информации. Чему равно N?
Решение .
Для того чтобы найти число, достаточно решить уравнение N=2 8 =256
Ответ: N = 256.
Вывод: при угадывании любого целого числа в диапазоне от 1 до 256 получаем 8 бит информации .
Пример 6. За два года студент получил 100 оценок. Среди них: 60 пятерок, 25 четверок, 10 троек и 5 двоек. Сколько бит информации несет сообщение о получении студентом следующей отметки?
Решение .
Посчитаем вероятности получения пятерок, четверок, троек и двоек студентом за 2 года:
· вероятность пятерки: Р 5 =60/100=0,6;
· вероятность четверки: Р 4 =25/100=0,25;
· вероятность тройки: Р 3 =10/100=0,1;
· вероятность двойки: Р 2 =5/100=0,05.
Зная вероятности событий, можно определить количество информации в сообщении о каждом из них. Согласно теории информации, для этого нужно решить показательное уравнение 2 i =1/Р.
Решение выражается через логарифм i=log2(l/P).
Вычисления:
I 5 = log 2 (l/0,6) = log 2 (5/3) = 0,737 бит;
I 4 = log 2 (l/0,25) = log 2 (4) = 2 бит;
I 3 = log 2 (l/0,l) = log 2 (10) = 3,322 бит;
I 2 = log 2 (l/0,05) = log 2 (20) = 4,322 бит.
Ответ: сообщение о получении отметки «отлично» несет 0,737 бит информации, «хорошо» – 2 бит, «удовлетворительно» – 3,322, «неудовлетворительно» – 4,322 бит информации.
Вывод: чем меньше вероятность события, тем больше информации несет сообщение о нем .
В компьютерах используется двоичная система счисления потому, что в техническом устройстве наиболее просто реализовать два противоположных физических состояния. Так некоторый физический элемент, имеющий два различных состояния: намагниченность в двух противоположных направлениях; прибор, пропускающий или нет электрический ток; конденсатор, заряженный или незаряженный и т.п.
Как уже отмечалось, за единицу измерения количества информации, при условии двоичного кодирования принят один бит . Одним битом могут быть выражены два понятия: 0 или 1 (да или нет, черное или белое, истина или ложь и т. п.). При этом, в частности, невозможно нецелое число битов.
Следующей по величине единицей измерения количества информации является байт, представляющий собой последовательность, составленною из восьми бит, т.е.
1 байт = 2 3 бит = 8 бит.
Именно восемь бит, или один байт, используется для того, чтобы закодировать символы алфавита. Один байт также является минимальной единицей адресуемой памяти компьютера.
В информатике также широко используются кратные байту единицы измерения количества информации, в которых используется коэффициент 2 n . Этот выбор объясняется тем, что компьютер в основном оперирует числами не в десятичной, а в двоичной системе счисления.
Кратные байту единицы измерения количества информации вводятся следующим образом:
1 Килобайт (Кбайт) = 1024 байт = 2 10 байт
1 Мегабайт (Мбайт) = 1024 Кбайт = 10 20 байт
1 Гигабайт (Гбайт) = 1024 Мбайт = 10 30 байт
1 Терабайт (Тбайт) = 1024 Гбайт =10 40 байт.
1 Петабайт (Пбайт) = 1024 Тбайт = 10 50 байт
1 Экзабайт (Эбайт) = 1024 Пбайт = 10 60 байт
Вероятностный подход используется и при определении количества информации, представленной с помощью знаковых систем. Если рассматривать символы алфавита как множество возможных сообщений N, то количество информации, которое несет один знак алфавита, можно определить по формуле (1). При равновероятностном появлении каждого знака алфавита в тексте сообщения для определения количества информации можно воспользоваться формулой (2).
Множество знаков, используемых при записи текста, называется алфавитом . Полное количество знаков в алфавите называетсямощностью (размером)алфавита .
Допустим, что все знаки алфавита встречаются в тексте с одинаковой частотой (равновероятно), вычислим по формуле (2) количество информации, которое несет каждый знак (символ) алфавита. Так в 2-х символьном алфавите каждый символ «весит» 1 бит (log 2 2 = 1); в 4-х символьном алфавите каждый символ несет 2 бита информации (log 2 4 = 2); в 8-ми символьном -3 бита (log 2 8 = 3) и т.д.
Один символ из алфавита мощностью 256 (2 8) символов несет в тексте 8 бит (1 байт) информации. Алфавит из 256 символов используется для представления текстов в компьютере.
Количество информации (информационный объем), содержащееся в сообщении, закодированном с помощью знаковой системы и содержащем определенное количество знаков (символов), определяется с помощью формулы:
V=К×I, (3)
где V – информационный объем сообщения; I = log 2 N – информационный объем одного символа в используемом алфавите., К – количество символов в сообщении, N – мощность алфавита.
Поясним сказанное выше на примерах.
Пример 7. Книга, набранная с помощью компьютера, содержит 150 страниц; на каждой странице – 40 строк, в каждой строке – 60 символов. Каков объем информации в книге?
Решение . Мощность компьютерного алфавита равна 256. Один символ несет 1 байт информации. Значит, страница содержит 40 60 = 2400 байт информации.
Объем всей информации в книге (в разных единицах):
2400 150 = 360000 (байт);
360000 (байт)/1024 (байт/Кбайт) = 351,5625 (Кбайт);
351,5625 (Кбайт)/1024 (Кбайт/Мбайт) = 0,34332275 (Мбайт).
Ответ: объем информации в книге составляет 360000 байт, 351,5625 Кбайт, 0,34332275 Мбайт.
Пример 8. Подсчитайте объем информации, содержащейся в романе А. Дюма «Три мушкетера», и определите, сколько близких по объему произведений можно разместить на одном лазерном диске в 600 Мбайт если в книге 590 стр., 48 строк на одной странице, 53 символа в строке.
Решение .
590 48 53 = 1500960(символов).
1500960 байт = 1466 Кбайт = 1,4 Мбайт.
600 Мбайт/1,4 Мбайт = 428,57.
Ответ: на одном лазерном диске емкостью 600 Мбайт можно разместить около 428 произведений, близких по объему к роману А. Дюма «Три мушкетера», что составляем 1,4 Мбайт.
Пример 9. На диске объемом 100 Мбайт подготовлена к выдаче на экран дисплея информация: 24 строчки по 80 символов, эта информация заполняет экран целиком. Какую часть диска она занимает?
Решение .
Код одного символа занимает 1 байт.
24 80=1920 (байт).
Объем диска 100 1024 1024 байт = 104857600 (байт).
1920/104857600=0,000018 (часть диска).
Ответ: информация занимает 0,000018 часть диска.
Пример 10.
Каково время (в секундах) передачи полного объема данных по каналу связи? Известно, что передано
731 Мбайт данных, причем первую четверть от всего времени передача шла со скоростью 8 Мбит/с, а остальное время – со скоростью 20 Мбит/с.
Решение .
Обозначим неизвестное время за х (с), тогда за первый период, равный 0,25х (с), передано 8 0,25х =2х (с Мбит/с) данных. За остальное время - 0,75х, (с ) передано 20 0,75х =15х (с Мбит/с).
Объем переданной информации переведем из Мбайт в Мбиты: 731=731 8=5848 (Мбит).
Получаем уравнение 2x +15х = 5848, откуда х =344 (с).
Ответ: для передачи полного объема данных по каналу связи в объеме 731 Мбайт необходимо 344 с.
На семантическом уровне информация рассматривается по ее содержанию, отражающему состояние отдельного объекта или системы в целом. При этом не учитывается полезность для получателя информации.
Для измерения смыслового содержания информации широкое распространение получил подход, основаны на использовании тезаурусной меры. При этом под тезаурусом понимается совокупность информации (сведений), которой располагает получатель (приемник).
Данный подход предполагает, что для понимания (осмысливания) и использования полученной информации получатель должен обладать тезаурусом, т.е. определенным запасом знаков, наполненных смыслом, слов, понятий, названий явлений и объектов, между которыми установлены связи на смысловом уровне. Таким образом, если принять знания о данном объекте или явлении за тезаурус, то количество информации, которое содержится в новом сообщении о данном предмете, можно оценить по изменению индивидуального тезауруса под воздействием данного сообщения. В зависимости от соотношения между смысловым содержанием сообщения и тезаурусом пользователя изменяется количество семантической информации. При этом характер такой зависимости не поддается строгому математическому описанию и сводится к рассмотрению трех основных условий, при которых тезаурус пользователя:
· стремится к нулю, т.е. пользователь не воспринимает поступившее сообщение;
· стремится к бесконечности, т.е. пользователь досконально знает все об объекте или явлении и поступившее сообщение его не интересует;
· согласован со смысловым содержанием сообщения, т.е. поступившее сообщение понятно пользователю и несет новые сведения.
Два первых предельных случая соответствуют состоянию, при котором количество семантической информации, получаемое пользователем, минимально. Третий случай связан с получением максимального количества семантической информации. Таким образом, количество семантической информации, получаемой пользователем, является величиной относительной. Так как одно и то же сообщение может иметь смысловое содержание для компетентного пользователя и быть бессмысленным для пользователя некомпетентного.
Поэтому возникает сложность получения объективной оценки количества информации на семантическом уровне. Для получения такой оценки используются различные единицы измерения количества информации: абсолютные или относительные. В качестве абсолютных единиц измерения могут использоваться символы, реквизиты, записи и т.д. В качестве относительной – коэффициент содержательности, который определяется как отношение количества семантической информации к объему.
Например, для определения на семантическом уровне количества информации, полученной студентами на занятиях, в качестве единицы измерения может быть принят исходный балл (символ), характеризующий степень усвояемости ими нового учебного материала, на основе которого можно косвенно определить количество информации, полученное каждым студентом. Это количество информации будет выражено через соответствующий оценочный балл, в принятом диапазоне оценок.
На прагматическом уровне информация рассматривается с точки зрения ее полезности (ценности) для достижения потребителем информации поставленной практической цели. Данный подход при определении полезности информации основан на расчете приращения вероятности достижения цели до и после получения информации. Количество информации, определяющее ее ценность (полезность), находится по формуле:
где P 0 , P 1 – вероятность достижения цели соответственно до и после получения информации.
В качестве единицы измерения (меры) количества информации, определяющей ее ценность, может быть принят 1 бит (при основании логарифма, равном 2). То есть это такое количество полученной информации, при котором отношении вероятностей достижения цели равно 2.
Рассмотрим три случая, когда количество информации, определяющее ее ценность, равно нулю, и когда она принимает положительное и отрицательное значения.
Количество информации равно нулю при P 0 = P 1 , т.е. полученная информация не увеличивает и не уменьшает вероятность достижении цели.
Значение информации является положительной величиной при P 1 > P 0 , т.е. полученная информация уменьшает исходную неопределенность и увеличивает вероятность достижения цели.
Значение информации является отрицательной величиной при P 1 < P 0 , т.е. полученная информация увеличивает исходную неопределенность и уменьшает вероятность достижения цели. Такую информацию называют дезинформацией.
1. Измерьте информационный объем сообщения «Ура! Скоро Новый год!» в битах, байтах, килобайтах (Кб), мегабайтах (Мб).
Указание : считается, что текст набран с помощью компьютера, один символ алфавита несет 1 байт информации. Пробел – это тоже символ в алфавите мощностью 256 символов.
2. Измерьте примерную информационную емкость одной страницы любого своего учебника, всего учебника.
Указание: Для выполнения задания возьмите учебник по любимому предмету, посчитайте число строк на странице, число символов в строке, включая пробелы. Помните, что один символ алфавита несет 1 байт информации. Перемножив полученные значения, Вы найдете информационную емкость одной страницы учебника (в байтах).
3. Сколько таких учебников может поместиться на дискете 1,44 Мб, на винчестере в 1 Гб.
4. В детской игре «Угадай число» первый участник загадывает целое число от 1 до 32. Второй участник задает вопросы: «Загаданное число больше числа ___?». Какое количество вопросов при правильной стратегии гарантирует угадывание?
Указание: Вопрос задавайте таким образом, чтобы информационная неопределенность (чи сло вариантов) уменьшалась в два раза.
5. Яд находится в одном из 16 бокалов. Сколько единиц информации будет содержать сообщение о бокале с ядом?
6. Сколько бит информации несет сообщение о том, что из колоды в 32 карты достали «даму пик»?
7. Проводят две лотереи: «4 из 32» и «5 из 64» Сообщение о результатах какой из лотерей несет больше информации?
8. Информационное сообщение объемом 1.5 Кбайта содержит 3072 символа. Сколько символов содержит алфавит, при помощи которого было записано это сообщение? (Объяснение решения задачи на доске).
10. Скорость информационного потока – 20 бит/сек. Сколько времени потребуется для передачи информации объемом в 10 килобайт.
11. Сравните (поставьте знак отношения)
o 200 байт и 0,25 Кбайт.
o 3 байта и 24 бита.
o 1536 бит и 1,5 Кбайта.
o 1000 бит и 1 Кбайт.
o 8192 байта и 1 Кбайт.
12. В барабане для розыгрыша лотереи находится 32 шара. Сколько информации содержит сообщение о первом выпавшем номере (например, выпал номер 15)?
13. При игре в кости используется кубик с шестью гранями. Сколько бит информации получает игрок при каждом бросании кубика?
14. Книга, набранная с помощью компьютера, содержит 150 страниц; на каждой странице - 40 строк, в каждой строке - 60 символов. Каков объем информации в книге?
15. Подсчитайте объем информации, содержащейся в романе А. Дюма "Три мушкетера", и определите, сколько близких по объему произведений можно разместить на одном лазерном диске? (590 стр., 48 строк на одной странице, 53 символа в строке).
16. На диске объемом 100 Мбайт подготовлена к выдаче на экран дисплея информация: 24 строчки по 80 символов, эта информация заполняет экран целиком. Какую часть диска она занимает?
17. В школьной библиотеке 16 стеллажей с книгами. На каждом стеллаже 8 полок. Библиотекарь сообщил Пете, что нужная ему книга находится на пятом стеллаже на третьей сверху полке. Какое количество информации библиотекарь передал Пете?
18. В коробке лежат 7 цветных карандашей. Какое количество информации содержит сообщение, что из коробки достали красный карандаш?
19. Какое количество информации несет сообщение: “Встреча назначена на сентябрь”.
20. Сообщение занимает 3 страницы по 25 строк. В каждой строке записано по 60 символов. Сколько символов в использованном алфавите, если все сообщение содержит 1125 байтов?
21. Юстасу необходимо передать следующее сообщение:
Дорогой Алекс! От всей души поздравляю с
Успешной сдачей экзамена по информатике.
Желаю дальнейших успехов. Ваш Юстас.
Пеленгатор определяет место передачи, если она длится не менее 3 минут. С какой скоростью (бит/с) Юстас должен передавать радиограмму?
22. Измерьте информационный объем сообщения “Ура! Закончились каникулы!!” (с точки зрения технического подхода, то есть не учитывая смысл сообщения). Выразите этот объем в битах, байтах, килобайтах.
23. Измерьте примерную информационную емкость 1 страницы учебника, всего учебника. Сколько таких учебников может поместиться на дискете емкостью 360 Кбайт, 1.44 Мбайт, на винчестере в 420 Мбайт, в 6,4Гбайт?
Информация как снятая неопределенность
24. Определите, сколько бит информации несет сообщение о том, что на светофоре горит зеленый свет.
25. Предположим, вероятность того, что вы получите за контрольную работу оценку “5”, равна 0,6; вероятность получения “4” равна 0,2; вероятность получения “3” - 0,2. Определите, сколько бит информации будет нести сообщение о результатах контрольной работы в каждом из возможных случаев.
26. Дано:
Кол-во цветов = 2
Размер картинки = 7*14 точек
27. Дано:
Кол-во цветов = 8
Размер картинки = 17*24 точки
28. Считая, что один символ кодируется одним байтом, подсчитать в байтах количество информации, содержащееся в фразе: “Терпение и труд все перетрут.
29. (Задание А2 демоверсии 2004 г.)
30. Считая, что каждый символ кодируется одним байтом, оцените информационный объём предложения: «Мой дядя самых честных правил, Когда не в шутку занемог, Он уважать себя заставил И лучше выдумать не мог.»
32. Получено сообщение, информационный объём которого равен 32 битам. Чему равен этот объём в байтах?
Решение.
Воспользуемся формулами:
В нашем случае:
Подставив значения (8) и (9) в (5), получим, что: 2 15 = 2 14 *i, откуда i=2.
Тогда по формуле (6): <Количество цветов> =N = 2 i =2 2 =4, что соответствует ответу №4.
Ответ : 4.
35. Считая, что каждый символ кодируется одним байтом, оцените информационный объём следующего предложения в кодировке КОИ-8 (в байтах):
Сегодня метеорологи предсказывали дождь.
36. Считая, что каждый символ кодируется 16-ю битами, оцените информационный объём следующего предложения в кодировке Unicode (в байтах):
Каждый символ кодируется восемью битами.
37. Сколько существует различных последовательностей из символов «а» и «б» длиной ровно в 10 символов?
38. В зрительном зале две прямоугольные области зрительских кресел: одна 10х12, а другая 17х8. Какое минимальное количество бит потребуется для кодирования каждого места в автоматизированной системе?
39. Сообщение передано в семибитном коде. Каков его информационный объём в байтах, если известно, что передано 2000 символов?
40. В алфавите формального (искусственного) языка всего два знака-буквы («0» и «Х»). Каждое слово этого языка состоит всегда из пяти букв. Какое максимальное число слов возможно в этом языке?
42. Имеется тест, объем которого 20 килобайт (на каждой странице теста 40 строк по 64 символа в строке, 1 символ занимает 8 бит). Определить количество страниц в тесте.
43. Сколько байт в 32 Гбайт?
Творческое задание.
Пусть имеется носитель информации на 1,44 мБайта. Необходимо записать на него фотографию с размерами 1024*768 пикс и глубиной цвета 24 бита. Получится ли сделать это? Если нет, то какую глубину цвета можно использовать? Сколько цветов она будет включать? Решение задачи оформите в среде ЭТ Excel.
Лабораторная работа №3. Шифрование текстовой информации.
Цель работы: исследование простейших методов криптографической зашиты информации.
Краткие сведения из теории.
Шифры простой замены
Система шифрования Цезаря - частный случай шифра простой замены. Метод основан на замене каждой буквы сообщения на другую букву того же алфавита, путем смещения от исходной буквы на K букв.
Известная фраза Юлия Цезаря
VENI VI D I VICI, где
| A | B | C | D | E | F | G | H | I | G | K | L | M |
| N | O | P | Q | R | S | T | U | V | W | X | Y | Z |
пришел, увидел, победил, зашифрованная с помощью данного метода, преобразуется в
при смещении на 4 символа влево.
Греческим писателем Полибием за 100 лет до н.э. был изобретен так называемый полибианский квадрат размером 5*5, заполненный алфавитом в случайном порядке. Греческий алфавит имеет 24 буквы, а 25-м символом является пробел. Для шифрования на квадрате находили букву текста и записывали в зашифрованное сообщение букву, расположенную ниже ее в том же столбце. Если буква оказывалась в нижней строке таблицы, то брали верхнюю букву из того же столбца.
| M | T | L | E | X |
| A | K | F | Q | Y |
| N | B | R | O | W |
| C | J | H | D | P |
| U | I | S | G | V |
Схема шифрования Вижинера. Таблица Вижинера представляет собой квадратную матрицу с n 2 элементами, где n - число символов используемого алфавита. На рисунке показана верхняя часть таблицы Вижинера для кириллицы. Каждая строка получена циклическим сдвигом алфавита на символ. Для шифрования выбирается буквенный ключ, в соответствии с которым формируется рабочая матрица шифрования.
| а | б | в | г | д | е | ё | ж | з | и | й | к | л | м | н | о | п | р | с | т | у | ф | х | ц | ч | ш | щ | ъ | ы | ь | э | ю | я |
| б | в | г | д | е | ё | ж | з | и | й | к | л | м | н | о | п | р | с | т | у | ф | х | ц | ч | ш | щ | ъ | ы | ь | э | ю | я | а |
| в | г | д | е | ё | ж | з | и | й | к | л | м | н | о | п | р | с | т | у | ф | х | ц | ч | ш | щ | ъ | ы | ь | э | ю | я | а | б |
| г | д | е | ё | ж | з | и | й | к | л | м | н | о | п | р | с | т | у | ф | х | ц | ч | ш | щ | ъ | ы | ь | э | ю | я | а | б | в |
| д | е | ё | ж | з | и | й | к | л | м | н | о | п | р | с | т | у | ф | х | ц | ч | ш | щ | ъ | ы | ь | э | ю | я | а | б | в | г |
| е | ё | ж | з | и | й | к | л | м | н | о | п | р | с | т | у | ф | х | ц | ч | ш | щ | ъ | ы | ь | э | ю | я | а | б | в | г | д |
| И т.д. до 33-ей строки.. |
Таблица Вижинера
Осуществляется это следующим образом. Из полной таблицы выбирается первая строка и те строки, первые буквы которых соответствуют буквам ключа. Первой размещается первая строка, а под нею - строки, соответствующие буквам ключа в порядке следования этих букв в ключе шифрования. Пример такой рабочей матрицы для ключа «книга» приведен на Рис. 3.1.3 .
Процесс шифрования осуществляется следующим образом:
1. под каждой буквой шифруемого текста записываются буквы ключа. Ключ при этом повторяется необходимое число раз.
2. каждая буква шифруемого текста заменяется по подматрице буквами находящимися на пересечении линий, соединяющих буквы шифруемого текста в первой строке подматрицы и находящимися под ними букв ключа.
3. полученный текст может разбиваться на группы по несколько знаков.
Пусть, например, требуется зашифровать сообщение: максимально допустимой ценой является пятьсот руб. за штуку . В соответствии с первым правилом записываем под буквами шифруемого текста буквы ключа. Получаем:
максимально допустимой ценой является пятьсот руб. за штуку
книгакнигак нигакнигак нигак нигакниг акнигак ниг ак нигак
| а | б | в | г | д | е | ё | ж | з | и | й | к | л | м | н | о | п | р | с | т | у | ф | х | ц | ч | ш | щ | ъ | ы | ь | э | ю | я |
| к | л | м | н | о | п | р | с | т | у | ф | х | ц | ч | ш | щ | ъ | ы | ь | э | ю | я | а | б | в | г | д | е | ё | ж | з | и | й |
| н | о | п | р | с | т | у | ф | х | ц | ч | ш | щ | ъ | ы | ь | э | ю | я | а | б | в | г | д | е | ё | ж | з | и | й | к | л | м |
| и | й | к | л | м | н | о | п | р | с | т | у | ф | х | ц | ч | ш | щ | ъ | ы | ь | э | ю | я | а | б | в | г | д | е | ё | ж | з |
| г | д | е | ё | ж | з | и | й | к | л | м | н | о | п | р | с | т | у | ф | х | ц | ч | ш | щ | ъ | ы | ь | э | ю | я | а | б | в |
| а | б | в | г | д | е | ё | ж | з | и | й | к | л | м | н | о | п | р | с | т | у | ф | х | ц | ч | ш | щ | ъ | ы | ь | э | ю | я |
Дальше осуществляется непосредственное шифрование в соответствии со вторым правилом, а именно: берем первую букву шифруемого текста (М) и соответствующую ей букву ключа (К); по букве шифруемого текста (М) входим в рабочую матрицу шифрования и выбираем под ней букву, расположенную в строке, соответствующей букве ключа (К),- в нашем примере такой буквой является Ч; выбранную таким образом букву помещаем в зашифрованный текст. Эта процедура циклически повторяется до зашифрования всего текста.
Эксперименты показали, что при использовании такого метода статистические характеристики исходного текста практически не проявляются в зашифрованном сообщении. Нетрудно видеть, что замена по таблице Вижинера эквивалентна простой замене с циклическим изменением алфавита, т.е. здесь мы имеем полиалфавитную подстановку, причем число используемых алфавитов определяется числом букв в слове ключа. Поэтому стойкость такой замены определяется произведением стойкости прямой замены на число используемых алфавитов, т.е. число букв в ключе.
Расшифровка текста производится в следующей последовательности:
1. над буквами зашифрованного текста последовательно надписываются буквы ключа, причем ключ повторяется необходимое число раз.
2. в строке подматрицы Вижинера, соответствующей букве ключа отыскивается буква, соответствующая знаку зашифрованного текста. Находящаяся под ней буква первой строки подматрицы и будет буквой исходного текста.
3. полученный текст группируется в слова по смыслу.
Нетрудно видеть, что процедуры как прямого, так и обратного преобразования являются строго формальными, что позволяет реализовать их алгоритмически. Более того, обе процедуры легко реализуются по одному и тому же алгоритму.
Одним из недостатков шифрования по таблице Вижинера является то, что при небольшой длине ключа надежность шифрования остается невысокой, а формирование длинных ключей сопряжено с трудностями.
Нецелесообразно выбирать ключи с повторяющимися буквами, так как при этом стойкость шифра не возрастает. В то же время ключ должен легко запоминаться, чтобы его можно было не записывать. Последовательность же букв не имеющих смысла, запомнить трудно.
С целью повышения стойкости шифрования можно использовать усовершенствованные варианты таблицы Вижинера. Приведем только некоторые из них:
· во всех (кроме первой) строках таблицы буквы располагаются в произвольном порядке.
· В качестве ключа используется случайность последовательных чисел. Из таблицы Вижинера выбираются десять произвольных строк, которые кодируются натуральными числами от 0 до 10. Эти строки используются в соответствии с чередованием цифр в выбранном ключе.
Известны также и многие другие модификации метода.
Алгоритм перестановки
Этот метод заключается в том, что символы шифруемого текста переставляются по определенным правилам внутри шифруемого блока символов. Рассмотрим некоторые разновидности этого метода, которые могут быть использованы в автоматизированных системах.
Самая простая перестановка - написать исходный текст задом наперед и одновременно разбить шифрограмму на пятерки букв. Например, из фразы
ПУСТЬ БУДЕТ ТАК, КАК МЫ ХОТЕЛИ.
получится такой шифротекст:
ИЛЕТО ХЫМКА ККАТТ ЕДУБЪ ТСУП
В последней группе (пятерке) не хватает одной буквы. Значит, прежде чем шифровать исходное выражение, следует его дополнить незначащей буквой
(например, О) до числа, кратного пяти:
ПУСТЬ-БУДЕТ-ТАККА-КМЫХО-ТЕЛИО.
Тогда шифрограмма, несмотря на столь незначительные изменения, будет выглядеть по-другому:
ОИЛЕТ ОХЫМК АККАТ ТЕДУБ ЬТСУП
Кажется, ничего сложного, но при расшифровке проявляются серьезные неудобства.
Во время Гражданской войны в США в ходу был такой шифр: исходную фразу писали в несколько строк. Например, по пятнадцать букв в каждой (с заполнением последней строки незначащими буквами).
П У С Т Ь Б У Д Е Т Т А К К А
К М Ы Х О Т Е Л И К Л М Н О П
После этого вертикальные столбцы по порядку писали в строку с разбивкой на пятерки букв:
ПКУМС ЫТХЬО БТУЕД ЛЕИТК ТЛАМК НКОАП
Если строки укоротить, а количество строк увеличить, то получится прямоугольник-решетка, в который можно записывать исходный текст. Но тут уже потребуется предварительная договоренность между адресатом и отправителем посланий, поскольку сама решетка может быть различной длины-высоты, записывать к нее можно по строкам, по столбцам, по спирали туда или по спирали обратно, можно писать и по диагоналями, а для шифрования можно брать тоже различные направления.
Шифры сложной замены
Шифр Гронсфельда состоит в модификации шифра Цезаря числовым ключом. Для этого под буквами сообщения записывают цифры числового ключа. Если ключ короче сообщения, то его запись циклически повторяют. Зашифрованное сообщение получают примерно также, как в шифре Цезаря, но используют не одно жестко заданное смещение а фрагменты ключа.
Пусть в качестве ключа используется группа из трех цифр – 314, тогда сообщение
С О В Е Р Ш Е Н Н О С Е К Р Е Т Н О
3 1 4 3 1 4 3 1 4 3 1 4 3 1 4 3 1 4
Ф П Ё С Ь З О С С А Х З Л Ф З У С С
В шифрах многоалфавитной замены для шифрования каждого символа исходного сообщения применяется свой шифр простой замены (свой алфавит).
| А | АБВГДЕЁЖЗИКЛМНОПРСТУФХЧШЩЪЫЬЭЮЯ_ |
| Б | _АБВГДЕЁЖЗИКЛМНОПРСТУФХЧШЩЪЫЬЭЮЯ |
| В | Я_АБВГДЕЁЖЗИКЛМНОПРСТУФХЧШЩЪЫЬЭЮ |
| Г | ЮЯ_АБВГДЕЁЖЗИКЛМНОПРСТУФХЧШЩЪЫЬЭ |
| . | ………… |
| Я | ВГДЕЁЖЗИКЛМНОПРСТУФХЧШЩЪЫЬЭЮЯ_АБ |
| _ | БВГДЕЁЖЗИКЛМНОПРСТУФХЧШЩЪЫЬЭЮЯ_А |
Каждая строка в этой таблице соответствует одному шифру замены аналогично шифру Цезаря для алфавита, дополненного пробелом. При шифровании сообщения его выписывают в строку, а под ним ключ. Если ключ оказался короче сообщения, то его циклически повторяют. Зашифрованное сообщение получают, находя символ в колонке таблицы по букве текста и строке, соответствующей букве ключа. Например, используя ключ АГАВА, из сообщения ПРИЕЗЖАЮ ШЕСТОГО получаем следующую шифровку:
ПРИЕЗЖАЮ_ШЕСТОГО
АГАВААГАВААГАВАА
ПОИГЗЖЮЮЮШЕПТНГО
Такая операция соответствует сложению кодов ASCII символов сообщения и ключа по модулю 256.
Задание
Придумайте 3 фразы, каждая минимум из 7 слов. Реализуйте шифрование этой фразы всеми перечисленными видами шифрования.
Контрольные задания
Представленные ниже задачи являются контрольным заданием. Решения необходимо оформить в электронном виде и предоставлять на проверку преподавателю.
Задачи на измерение информации
1. Измерьте информационный объем сообщения «Ура! Скоро Новый год!» в битах, байтах, килобайтах (Кб), мегабайтах (Мб).
Указание : считается, что текст набран с помощью компьютера, один символ алфавита несет 1 байт информации. Пробел – это тоже символ в алфавите мощностью 256 символов.
2. Измерьте примерную информационную емкость одной страницы любого своего учебника, всего учебника.
Указание: Для выполнения задания возьмите учебник по любимому предмету, посчитайте число строк на странице, число символов в строке, включая пробелы. Помните, что один символ алфавита несет 1 байт информации. Перемножив полученные значения, Вы найдете информационную емкость одной страницы учебника (в байтах).
3. Сколько таких учебников может поместиться на дискете 1,44 Мб, на винчестере в 1 Гб.
4. В детской игре «Угадай число» первый участник загадывает целое число от 1 до 32. Второй участник задает вопросы: «Загаданное число больше числа ___?». Какое количество вопросов при правильной стратегии гарантирует угадывание?
Указание: Вопрос задавайте таким образом, чтобы информационная неопределенность (чи сло вариантов) уменьшалась в два раза.
5. Яд находится в одном из 16 бокалов. Сколько единиц информации будет содержать сообщение о бокале с ядом?
6. Сколько бит информации несет сообщение о том, что из колоды в 32 карты достали «даму пик»?
7. Проводят две лотереи: «4 из 32» и «5 из 64» Сообщение о результатах какой из лотерей несет больше информации?
8. Информационное сообщение объемом 1.5 Кбайта содержит 3072 символа. Сколько символов содержит алфавит, при помощи которого было записано это сообщение? (Объяснение решения задачи на доске).
10. Скорость информационного потока – 20 бит/сек. Сколько времени потребуется для передачи информации объемом в 10 килобайт.
11. Сравните (поставьте знак отношения)
200 байт и 0,25 Кбайт.
3 байта и 24 бита.
1536 бит и 1,5 Кбайта.
1000 бит и 1 Кбайт.
8192 байта и 1 Кбайт.
12. В барабане для розыгрыша лотереи находится 32 шара. Сколько информации содержит сообщение о первом выпавшем номере (например, выпал номер 15)?
13. При игре в кости используется кубик с шестью гранями. Сколько бит информации получает игрок при каждом бросании кубика?
14. Книга, набранная с помощью компьютера, содержит 150 страниц; на каждой странице - 40 строк, в каждой строке - 60 символов. Каков объем информации в книге?
15. Подсчитайте объем информации, содержащейся в романе А. Дюма "Три мушкетера", и определите, сколько близких по объему произведений можно разместить на одном лазерном диске? (590 стр., 48 строк на одной странице, 53 символа в строке).
16. На диске объемом 100 Мбайт подготовлена к выдаче на экран дисплея информация: 24 строчки по 80 символов, эта информация заполняет экран целиком. Какую часть диска она занимает?
17. В школьной библиотеке 16 стеллажей с книгами. На каждом стеллаже 8 полок. Библиотекарь сообщил Пете, что нужная ему книга находится на пятом стеллаже на третьей сверху полке. Какое количество информации библиотекарь передал Пете?
18. В коробке лежат 7 цветных карандашей. Какое количество информации содержит сообщение, что из коробки достали красный карандаш?
19. Какое количество информации несет сообщение: “Встреча назначена на сентябрь”.
20. Сообщение занимает 3 страницы по 25 строк. В каждой строке записано по 60 символов. Сколько символов в использованном алфавите, если все сообщение содержит 1125 байтов?
21. Юстасу необходимо передать следующее сообщение:
Дорогой Алекс! От всей души поздравляю с
успешной сдачей экзамена по информатике.
Желаю дальнейших успехов. Ваш Юстас.
Пеленгатор определяет место передачи, если она длится не менее 3 минут. С какой скоростью (бит/с) Юстас должен передавать радиограмму?
22. Измерьте информационный объем сообщения “Ура! Закончились каникулы!!” (с точки зрения технического подхода, то есть не учитывая смысл сообщения). Выразите этот объем в битах, байтах, килобайтах.
23. Измерьте примерную информационную емкость 1 страницы учебника, всего учебника. Сколько таких учебников может поместиться на дискете емкостью 360 Кбайт, 1.44 Мбайт, на винчестере в 420 Мбайт, в 6,4Гбайт?
Информация как снятая неопределенность
24. Определите, сколько бит информации несет сообщение о том, что на светофоре горит зеленый свет.
25. Предположим, вероятность того, что вы получите за контрольную работу оценку “5”, равна 0,6; вероятность получения “4” равна 0,2; вероятность получения “3” - 0,2. Определите, сколько бит информации будет нести сообщение о результатах контрольной работы в каждом из возможных случаев.
26. Дано:
Кол-во цветов = 2
Размер картинки = 7*14 точек
27. Дано:
Кол-во цветов = 8
Размер картинки = 17*24 точки
28. Считая, что один символ кодируется одним байтом, подсчитать в байтах количество информации, содержащееся в фразе: “Терпение и труд все перетрут.
29. (Задание А2 демоверсии 2004 г.)
30. Считая, что каждый символ кодируется одним байтом, оцените информационный объём предложения: «Мой дядя самых честных правил, Когда не в шутку занемог, Он уважать себя заставил И лучше выдумать не мог.»
3)108 кбайт |
31. Шахматная доска состоит из 64 полей: 8 столбцов и 8 строк. Какое минимальное количество бит потребуется для кодирования координат одного шахматного поля?
32. Получено сообщение, информационный объём которого равен 32 битам. Чему равен этот объём в байтах?
33. Каждое показание счётчика, фиксируемое в памяти компьютера, занимает 10 бит. Записано 100 показаний этого датчика. Каков информационный объём снятых значений в байтах?
34. Для хранения растрового изображения размером 128*128 пикселей отвели 4 килобайта памяти. Каково максимально возможное число цветов в палитре изображения?
В нашем случае:
Подставив значения (8) и (9) в (5), получим, что: 2 15 = 2 14 *i, откуда i=2.
Тогда по формуле (6): <Количество цветов> =N = 2 i =2 2 =4, что соответствует ответу №4.
Ответ : 4.
35. Считая, что каждый символ кодируется одним байтом, оцените информационный объём следующего предложения в кодировке КОИ-8 (в байтах):
Сегодня метеорологи предсказывали дождь.
36. Считая, что каждый символ кодируется 16-ю битами, оцените информационный объём следующего предложения в кодировке Unicode (в байтах):
Каждый символ кодируется восемью битами.
37. Сколько существует различных последовательностей из символов «а» и «б» длиной ровно в 10 символов?
38. В зрительном зале две прямоугольные области зрительских кресел: одна 10х12, а другая 17х8. Какое минимальное количество бит потребуется для кодирования каждого места в автоматизированной системе?
39. Сообщение передано в семибитном коде. Каков его информационный объём в байтах, если известно, что передано 2000 символов?
40. В алфавите формального (искусственного) языка всего два знака-буквы («0» и «Х»). Каждое слово этого языка состоит всегда из пяти букв. Какое максимальное число слов возможно в этом языке?
41. Алфавит племени содержит всего 8 букв. Какое количество информации несет одна буква этого алфавита?
42. Имеется тест, объем которого 20 килобайт (на каждой странице теста 40 строк по 64 символа в строке, 1 символ занимает 8 бит). Определить количество страниц в тесте.
43. Сколько байт в 32 Гбайт?
Творческое задание.
Пусть имеется носитель информации на 1,44 мБайта. Необходимо записать на него фотографию с размерами 1024*768 пикс и глубиной цвета 24 бита. Получится ли сделать это? Если нет, то какую глубину цвета можно использовать? Сколько цветов она будет включать? Решение задачи оформите в среде ЭТ Excel.
Лабораторная работа №3. Шифрование текстовой информации.
Цель работы: исследование простейших методов криптографической зашиты информации.
Краткие сведения из теории.
Шифры простой замены
Система шифрования Цезаря - частный случай шифра простой замены. Метод основан на замене каждой буквы сообщения на другую букву того же алфавита, путем смещения от исходной буквы на K букв.
Известная фраза Юлия Цезаря
VENI VI D I VICI, где
пришел, увидел, победил, зашифрованная с помощью данного метода, преобразуется в
при смещении на 4 символа влево.
Греческим писателем Полибием за 100 лет до н.э. был изобретен так называемый полибианский квадрат размером 5*5, заполненный алфавитом в случайном порядке. Греческий алфавит имеет 24 буквы, а 25-м символом является пробел. Для шифрования на квадрате находили букву текста и записывали в зашифрованное сообщение букву, расположенную ниже ее в том же столбце. Если буква оказывалась в нижней строке таблицы, то брали верхнюю букву из того же столбца.
Схема шифрования Вижинера. Таблица Вижинера представляет собой квадратную матрицу с n 2 элементами, где n - число символов используемого алфавита. На рисунке показана верхняя часть таблицы Вижинера для кириллицы. Каждая строка получена циклическим сдвигом алфавита на символ. Для шифрования выбирается буквенный ключ, в соответствии с которым формируется рабочая матрица шифрования.
Объективный (алфавитный) подход к измерению информации
Теперь познакомимся с другим способом измерения информации. Этот способ не связывает количество информации с содержанием сообщения, и называется объективный или алфавитный подход.
При объективном подходе к измерению информации мы отказываемся от содержания информации, от человеческой важности для кого-то.
Информация рассматривается как последовательность символов, знаков (определение3 ).
Количество символов в сообщении называется длиной сообщения .
Основой любого языка является алфавит.
Алфавит – это набор знаков (символов), в котором определен их порядок.
Полное число символов алфавита принято называть мощностью алфавита. Обозначим эту величину буквой M.
Например, мощность алфавита из русских букв равна 33:
мощность алфавита из английских букв равна 26.
При алфавитном подходе к измерению информации количество информации от содержания не зависит. Количество информации зависит от объема текста (т.е. от числа знаков в тексте) и от мощности алфавита. Тогда информацию можно обрабатывать, передавать, хранить.
Каждый символ несет x бит информации. Количество информации x, которое несет один символ в тексте, зависит от мощности алфавита M, которые связаны формулой 2 x = M. Следовательно x = log 2 M бит.
Количество информации в тексте, состоящем из K символов, равно K*x или
K* log 2 M, где x – информационный вес одного символа алфавита.
Удобнее измерять информацию, когда мощность алфавита M равна целой степени числа 2. Для вычислительной системы, работающей с двоичными числами, также более удобно представление чисел в виде степени двойки.
Пример_6 , в 2-символьном алфавите каждый символ несет 1 бит информации (2 x = 2, откуда x = 1 бит).
Если M=16, то каждый символ несет 4 бита информации, т.к. 2 4 = 16.
Если M=32, то один символ несет 5 бит информации.
При M=64, один символ «весит» 6 бит и т.д.
Пример_7: Племя “Обезьяны” пишет письма, пользуясь 32-символьным алфавитом. Племя “Слоны” пользуется 64-символьным алфавитом. Вожди племен обменялись письмами. Письмо племени “Обезьяны” содержало 90 символов, а письмо племени “Слоны” – 80 символов. Сравните объем информации, содержащейся в письмах.
Решение: Мощность алфавита племени “Обезьяны” равна 32, информационный вес одного символа алфавита log 2 32 = 5 бит. Количество информации в тексте, состоящем из 90 символов, равно 90*log 2 32 = 450 бит.
Рассуждая аналогично про племя “Слоны”, получим: 80*log 2 64 = 480 бит.
Следовательно, объем информации в письме вождя племени “Слоны” больше объема информации, которую передал в письме вождь племени “Обезьяны”.
Есть алфавит, который можно назвать достаточным. Это алфавит мощностью 256 символов. Алфавит из 256 символов используется для представления текстов в компьютере. В этом алфавите можно поместить практически все необходимые символы: латинские и русские буквы, цифры, знаки арифметических операций, скобки, знаки препинания, знаки псевдографики. Поскольку 256=2 8 , то один символ этого алфавита «весит» 8 бит.
8 бит информации присвоили свое название – байт .
Байт – поле из 8 последовательных бит. Байт широко используется как единица измерения количества информации.
1 байт = 8 бит
Компьютерные текстовые редакторы работают с алфавитом мощности 256 символов. Поскольку в настоящее время при подготовке книг используются текстовые редакторы, легко посчитать объем информации в тексте.
Если один символ алфавита несет 1 байт информации, то надо просто сосчитать число символов, полученное значение даст информационный объем текста в байтах.
В любой системе единиц измерения существуют основные единицы и производные от них.
Для измерения больших объемов информации используются производные от байта единицы:
1 килобайт = 1 Кб = 2 10 байт = 1024 байта
1 мегабайт = 1 Мб = 2 10 Кб = 1024 Кб = 1048576 байт
1 гигабайт = 1 Гб = 2 10 Мб = 1024 Мб = 1048576 Кб = 1073741824 байт
Пример_8: Книга, набранная с использованием текстового редактора, содержит 70 страниц, на каждой странице 38 строк, в каждой строке 56 символов. Определить объем информации, содержащейся в книге.
Решение: Мощность компьютерного алфавита равна 256 символов. Один символ несет 1 байт информации. Значит 1 страница содержит 38*56=2128 байт информации. Объем всей информации в книге 2128*70=148960 байт.
Если оценить объем книги в килобайтах и мегабайтах, то
148960/1024 = 145,46875 Кбайт.
145,46875/1024 = 0,142059 Мбайт.
Алфавитный подход является объективным способом измерения информации в отличие от субъективного, содержательного, подхода. Только алфавитный подход пригоден при использовании технических средств работы с информацией.
В заключении следует отметить, что мы рассмотрели только два подхода к измерению количества информации. Наряду с этим, существуют и другие подходы, но это уже материал другой статьи.
Контрольные задания
Представленные ниже задачи являются контрольным заданием. Решения необходимо оформить в электронном виде и предоставлять на проверку преподавателю.
Задачи на измерение информации
1. Измерьте информационный объем сообщения «Ура! Скоро Новый год!» в битах, байтах, килобайтах (Кб), мегабайтах (Мб).
Указание : считается, что текст набран с помощью компьютера, один символ алфавита несет 1 байт информации. Пробел – это тоже символ в алфавите мощностью 256 символов.
2. Измерьте примерную информационную емкость одной страницы любого своего учебника, всего учебника.
Указание: Для выполнения задания возьмите учебник по любимому предмету, посчитайте число строк на странице, число символов в строке, включая пробелы. Помните, что один символ алфавита несет 1 байт информации. Перемножив полученные значения, Вы найдете информационную емкость одной страницы учебника (в байтах).
3. Сколько таких учебников может поместиться на дискете 1,44 Мб, на винчестере в 1 Гб.
4. В детской игре «Угадай число» первый участник загадывает целое число от 1 до 32. Второй участник задает вопросы: «Загаданное число больше числа ___?». Какое количество вопросов при правильной стратегии гарантирует угадывание?
Указание: Вопрос задавайте таким образом, чтобы информационная неопределенность (чи сло вариантов) уменьшалась в два раза.
5. Яд находится в одном из 16 бокалов. Сколько единиц информации будет содержать сообщение о бокале с ядом?
6. Сколько бит информации несет сообщение о том, что из колоды в 32 карты достали «даму пик»?
7. Проводят две лотереи: «4 из 32» и «5 из 64» Сообщение о результатах какой из лотерей несет больше информации?
8. Информационное сообщение объемом 1.5 Кбайта содержит 3072 символа. Сколько символов содержит алфавит, при помощи которого было записано это сообщение? (Объяснение решения задачи на доске).
10. Скорость информационного потока – 20 бит/сек. Сколько времени потребуется для передачи информации объемом в 10 килобайт.
11. Сравните (поставьте знак отношения)
200 байт и 0,25 Кбайт.
3 байта и 24 бита.
1536 бит и 1,5 Кбайта.
1000 бит и 1 Кбайт.
8192 байта и 1 Кбайт.
12. В барабане для розыгрыша лотереи находится 32 шара. Сколько информации содержит сообщение о первом выпавшем номере (например, выпал номер 15)?
13. При игре в кости используется кубик с шестью гранями. Сколько бит информации получает игрок при каждом бросании кубика?
14. Книга, набранная с помощью компьютера, содержит 150 страниц; на каждой странице - 40 строк, в каждой строке - 60 символов. Каков объем информации в книге?
15. Подсчитайте объем информации, содержащейся в романе А. Дюма "Три мушкетера", и определите, сколько близких по объему произведений можно разместить на одном лазерном диске? (590 стр., 48 строк на одной странице, 53 символа в строке).
16. На диске объемом 100 Мбайт подготовлена к выдаче на экран дисплея информация: 24 строчки по 80 символов, эта информация заполняет экран целиком. Какую часть диска она занимает?
17. В школьной библиотеке 16 стеллажей с книгами. На каждом стеллаже 8 полок. Библиотекарь сообщил Пете, что нужная ему книга находится на пятом стеллаже на третьей сверху полке. Какое количество информации библиотекарь передал Пете?
18. В коробке лежат 7 цветных карандашей. Какое количество информации содержит сообщение, что из коробки достали красный карандаш?
19. Какое количество информации несет сообщение: “Встреча назначена на сентябрь”.
20. Сообщение занимает 3 страницы по 25 строк. В каждой строке записано по 60 символов. Сколько символов в использованном алфавите, если все сообщение содержит 1125 байтов?
21. Юстасу необходимо передать следующее сообщение:
Дорогой Алекс! От всей души поздравляю с
успешной сдачей экзамена по информатике.
Желаю дальнейших успехов. Ваш Юстас.
Пеленгатор определяет место передачи, если она длится не менее 3 минут. С какой скоростью (бит/с) Юстас должен передавать радиограмму?
22. Измерьте информационный объем сообщения “Ура! Закончились каникулы!!” (с точки зрения технического подхода, то есть не учитывая смысл сообщения). Выразите этот объем в битах, байтах, килобайтах.
23. Измерьте примерную информационную емкость 1 страницы учебника, всего учебника. Сколько таких учебников может поместиться на дискете емкостью 360 Кбайт, 1.44 Мбайт, на винчестере в 420 Мбайт, в 6,4Гбайт?
Информация как снятая неопределенность
24. Определите, сколько бит информации несет сообщение о том, что на светофоре горит зеленый свет.
25. Предположим, вероятность того, что вы получите за контрольную работу оценку “5”, равна 0,6; вероятность получения “4” равна 0,2; вероятность получения “3” - 0,2. Определите, сколько бит информации будет нести сообщение о результатах контрольной работы в каждом из возможных случаев.
26. Дано:
Кол-во цветов = 2
Размер картинки = 7*14 точек
27. Дано:
Кол-во цветов = 8
Размер картинки = 17*24 точки
28. Считая, что один символ кодируется одним байтом, подсчитать в байтах количество информации, содержащееся в фразе: “Терпение и труд все перетрут.
29. (Задание А2 демоверсии 2004 г.)
30. Считая, что каждый символ кодируется одним байтом, оцените информационный объём предложения: «Мой дядя самых честных правил, Когда не в шутку занемог, Он уважать себя заставил И лучше выдумать не мог.»
|
3)108 кбайт |
31. Шахматная доска состоит из 64 полей: 8 столбцов и 8 строк. Какое минимальное количество бит потребуется для кодирования координат одного шахматного поля?
32. Получено сообщение, информационный объём которого равен 32 битам. Чему равен этот объём в байтах?
33. Каждое показание счётчика, фиксируемое в памяти компьютера, занимает 10 бит. Записано 100 показаний этого датчика. Каков информационный объём снятых значений в байтах?
34. Для хранения растрового изображения размером 128*128 пикселей отвели 4 килобайта памяти. Каково максимально возможное число цветов в палитре изображения?
Решение.
Воспользуемся формулами:
В нашем случае:
|
4 Кб = 4*2 10 байт = 2 2 *2 10 байт = 2 12 байт = 8*2 12 бит = 2 3 *2 12 бит = 2 15 бит |
|
|
128*128 = 2 7 *2 7 =2 14 . |
Подставив значения (8) и (9) в (5), получим, что: 2 15 = 2 14 *i, откуда i=2.
Тогда по формуле (6): =N = 2 i =2 2 =4, что соответствует ответу №4.
Ответ : 4.
35. Считая, что каждый символ кодируется одним байтом, оцените информационный объём следующего предложения в кодировке КОИ-8 (в байтах):
Сегодня метеорологи предсказывали дождь.
36. Считая, что каждый символ кодируется 16-ю битами, оцените информационный объём следующего предложения в кодировке Unicode (в байтах):
Каждый символ кодируется восемью битами.
37. Сколько существует различных последовательностей из символов «а» и «б» длиной ровно в 10 символов?
38. В зрительном зале две прямоугольные области зрительских кресел: одна 10х12, а другая 17х8. Какое минимальное количество бит потребуется для кодирования каждого места в автоматизированной системе?
39. Сообщение передано в семибитном коде. Каков его информационный объём в байтах, если известно, что передано 2000 символов?
40. В алфавите формального (искусственного) языка всего два знака-буквы («0» и «Х»). Каждое слово этого языка состоит всегда из пяти букв. Какое максимальное число слов возможно в этом языке?
41. Алфавит племени содержит всего 8 букв. Какое количество информации несет одна буква этого алфавита?
42. Имеется тест, объем которого 20 килобайт (на каждой странице теста 40 строк по 64 символа в строке, 1 символ занимает 8 бит). Определить количество страниц в тесте.
43. Сколько байт в 32 Гбайт?
Сегодня, конечно, интересные, но в то же время и трудные времена для индустрии накопителей. Переход на мультимедийные форматы высокого разрешения существенно улучшил визуальную составляющую, но и сказался соответствующим образом на требованиях к подсистемам хранения данных. Объёмы цифрового звука, видео и фотографий постоянно увеличиваются, что требует от накопителей всё большей ёмкости. Поэтому сегодня 3,5" винчестеры уже достигли 750 Гбайт. К сожалению, производительность с такой же скоростью расти не может.
В индустрии наступила череда поглощений. Maxtor несколько лет назад купила Quantum, после чего компания объединилась с Seagate. На рынке настольных жёстких дисков ещё остались Hitachi, Samsung и Western Digital.
Seagate сегодня лидирует по ёмкости, обеспечив 750 Гбайт для 3,5" накопителя Barracuda 7200.10, Samsung славится тихой работой и хорошим соотношением ёмкость/цена. Жёсткие диски Western Digital Raptor на 10 000 об/мин уже несколько лет лидируют по производительности, хотя изначально они позиционировались на профессиональный рынок начального уровня. А Samsung, наконец-то, может существенно уйти вперёд благодаря выпуску гибридных жёстких дисков. Это единственная компания в четвёрке, занимающаяся производством не только жёстких дисков, но и флэш-памяти.
Все современные 3,5" накопители обладают максимальной скоростью чтения не меньше 55 Мбайт/с, а время доступа составляет 15 мс или меньше. Самые скоростные модели по максимальной скорости превышают 70 Мбайт/с, а время доступа, в среднем, составляет 13 мс. Жёсткие диски Western Digital Raptor дают скорость более 85 Мбайт/с с очень низким временем доступа 8 мс. Идеальный вариант, если вы хотите получить быстрый запуск приложений или просто более быструю загрузку Windows. Хотя за это придётся заплатить более высокой ценой и меньшей ёмкостью по сравнению с традиционными моделями. Если вам интересна производительность современных жёстких дисков, познакомьтесь с обзорами в нашем разделе .
Конечно, у многих возникнет вопрос: что все эти числа означают на практике? Как сравнить жёсткий диск с другими компонентами в ПК? Насколько производительность современных винчестеров отличается от старых? Сможет ли современный жёсткий диск легко обойти старые модели?
На этот раз мы решили добавить в наше тестирование старые жёсткие диски. Да, мы постарались найти действительно древние модели. Что интересно, они до сих пор прекрасно работают, несмотря на то, что родились в эру MS DOS 5.0 и Windows 3.1.
Жёсткие диски: от 40 Мбайт до 750 Гбайт, от 3 500 до 10 000 об/мин
Мы решили вернуться лет на 15 назад, когда только начали появляться жёсткие диски IDE с весьма приличным по тогдашним меркам объёмом в 40 Мбайт. Затем мы взяли модель середины 90-х годов (3,2 Гбайт), потом увеличили ёмкость до двузначного числа (10 Гбайт) и, наконец, модернизировали жёсткий диск до 60 Гбайт. Современные модели представляют лидеры рынка жёстких дисков: Seagate Barracuda 7200.10 на 750 Гбайт и Western Digital Raptor RD1500 на 150 Гбайт и 10 000 об/мин.
| Производитель | Maxtor | Quantum | IBM | Seagate | Seagate | Western Digital |
| Продукт | 7000 Series IDE 3524 | Fireball ST | Deskstar 16GP | Barracuda IV | Barracuda | WD Raptor |
| Модельный номер | 7040A | ST3.2A | DTTA-351010 | ST360021A | 7200.10 | WD1500ADFD |
| Ёмкость | 40 Мбайт | 3,2 Гбайт | 10,1 Гбайт | 60 Гбайт | 750 Гбайт | 150 Гбайт |
| Скорость вращения шпинделя | 3524 об/мин | 5400 об/мин | 5400 об/мин | 7200 об/мин | 7200 об/мин | 10 000 об/мин |
| Другие варианты ёмкости | 60 - 130 Мбайт | 1,6, 2,1, 3,2, 4,3, 6,4 Гбайт | 3,2, 4,3, 6,4, 8,4, 10,1, 12,9, 16,8 Гбайт | 20, 40, 60, 80 Гбайт | 500, 400, 320, 300, 250, 200 Гбайт | 74, 36 Гбайт |
| Число пластин | 3 | 2 | 3 | 2 | От 1 до 4 | От 1 до 4 |
| Число головок | 5 | 4 | 6 | 3 | 8 | 8 |
| Ёмкость на пластину | 26 Мбайт | 1,6 Гбайт | 5,6 Гбайт | 40 Гбайт | 200 Гбайт | 37,5 Гбайт |
| Кэш | 32 - 64 кбайт | 128 кбайт | 512 кбайт | 2 Мбайт | 16 Мбайт | 16 Мбайт |
| Интерфейс | IDE | UltraATA/33 | UltraATA/33 | UltraATA/100 | SATA/300 | SATA/150 |
| Дата производства | 1991 | 1996 | Jul-98 | 2003 | 2006 | 2006 |

Перед нами жёсткий диск на 40 Мбайт (да, мегабайт) с тремя пластинами, вращающимися со скоростью 3500 об/мин. Интерфейс - обычный IDE. Жёсткий диск изготовлен в 1991 году, и в то время это была вполне средняя модель. Топовый жёсткий диск Maxtor из линейки 7000 имел ёмкость 130 Мбайт, распределённую по восьми пластинам. В жёсткий диск было интегрировано 32 или 64 кбайт кэш-памяти, в зависимости от модели. Спецификации всё ещё есть на web-сайте Maxtor , если хорошо поискать.
Ёмкость 130 Мбайт у топовой модели была тогда пределом, хотя достаточно быстро объём увеличился до 170 и 240 Мбайт. Что любопытно, все жёсткие диски в то время стоили несколько сотен долларов. Сегодня вы получаете в тысячу раз большую ёмкость, причём, дешевле!
Жёсткий диск слишком старый, поэтому PCMark05 отказался проводить на нём тесты. Но мы смогли запустить тест c"t magazine h2benchw 3.6. Среднее время доступа 7040A составило 27 мс, что кажется просто вечностью по сравнению с 8-15 мс у современных 3,5" винчестеров. Пропускная способность интерфейса составляет 800 кбайт/с (0,8 Мбайт/с) против нынешних 80-200 Мбайт/с. Реальная производительность чтения тоже близка к этому значению: h2benchw показал 600-700 кбайт/с, что можно сравнить с четырёхкратной скоростью CD-ROM. Любой современный накопитель, вполне естественно, обгоняет жёсткий диск 1991 года.



Quantum Fireball появился через пять лет после 40-Мбайт жёсткого диска Maxtor, рассмотренного выше. Ёмкость составляла от 1,6 до 6,4 Гбайт. Как нетрудно предположить, у нового поколения появились некоторые улучшения. Fireball ST 3.2A обзавёлся удвоенным кэшем (128 кбайт) и получил более высокую скорость вращения шпинделя - 5 400 об/мин. Привод оказался одним из первых, оснащенных интерфейсом UltraATA на 33 Мбайт/с, кроме того, он впервые стал использовать магниторезистивные головки чтения/записи.
Пропускная способность интерфейса составляла 31,3 Мбайт/с, что очень близко к теоретическому максимуму, а внутренняя скорость передачи данных была заявлена в 132 Мбит/с (около 16 Мбайт/с). В реальности мы получили почти 10 Мбайт/с. Если посчитать, этот жёсткий диск предлагает в 80 раз большую ёмкость, чем модель Maxtor. Или в 50 раз большую, если сравнивать 6,4-Гбайт Fireball с топовой 130-Мбайт моделью Maxtor. Скорость же возросла примерно в 13 раз.
Примерно в это же время пользователи начали прощаться со старой 16-битной файловой системой FAT в пользу FAT 32 у Windows 95, NTFS у Windows NT, HPFS у OS/2 или ext2 у Linux. FAT16 построена на 16-битной адресации кластеров. Кластер - это минимальный элемент диска, который понятен контроллеру. Один кластер FAT 16 вмещал, максимум, 32 кбайт, что при 65 536 возможных адресах (2 16) давало максимальный объём 2 097 152 байта или 2 Гбайт.
Конечно, это ограничение можно было обойти, создавая несколько разделов, но лучшим решением всё же стала новая файловая система FAT 32, у которой адресация кластеров была увеличена с 16 до 28 бит. Это позволяло адресовать миллионы кластеров размером от 4 до 32 кбайт, в зависимости от объёма раздела. FAT 32 теоретически поддерживает разделы до 2 Тбайт (терабайт, тысяча гигабайт), но поскольку при высокой ёмкости раздела непомерно увеличивается размер таблицы FAT 32 (256 Мбайт в случае раздела на 2048 Гбайт), и по причинам других ограничений лучше использовать более современную файловую систему. Например, журнальные системы NTFS под Windows XP или ext3 под Linux.



Выпустив линейку DeskStar 16GP, компания IBM, в то время ещё занимавшаяся производством жёстких дисков, представила гигантские магниторезистивные головки (Giant Magneto-Resistive, GMR), важный шаг для преодоления ёмкости 10 Гбайт на винчестер. Действительно, объявление более чувствительных GMR-головок позволило увеличить максимальную ёмкость жёсткого диска в линейках IBM от почти 9 Гбайт до 16,8 Гбайт.
Эта линейка жёстких дисков поставлялась с разными ёмкостями: 3,2, 4,3, 6,4, 8,4, 10,1, 12,9 и 16,8 Гбайт и использовала до трёх пластин. Жёсткие диски оснащались 512 кбайт кэша и интерфейсом UltraATA/33. DTTA-351010 показал максимальную скорость передачи данных 12,4 Мбайт/с, в то время как пропускная способность интерфейса составила 31,4 Мбайт/с.



Жёсткие диски Seagate Barracuda с ёмкостью от 6,8 до 26 Гбайт были первыми моделями для настольных ПК со скоростью вращения 7 200 об/мин. Но первое поколение было довольно шумным, да и грелись винчестеры ощутимо. Второе и третье поколения существенно улучшились в этих отношениях, а ёмкость возросла до 40 Гбайт. Но только четвёртое поколение настольных жёстких дисков на 7 200 об/мин оказалось действительно быстрым и тихим.
Линейка Barracuda ATA IV отличалась большей плотностью записи данных, что позволило Seagate достичь ёмкости до 80 Гбайт всего с двумя пластинами. Кроме того, отличительной особенностью этой линейки стала металлическая пластина снизу, которая защищала электронику диска. Seagate назвала её Seashield, очень похоже на название пластиковой упаковки Seashell. Впрочем, позднее от Seashield пришлось отказаться по ценовым соображениям.
Четвёртая "барракуда" оказалась в числе одного из последних поколений приводов, выпускавшихся только для параллельного интерфейса ATA, поскольку в конце 2003 года было объявлено пятое поколение Barracuda ATA V с поддержкой интерфейса Serial ATA и ёмкостью до 120Гбайт. Все накопители Barracuda пятого поколения и выше используют интерфейс Serial ATA или UltraATA/100 (как эта модель).


Seagate Barracuda 7200.10 на 750 Гбайт и WD Raptor WD1500, 150 Гбайт (2006)
Перед нами два относительно новых жёстких диска. Чтобы не повторяться и не рассказывать вновь их характеристики, мы приведём ссылки на соответствующие обзоры.
- Seagate Barracuda 7200.10 750 Гбайт: превосходная ёмкость и производительность
- Жёсткий диск WD1500AD Raptor-X: лидер по производительности для настольных ПК

Повышение плотности записи впечатляет: за последние 15 лет она увеличилась в 10 000 раз!

Индустрия жёстких дисков по-прежнему ищет способы увеличения плотности записи. Последняя технология перпендикулярной записи (Perpendicular Magnetic Recording, PMR) построена на вертикальной ориентации магнитных доменов вместо горизонтальной, что позволяет хранить больше битов на той же площади.

Если взять максимальную ёмкость 130 Мбайт для 1991 года и сравнить с современными жёсткими дисками на 750 Гбайт, то можно посчитать: за последние 15 лет ёмкость увеличилась в 5 700 раз. Если же сравнивать ёмкость пластин, то разница будет ещё больше.
Как видим, прогресс плотности записи оказался весьма существенным. К сожалению, производительность жёстких дисков росла далеко не такими же темпами.

Если сравнить производительность жёсткого диска Maxtor 1991 года (0,7 Мбайт/с) с современным винчестером Barracuda 7200.10 на 750 Гбайт (64 Мбайт/с), то мы получим увеличение 91x. Если же сравнивать с 85 Мбайт/с у жёсткого диска WD Raptor на 10 000 об/мин, то мы получим улучшение в 121 раз.
Звучит не слишком радостно. А теперь примем во внимание средний размер файлов и программ. Если исполняемый файл Microsoft Word раньше занимал не больше нескольких мегабайт и ещё меньше места в ОЗУ, то современные приложения с лёгкостью "осваивают" десятки мегабайт. И вызывают дополнительный код в виде плагинов, библиотек и расширений. Например, Adobe Photoshop CS2 потребляет больше 60 Мбайт ОЗУ, причём, большую часть этой информации нужно считать с жёсткого диска. Или подумайте о фотографиях: лет десять назад мы работали с JPEG-файлами размером 640x480 и объёмом в несколько десятков килобайт. Сегодня мы уже не удивляемся фотографиям в несколько мегабайт с разрешением 3872x2592.
Плотность записи и производительность
Если сравнить рост плотности записи с ростом производительности, то сразу же становится заметно несоответствие: почти в 6 000 раз большая ёмкость и всего в 100 раз увеличенная производительность. Другими словами, ёмкость росла быстрее производительности в 60 раз! Что же говорят результаты нашего тестирования?

Посмотрите на результаты. Они наглядно показывают, что хотя производительность жёсткого диска в абсолютных значениях возросла, производительность относительно ёмкости жёсткого диска существенно снизилась ! С этой точки зрения современные жёсткие диски ничуть не быстрее старых моделей. Судите сами.
В 1991 году у 40-Мбайт жёсткого диска на считывание ёмкости одной пластины (26 Мбайт) уходило 37 секунд.
В 1998 году у 3,2-Гбайт жёсткого диска на считывание ёмкости одной пластины (1,6 Гбайт) уходило 3 минуты и 31 секунда.
В 1999 году у 10-Гбайт жёсткого диска на считывание ёмкости одной пластины (3,2 Гбайт) уходило 5 минут и 37 секунд.
В 2004 году у 60-Гбайт жёсткого диска на считывание ёмкости одной пластины (40 Гбайт) уходило 18 минут и 34 секунды.
В 2006 году у 750-Гбайт жёсткого диска на считывание ёмкости одной пластины (200 Гбайт) уходило 52 минуты.
Конечно, это сравнение сильно упрощено и не принимает во внимание другие факторы, например, число и диаметр пластин, скорость вращения и средний размер файлов. Результаты также окажутся иными, если для сравнения взять другие жёсткие диски и другие ёмкости. Но тенденция будет такой же: время, которое требуется для заполнения или считывания полного жёсткого диска, за последние 15 лет существенно возросло.

За те же 15 лет на рынке жёстких дисков произошла череда покупок и слияний. Maxtor несколько лет назад купила Quantum, а к концу 2006 года Seagate завершит слияние с Maxtor.
Почему производительность жёсткого диска столь важна?
На этот вопрос с лёгкостью может ответить любой пользователь: просто включите ваш ПК или ноутбук, после чего вы заметите, что большая часть задержек и ожиданий связана со считыванием данных с жёсткого диска. При запуске Windows считывает информацию и заполняет оперативную память. И хотя время загрузки ОС за последние годы уменьшилось (частично, благодаря оптимизации BIOS), и некоторые ПК запускаются за 15-20 секунд, жёсткие диски являются тем самым "узким местом", которое ощутимо ограничивает производительность ПК.
Кому нравится ждать 30 или больше секунд, пока компьютер загружается? А ждать 20 секунд, пока запустится игра или программа? Да и несколько секунд, которые требуются на закрытие приложения, тоже не лучший вариант.
Ещё одна важная проблема - резервирование. На считывание всего жёсткого диска теперь уходит почти вечность. Сколько же времени требуется для резервирования? За последние годы, вместе с ростом объёмов пользовательских данных, время их резервирования тоже возрастает. Если документы можно скопировать достаточно быстро, то как быть с пользовательскими базами фотографий, видео и музыки?
Тестовая конфигурация
| Системное аппаратное обеспечение | |
| Процессоры | 2x Intel Xeon (ядро Nocona), 3,6 ГГц, FSB800, кэш L2 1 Мбайт |
| Платформа | Asus NCL-DS (Socket 604), чипсет Intel E7520, BIOS 1005 |
| Память | Corsair CM72DD512AR-400 (DDR2-400 ECC, reg.), 2x 512 Мбайт, задержки CL3-3-3-10 |
| Системный жёсткий диск | Western Digital Caviar WD1200JB, 120 Гбайт, 7200 об/мин, кэш 8 Мбайт, UltraATA/100 |
| Контроллеры накопителей | Intel 82801EB UltraATA/100 (ICH5) Silicon Image Sil3124, PCI-X |
| Сеть | Встроенный контроллер Broadcom BCM5721 Gigabit Ethernet |
| Видеокарта | Встроенная ATi RageXL, 8 Мбайт |
| Тесты и настройки | |
| Тесты производительности | c"t h2benchw 3.6 |
| Тесты ввода/вывода | IOMeter 2003.05.10 Fileserver-Benchmark Webserver-Benchmark Database-Benchmark Workstation-Benchmark |
| Системное ПО | |
| ОС | Microsoft Windows Server 2003 Enterprise Edition, Service Pack 1 |
| Драйвер платформы | Intel Chipset Installation Utility 7.0.0.1025 |
| Графический драйвер | Default Windows Graphics Driver |
Любому современному жёсткому диску вполне по силам справиться с вашими повседневными данными. И большинство из них дают достаточно хорошую скорость для повседневных задач. Но если вы не любите ждать, ваш бюджет не ограничен студенческой стипендией, или ваши требования попросту высоки, то без жёсткого диска Western Digital Raptor на 10 000 об/мин вряд ли обойтись. Всем остальным можно порекомендовать приличную модель на 7 200 об/мин, она и стоит дешевле, да и ёмкость даёт хорошую.
За последние пятнадцать лет ёмкость жёстких дисков возрастала быстрее производительности больше, чем на порядок! Именно поэтому жёсткие диски сегодня являются наиболее "узким местом" вашего ПК. Будете вы загружать или выключать компьютер, запускать приложения и игры, записывать или считывать файлы, переносить большие объёмы данных, вы сразу же заметите, как производительность упирается в жёсткий диск. Быстрые винчестеры и интерфейсы уменьшают томительное ожидание, но даже высокопроизводительные RAID-массивы на несколько жёстких дисках не позволяют от него избавиться.
В любом случае, обвинять здесь некого. Напротив, мы должны оценить всю ту работу и гений инженеров и учёных в компаниях-производителях жёстких дисков, которые пытаются выжать ёмкость, а вместе с ней и производительность из технологии, по своей сути, не изменившейся за последние 50 лет. (Накопитель IBM 305 RAMAC был объявлен в 1956 году.)
Перспективы
Ситуация с производительностью вряд ли изменится, если в области технологий не произойдёт революции. Пока жёсткие диски построены на вращающихся пластинах, мы вряд ли обойдём ограничения этого физического механизма. К счастью, жёсткие диски нового поколения построены на технологии перпендикулярной записи, которая позволяет создавать жёсткие диски с ёмкостью в несколько терабайт и ещё сильнее выжать из них производительность.
Windows Vista улучшит ситуацию с программной стороны. У новой ОС реализованы умные технологии предсказания и кэширования, например, SuperFetch, которые позволяют загрузить любимые приложения пользователя в кэш ОЗУ, в результате чего время запуска заметно снижается. Другие технологии, например, жёсткие диски на основе флэш-памяти, снижают до минимума время доступа, но только за счёт высокой цены за гигабайт. Кроме того, флэш-накопители пока не способны обойти жёсткие диски по скорости передачи данных.
32-Гбайт флэш-винчестер Samsung Flash SSD: прощайте, жёсткие диски Deskstar - ATA/IDE Desktop Hard Disk Drives