Статья
ученика
10
класса
Титова
Никиты
Кодирование информации.
Кодирование
информации – это процесс формирования определенного представления информации.
В более узком смысле под
термином «кодирование» часто понимают переход от одной формы представления
информации к другой, более удобной для хранения, передачи или обработки.
Компьютер может обрабатывать
только информацию, представленную в числовой форме. Вся другая информация
(звуки, изображения, показания приборов и т. д.) для обработки на компьютере
должна быть преобразована в числовую форму. Например, чтобы перевести в числовую
форму музыкальный звук, можно через небольшие промежутки времени измерять
интенсивность звука на определенных частотах, представляя результаты каждого
измерения в числовой форме. С помощью компьютерных программ можно
преобразовывать полученную информацию, например «наложить» друг на друга звуки
от разных источников.
Аналогично на компьютере можно
обрабатывать текстовую информацию. При вводе в компьютер каждая буква кодируется
определенным числом, а при выводе на внешние устройства (экран или печать) для
восприятия человеком по этим числам строятся изображения букв. Соответствие
между набором букв и числами называется кодировкой символов.
Как правило, все числа в
компьютере представляются с помощью нулей и единиц (а не десяти цифр, как это
привычно для людей). Иными словами, компьютеры обычно работают в двоичной системе
счисления, поскольку при этом устройства для их обработки получаются значительно
более простыми.
Единицы
измерения информации. Бит. Байт.
Бит – наименьшая единица
представления информации. Байт – наименьшая единица обработки и передачи
информации.
Решая различные задачи, человек использует информацию об окружающем нас мире.
Часто приходится слышать, что сообщение несет мало информации или, наоборот,
содержит исчерпывающую информацию, при
этом разные люди, получившие одно и то же сообщение (например, прочитав статью в
газете), по-разному оценивают количество информации, содержащейся в нем. Это
означает, что знания людей об этих событиях (явлениях) до получения сообщения
были различными. Количество информации в сообщении, таким образом, зависит от
того, насколько ново это сообщение для получателя. Если в результате получения
сообщения достигнута полная ясность в данном вопросе (т.е. неопределенность
исчезнет), говорят, что получена исчерпывающая информация. Это означает, что нет
необходимости в дополнительной информации на эту тему.
Напротив, если после получения сообщения неопределенность осталась прежней
(сообщаемые сведения или уже были известны, или не относятся к делу), значит,
информации получено не было (нулевая информация).
В компьютерной технике бит
соответствует физическому состоянию носителя информации: намагничено – не
намагничено, есть отверстие – нет отверстия. При этом одно состояние принято
обозначать цифрой 0, а другое – цифрой 1. Выбор одного из двух возможных
вариантов позволяет также различать логические истину и ложь.
Последовательностью битов можно закодировать текст, изображение, звук или
какую-либо другую информацию. Такой метод представления информации называется
двоичным кодированием (binary
encoding).
Подбрасывание монеты и слежение за ее падением дает определенную информацию. Обе
стороны монеты «равноправны», поэтому одинаково вероятно, что выпадет как одна,
так и другая сторона. В таких случаях говорят, что событие несет информацию в 1
бит.
Если положить в мешок два
шарика разного цвета, то, вытащив вслепую один шар, мы также получим информацию
о цвете шара в 1 бит.
Единица измерения информации
называется бит (bit) – сокращение от английских слов binary digit, что
означает двоичная цифра.
В информатике часто
используется величина, называемая байтом (byte) и равная 8 битам. И если бит
позволяет выбрать один вариант из двух возможных, то байт, соответственно, 1 из
256 (28). Наряду с байтами для измерения количества информации
используются более крупные единицы:
1 Кбайт (один килобайт) = 210 байт
= 1024 байта;
1 Мбайт (один мегабайт) = 210 Кбайт
= 1024 Кбайта;
1 Гбайт (один гигабайт) = 210 Мбайт
= 1024 Мбайта.
Например, книга содержит 100 страниц; на каждой странице – 35 строк, в
каждой строке – 50 символов. Объем информации, содержащийся в книге,
рассчитывается следующим образом:
Для кодирования одного символа используется 1бай.
Страница содержит 35 × 50 =
1750 байт информации. Объем всей информации в книге:
1750 × 100 = 175 000 байт.
175 000 / 1024 = 170,8984
Кбайт.
170,8984 / 1024 = 0,166893
Мбайт.
Ответ:
0,166893 Мбайт.
Кодирование чисел.
Есть
два основных формата представления чисел в памяти компьютера. Один из них
используется для кодирования целых чисел, второй (так называемое представление
числа в формате с плавающей точкой),
второй
используется для задания действительных чисел.
Множество целых чисел,
представимых в памяти ЭВМ, ограничено. Диапазон значений зависит от размера
области памяти, используемой для размещения чисел. В k-разрядной
ячейке может храниться 2k различных
значений целых чисел.
Чтобы получить внутреннее
представление целого положительного числа N,
хранящегося в k-разрядном
машинном слове, нужно:
1) перевести число N в двоичную
систему счисления;
2) полученный результат
дополнить слева незначащими нулями до k разрядов.
Например, для получения
внутреннего представления целого числа 1607 в 2-х байтовой ячейке число
переводится в двоичную систему: 160710 =
110010001112.
Внутреннее представление этого
числа в ячейке имеет вид: 0000 0110 0100 0111.
Представление отрицательных
чисел.
Для записи внутреннего
представления целого отрицательного числа (–N) нужно:
1) получить внутреннее
представление положительного числа N;
2) получить обратный код этого
числа, заменяя 0 на 1 и 1 на 0;
3) полученному числу прибавить
1 к полученному числу.
Внутреннее представление целого
отрицательного числа –1607. С использованием результата предыдущего примера и
записывается внутреннее представление положительного числа 1607: 0000 0110 0100
0111. Обратный код получается инвертированием: 1111 1001 1011 1000. Добавляется
единица: 1111 1001 1011 1001 – это и есть внутреннее двоичное представление
числа –1607.
Формат с плавающей точкой
использует представление вещественного числа R в
виде произведения мантиссы m на
основание системы счисления n в
некоторой целой степени p, которую
называют порядком: R = m * n p.
Представление числа в форме с
плавающей точкой неоднозначно. Например, справедливы следующие равенства:
12,345 = 0,0012345 × 104 =
1234,5 × 10-2 = 0,12345 ×
102
Чаще всего в ЭВМ используют
нормализованное представление числа в форме с плавающей точкой. Мантисса в таком
представлении должна удовлетворять условию:
0,1p £ m <
1p. Иначе говоря, мантисса меньше 1 и первая значащая цифра – не ноль
(p – основание системы счисления).
В памяти компьютера мантисса
представляется как целое число, содержащее только значащие цифры (0 целых и
запятая не хранятся), так для числа 12,345 в ячейке памяти, отведенной для
хранения мантиссы,
будет сохранено число 12 345.
Для однозначного восстановления исходного числа остается сохранить только его
порядок, в данном примере – это 2.
Диапазон изменения чисел
определяется количеством разрядов, отведённых ля хранения порядка числа, а
точность определяется количеством разрядов, отведённых для хранения мантиссы.