Кодирование данных в компьютере. Кодирование текстовой информации

Кодирование информации. В процессе преобразования информации из одной формы представления (знаковой системы) в другую осуществляется кодирование. Средством кодирования служит таблица соответствия, которая устанавливает взаимно однозначное соответствие между знаками или группами знаков двух различных знаковых систем.

В процессе обмена информацией часто приходится производить операции кодирования и декодирования информации. При вводе знака алфавита в компьютер путем нажатия соответствующей клавиши на клавиатуре выполняется его кодирование, т. е. преобразование в компьютерный код. При выводе знака на экран монитора или принтер происходит обратный процесс - декодирование, когда из компьютерного кода знак преобразуется в графическое изображение.

Кодирование изображений и звука. Информация, в том числе графическая и звуковая, может быть представлена в аналоговой или дискретной форме. При аналоговом представлении физическая величина принимает бесконечное множество значений, причем ее значения изменяются непрерывно. При дискретном представлении физическая величина принимает конечное множество значений, причем ее величина изменяется скачкообразно.

Примером аналогового представления графической информации может служить, скажем, живописное полотно, цвет которого изменяется непрерывно, а дискретного - изображение, напечатанное с помощью струйного принтера и состоящее из отдельных точек разного цвета.

Примером аналогового хранения звуковой информации является виниловая пластинка (звуковая дорожка изменяет свою форму непрерывно), а дискретного - аудиокомпакт-диск (звуковая дорожка которого содержит участки с различной отражающей способностью).

Графическая и звуковая информация из аналоговой формы в дискретную преобразуется путем дискретизации, т. е. разбиения непрерывного графического изображения и непрерывного (аналогового) звукового сигнала на отдельные элементы. В процессе дискретизации производится кодирование, т. е. присвоение каждому элементу конкретного значения в форме кода.

Дискретизация - это преобразование непрерывных изображений и звука в набор дискретных значений, каждому из которых присваивается значение его кода.

Кодирование информации в живых организмах. Генетическая информация определяет строение и развитие живых организмов и передается по наследству. Хранится генетическая информация в клетках организмов в структуре молекул ДНК (дезоксирибонукле-иновой кислоты). Молекулы ДНК состоят из четырех различных составляющих (нуклеотидов), которые образуют генетический алфавит.

Молекула ДНК человека включает в себя около трех миллиардов пар нуклеотидов, и в ней закодирована вся информация об организме человека: его внешность, здоровье или предрасположенность к болезням, способности и т. д.

6. Основные понятия темы «Информация и управление»: числовое и символьное кодирование информации

Кодирование числовой информации.

Сходство в кодировании числовой и текстовой информации состоит в следующем: чтобы можно было сравнивать данные этого типа, у разных чисел (как и у разных символов) должен быть различный код. Основное отличие числовых данных от символьных заключается в том, что над числами кроме операции сравнения производятся разнообразные математические операции: сложение, умножение, извлечение корня, вычисление логарифма и пр. Правила выполнения этих операций в математике подробно разработаны для чисел, представленных в позиционной системе счисления.

Основной системой счисления для представления чисел в компьютере является двоичная позиционная система счисления.

Кодирование текстовой информации

В настоящее время, большая часть пользователей, при помощи компьютера обрабатывает текстовую информацию, которая состоит из символов: букв, цифр, знаков препинания и др. Подсчитаем, сколько всего символов и какое количество бит нам нужно.

10 цифр, 12 знаков препинания, 15 знаков арифметических действий, буквы русского и латинского алфавита, ВСЕГО: 155 символов, что соответствует 8 бит информации.

Единицы измерения информации.

1 байт = 8 бит

1 Кбайт = 1024 байтам

1 Мбайт = 1024 Кбайтам

1 Гбайт = 1024 Мбайтам

1 Тбайт = 1024 Гбайтам

Суть кодирования заключается в том, что каждому символу ставят в соответствие двоичный код от 00000000 до 11111111 или соответствующий ему десятичный код от 0 до 255.

Необходимо помнить, что в настоящее время для кодировки русских букв используют пять различных кодовых таблиц (КОИ - 8, СР1251, СР866, Мас, ISO), причем тексты, закодированные при помощи одной таблицы не будут правильно отображаться в другой

Основным отображением кодирования символов является код ASCII - American Standard Code for Information Interchange- американский стандартный код обмена информацией, который представляет из себя таблицу 16 на 16, где символы закодированы в шестнадцатеричной системе счисления.

одирование символьной (текстовой) информации.

Основная операция, производимая над отдельными символами текста - сравнение символов.

При сравнении символов наиболее важными аспектами являются уникальность кода для каждого символа и длина этого кода, а сам выбор принципа кодирования практически не имеет значения.

Для кодирования текстов используются различные таблицы перекодировки. Важно, чтобы при кодировании и декодировании одного и того же текста использовалась одна и та же таблица.

Таблица перекодировки - таблица, содержащая упорядоченный некоторым образом перечень кодируемых символов, в соответствии с которой происходит преобразование символа в его двоичный код и обратно.

Наиболее популярные таблицы перекодировки: ДКОИ-8, ASCII, CP1251, Unicode.

Исторически сложилось, что в качестве длины кода для кодирования символов было выбрано 8 бит или 1 байт. Поэтому чаще всего одному символу текста, хранимому в компьютере, соответствует один байт памяти.

Различных комбинаций из 0 и 1 при длине кода 8 бит может быть 28 = 256, поэтому с помощью одной таблицы перекодировки можно закодировать не более 256 символов. При длине кода в 2 байта (16 бит) можно закодировать 65536 символов.

7.Основные понятия темы «Информация и управление»: графическое кодирование информации.

Кодирование графической информации.

Важным этапом кодирования графического изображения является разбиение его на дискретные элементы (дискретизация).

Основными способами представления графики для ее хранения и обработки с помощью компьютера являются растровые и векторные изображения

Векторное изображение представляет собой графический объект, состоящий из элементарных геометрических фигур (чаще всего отрезков и дуг). Положение этих элементарных отрезков определяется координатами точек и величиной радиуса. Для каждой линии указывается двоичные коды типа линии (сплошная, пунктирная, штрихпунктирная), толщины и цвета.

Растровое изображение представляет собой совокупность точек (пикселей), полученных в результате дискретизации изображения в соответствии с матричным принципом.

Матричный принцип кодирования графических изображений заключается в том, что изображение разбивается на заданное количество строк и столбцов. Затем каждый элемент полученной сетки кодируется по выбранному правилу.

Pixel (picture element - элемент рисунка) - минимальная единица изображения, цвет и яркость которой можно задать независимо от остального изображения.

В соответствии с матричным принципом строятся изображения, выводимые на принтер, отображаемые на экране дисплея, получаемые с помощью сканера.

Качество изображения будет тем выше, чем «плотнее» расположены пиксели, то есть чем больше разрешающая способность устройства, и чем точнее закодирован цвет каждого из них.

Для черно-белого изображения код цвета каждого пикселя задается одним битом.

Если рисунок цветной, то для каждой точки задается двоичный код ее цвета.

Поскольку и цвета кодируются в двоичном коде, то если, например, вы хотите использовать 16-цветный рисунок, то для кодирования каждого пикселя вам потребуется 4 бита (16=24), а если есть возможность использовать 16 бит (2 байта) для кодирования цвета одного пикселя, то вы можете передать тогда 216 = 65536 различных цветов. Использование трех байтов (24 битов) для кодирования цвета одной точки позволяет отразить 16777216 (или около 17 миллионов) различных оттенков цвета - так называемый режим “истинного цвета” (True Color). Заметим, что это используемые в настоящее время, но далеко не предельные возможности современных компьютеров.

8 Основные понятия темы «Информация и управление»: алфавит, код

Алфавит - упорядоченный набор символов, используемый для кодирования сообщений на некотором языке.

Мощность алфавита - количество символов алфавита.
Двоичный алфавит содержит 2 символа, его мощность равна двум.
Сообщения, записанные с помощью символов ASCII, используют алфавит из 256 символов. Сообщения, записанные по системе UNICODE, используют алфавит из 65 536 символов.

С позиций computer science носителями информации являются любые последовательности символов, которые хранятся, передаются и обрабатываются с помощью компьютера. Согласно Колмогорову, информативность последовательности символов не зависит от содержания сообщения, алфавитный подход является объективным, т.е. он не зависит от субъекта, воспринимающего сообщение.

9 Основные понятия измерения информации: бит, байт, килобайт, мегабайт

Бит, Байт, Килобайт, Мегабайт, Гигабайт – это и есть единицы измерения информации.

Правда, в компьютерных исчислениях в 1 килобайте не 1000 байт, а 1024. Почему столько? Информация в компьютере представлена в двоичном виде и принято считать, что килобайт - это 2 в десятой степени байта или 1024 байт.
Ниже представлены общепринятые единицы.

10 Количественное и качественное измерение информации.

11 Алфавитный и содержательный подходы к измерению информации

Департамент образования города Москвы


Государственное образовательное учреждение

Среднего профессионального образования

Колледж архитектуры и строительства № 7 ТСП-2

Доклад

По предмету: «Информатика и ИКТ»

на тему: «Системы счисления».

Выполнил: ученик группы 11ЭВМ

Ф.И.О.: Вус Иван Валерьевич

проверил:

Преподаватель Овсянникова А.С.

Москва – 2011

Представление данных в памяти персонального компьютера (числа, символы, графика, звук).

Форма и язык представления информации

Воспринимая информацию с помощью органов чувств, человек стремится зафиксировать ее так, чтобы она стала понятной и другим, представляя ее в той или иной форме.

Музыкальную тему композитор может наиграть на пианино, а затем записать с помощью нот. Образы, навеянные все той же мелодией, поэт может воплотить в виде стихотворения, хореограф выразить танцем, а художник - в картине.

Человек выражает свои мысли в виде предложений, составленных из слов. Слова, в свою очередь, состоят из букв. Это - алфавитное представление информации.

Форма представления одной и той же информации может быть различной. Это зависит от цели, которую вы перед собой поставили. С подобными операциями вы сталкиваетесь на уроках математики и физики, когда представляете решение в разной форме. Например, решение задачи: «Найти значение математического выражения..." можно представить в табличной или графической форме. Для этого вы пользуетесь визуальными средствами представления информации: числами, таблицей, рисунком.

Таким образом, информацию можно представить в различной форме:

  • знаковой письменной, состоящей из различных знаков, среди которых принято выделять
    • символьную в виде текста, чисел, специальных символов (например, текст учебника);
    • графическую (например, географическая карта);
    • табличную (например, таблица записи хода физического эксперимента);
  • в виде жестов или сигналов (например, сигналы регулировщика дорожного движения);
  • устной словесной (например, разговор).

Форма представления информации очень важна при ее передаче: если человек плохо слышит, то передавать ему информацию в звуковой форме нельзя; если у собаки слабо развито обоняние, то она не может работать в розыскной службе. В разные времена люди передавали информацию в различной форме с помощью: речи, дыма, барабанного боя, звона колоколов, письма, телеграфа, радио, телефона, факса.

Независимо от формы представления и способа передачи информации, она всегда передается с помощью какого-либо языка.

На уроках математики вы используете специальный язык, в основе которого - цифры, знаки арифметических действий и отношений. Они составляют алфавит языка математики.

На уроках физики при рассмотрении какого-либо физического явления вы используете характерные для данного языка специальные символы, из которых составляете формулы. Формула - это слово на языке физики.

На уроках химии вы также используете определенные символы, знаки, объединяя их в «слова» данного языка.

Существует язык глухонемых, где символы языка - определенные знаки, выражаемые мимикой лица и движениями рук.

Основу любого языка составляет алфавит - набор однозначно определенных знаков (символов), из которых формируется сообщение.

Языки делятся на естественные (разговорные) и формальные. Алфавит естественных языков зависит от национальных традиций. Формальные языки встречаются в специальных областях человеческой деятельности (математике, физике, химии и т. д.). В мире насчитывается около 10000 разных языков, диалектов, наречий. Многие разговорные языки произошли от одного и того же языка. Например, от латинского языка образовались французский, испанский, итальянский и другие языки.

Кодирование информации

С появлением языка, а затем и знаковых систем расширились возможности общения между людьми. Это позволило хранить идеи, полученные знания и любые данные, передавать их различными способами на расстояние и в другие времена - не только своим современникам, но и будущим поколениям. До наших дней дошли творения предков, которые с помощью различных символов увековечили себя и свои деяния в памятниках и надписях. Наскальные рисунки (петроглифы) до сих пор служат загадкой для ученых. Возможно, таким способом древние люди хотели вступить в контакт с нами, будущими жителями планеты и сообщить о событиях их жизни.

Каждый народ имеет свой язык, состоящий из набора символов (букв): русский, английский, японский и многие другие. Вы уже познакомились с языком математики, физики, химии.

Представление информации с помощью какого-либо языка часто называют кодированием.

Код - набор символов (условных обозначений) дли представления информации. Кодирование - процесс представления информации в виде кода.

Водитель передает сигнал с помощью гудка или миганием фар. Кодом является наличие или отсутствие гудка, а в случае световой сигнализации - мигание фар или его отсутствие.

Вы встречаетесь с кодированием информации при переходе дороги по сигналам светофора. Код определяют цвета светофора - красный, желтый, зеленый.

В основу естественного языка, на котором общаются люди, тоже положен код. Только в этом случае он называется алфавитом. При разговоре этот код передается звуками, при письме - буквами. Одну и ту же информацию можно представить с помощью различных кодов. Например, запись разговора можно зафиксировать посредством русских букв или специальных стенографических значков.

По мере развития техники появлялись разные способы кодирования информации. Во второй половине XIX века американский изобретатель Сэмюэль Морзе изобрел удивительный код, который служит человечеству до сих пор. Информация кодируется тремя «буквами»: длинный сигнал (тире), короткий сигнал (точка) и отсутствие сигнала (пауза) для разделения букв. Таким образом, кодирование сводится к использованию набора символов, расположенных в строго определенном порядке.

Люди всегда искали способы быстрого обмена сообщениями. Для этого посылали гонцов, использовали почтовых голубей. У народов существовали различные способы оповещения о надвигающейся опасности: барабанный бой, дым костров, флаги и т. д. Однако использование такого представления информации требует предварительной договоренности о понимании принимаемого сообщения.

Знаменитый немецкий ученый Готфрид Вильгельм Лейбниц предложил еще в XVII веке уникальную и простую систему представления чисел. «Вычисление с помощью двоек... является для науки основным и порождает новые открытия... при сведении чисел к простейшим началам, каковы 0 и 1, везде появляется чудесный порядок».

Сегодня такой способ представления информации с помощью языка, содержащего всего два символа алфавита - 0 и 1, широко используется в технических устройствах, в том числе и в компьютере. Эти два символа 0 и 1 принято называть двоичными цифрами или битами (от англ. bit - Binary Digit - двоичный знак).

Инженеров такой способ кодирования привлек простотой технической реализации - есть сигнал или нет сигнала. С помощью этих двух цифр можно закодировать любое сообщение.

Более крупной единицей измерения объема информации принято считать 1 байт, который состоит из 8 бит.

Принято также использовать и более крупные единицы измерения объема информации. Число 1024 (2 10) является множителем при переходе к более высокой единице измерения.

Кодирование информации в компьютере

Вся информация, которую обрабатывает компьютер, должна быть представлена двоичным кодом с помощью двух цифр - 0 и 1. Эти два символа принято называть двоичными цифрами, или битами. С помощью двух цифр 1 и 0 можно закодировать любое сообщение. Это явилось причиной того, что в компьютере обязательно должно быть организовано два важных процесса:

  • кодирование, которое обеспечивается устройствами ввода при преобразовании входной информации в форму, воспринимаемую компьютером, то есть в двоичный код;
  • декодирование, которое обеспечивается устройствами вывода при преобразовании данных из двоичного кода в форму, понятную человеку.

С точки зрения технической реализации использование двоичной системы счисления для кодирования информации оказалось намного
более простым, чем применение других способов. Действительно, удобно кодировать информацию в виде последовательности нулей и единиц, если представить эти значения как два возможных устойчивых состояния электронного элемента:

  • 0 - отсутствие электрического сигнала или сигнал имеет низкий уровень;
  • 1 - наличие сигнала или сигнал имеет высокий уровень.

Эти состояния легко различать. Недостаток двоичного кодирования - длинные коды. Но в технике легче иметь дело с большим числом простых элементов, чем с небольшим количеством сложных.

Вам и в быту ежедневно приходится сталкиваться с устройством, которое может находиться только в двух устойчивых состояниях: включено/выключено. Конечно же, это хорошо знакомый всем выключатель. А вот придумать выключатель, который мог бы устойчиво и быстро переключаться в любое из 10 состояний, оказалось невозможным. В результате после ряда неудачных попыток разработчики пришли к выводу о невозможности построения компьютера на основе десятичной системы счисления. И в основу представления чисел в компьютере была положена именно двоичная система счисления.

В настоящее время существуют разные способы двоичного кодирования и декодирования информации в компьютере. В первую очередь это зависит от вида информации, а именно, что должно кодироваться: текст, числа, графические изображения или звук. Кроме того, при кодировании чисел важную роль играет то, как они будут использоваться: в тексте, в расчетах или в процессе ввода-вывода. Накладываются также и особенности технической реализации.

Кодирование чисел

Система счисления - совокупность приемов и правил записи чисел с помощью определенного набора символов.

Для записи чисел могут использоваться не только цифры, но и буквы (например, запись римских цифр - XXI). Одно и то же число может быть по-разному представлено в различных системах счисления.

В зависимости от способа изображения чисел системы счисления делятся на позиционные и непозиционные.

В позиционной системе счисления количественное значение каждой цифры числа зависит от того, в каком месте (позиции или разряде) записана та или иная цифра этого числа. Например, меняя позицию цифры 2 в десятичной системе счисления, можно записать разные по величине десятичные числа, например 2; 20; 2000; 0,02 и т. д.

В непозиционной системе счисления цифры не изменяют своего количественного значения при изменении их расположения (позиции) в числе. Примером непозиционной системы может служить римская система, в которой независимо от местоположения одинаковый символ имеет неизменное значение (например, символ X в числе XXV).

Количество различных символов, используемых для изображения числа в позиционной системе счисления, называется основанием системы счисления.

В компьютере наиболее подходящей и надежной оказалась двоичная система счисления, в которой для представления чисел используются последовательности цифр 0 и 1.

Кроме того, для работы с памятью компьютера оказалось удобным использовать представление информации с помощью еще двух систем счисления:

  • восьмеричной (любое число представляется с помощью восьми цифр - 0, 1, 2... 7);
  • шестнадцатеричной (используемые символы-цифры - 0, 1, 2... 9 и буквы - А, В, С, D, Е, F, заменяющие числа 10, 11, 12, 13, 14, 15 соответственно).

Кодирование символьной информации

Нажатие алфавитно-цифровой клавиши на клавиатуре приводит к тому, что в компьютер посылается сигнал в виде двоичного числа, представляющего собой одно из значений кодовой таблицы. Кодовая таблица - это внутреннее представление символов в компьютере. Во всем мире в качестве стандарта принята таблица ASCII (American Standart Code for Informational Interchange - американский стандартный код информационного обмена).

Для хранения двоичного кода одного символа выделен 1 байт = 8 бит. Учитывая, что каждый бит принимает значение 1 или 0, количество возможных сочетаний единиц и нулей равно 2 8 = 256.

Значит, с помощью 1 байта можно получить 256 разных двоичных кодовых комбинаций и отобразить с их помощью 256 различных символов. Эти коды и составляют таблицу ASCII.

Пример, при нажатии клавиши с буквой S в память компьютера записывается код 01010011. При выводе буквы S на экран компьютер выполняет декодирование - на основании этого двоичного кода строится изображение символа.

SUN (СОЛНЦЕ) - 01010011 010101101 01001110

Стандарт ASCII кодирует первые 128 символов от 0 до 127: цифры, буквы латинского алфавита, управляющие символы. Первые 32 символа являются управляющими и предназначены в основном для передачи команд управления. Их назначение может варьироваться в зависимости от программных и аппаратных средств. Вторая половина кодовой таблицы (от 128 до 255) американским стандартом не определена и предназначена для символов национальных алфавитов, псевдографических и некоторых математических символов. В разных странах могут использоваться различные варианты второй половины кодовой таблицы.

Обратите внимание! Цифры кодируются по стандарту ASCII записываются в двух случаях - при вводе-выводе и когда они встречаются я тексте. Если цифры участвуют в вычислениях, то осуществляется их преобразование в другой двоичный код.

Для сравнения рассмотрим число 45 для двух вариантов кодирования.

При использовании в тексте это число потребует для своего представления 2 байта, поскольку каждая цифра будет представлена своим кодом в соответствии с таблицей ASCII . В двоичной системе - 00110100 00110101.

При использовании в вычислениях код этого числа будет получен по специальным правилам перевода и представлен в виде 8-разрядного двоичного числа 00101101, на что потребуется 1 байт.

Одно из основных достоинств компьютера связано с тем, что это удивительно универсальная машина. Каждый, кто хоть когда-нибудь с ним сталкивался, знает, что занятие арифметическими подсчетами составляет совсем не главный метод использования компьютера. Компьютеры прекрасно воспроизводят музыку и видеофильмы, с их помощью можно организовывать речевые и видеоконференции в Интернет, создавать и обрабатывать графические изображения , а возможность использования компьютера в сфере компьютерных игр на первый взгляд выглядит совершенно несовместимой с образом суперарифмометра, перемалывающего сотни миллионов цифр в секунду.

Составляя информационную модель объекта или явления, мы должны договориться о том, как понимать те или иные обозначения. То есть договориться о виде представления информации.

Человек выражает свои мысли в виде предложений, составленных из слов. Они являются алфавитным представлением информации. Основу любого языка составляет алфавит - конечный набор различных знаков (символов) любой природы, из которых складывается сообщение.

Одна и та же запись может нести разную смысловую нагрузку. Например, набор цифр 251299 может обозначать: массу объекта; длину объекта; расстояние между объектами; номер телефона; запись даты 25 декабря 1999 года.

Для представления информации могут использоваться разные коды и, соответственно, надо знать определенные правила - законы записи этих кодов, т.е. уметь кодировать.

Код - набор условных обозначений для представления информации.

Кодирование - процесс представления информации в виде кода.

Для общения друг с другом мы используем код - русский язык. При разговоре этот код передается звуками, при письме - буквами. Водитель передает сигнал с помощью гудка или миганием фар. Вы встречаетесь с кодированием информации при переходе дороги в виде сигналов светофора. Таким образом, кодирование сводиться к использованию совокупности символов по строго определенным правилам.

Кодировать информацию можно различными способами: устно; письменно; жестами или сигналами любой другой природы.

Кодирование данных двоичным кодом.

По мере развития техники появлялись разные способы кодирования информации. Во второй половине XIXвека американский изобретатель Сэмюэль Морзе изобрел удивительный код, который служит человечеству до сих пор. Информация кодируется тремя символами: длинный сигнал (тире), короткий сигнал (точка), нет сигнала (пауза) - для разделения букв.

Своя система существует и в вычислительной технике - она называется двоичным кодированием и основана на представлении данных последовательностью всего двух знаков: 0 и 1. Эти знаки называютсядвоичными цифрами , по-английски -binary digit или сокращенноbit(бит).

Одним битом могут быть выражены два понятия: 0 или 1 (да илинет , черное илибелое , истина илиложь и т.п.). Если количество битов увеличить до двух, то уже можно выразить четыре различных понятия:

Тремя битами можно закодировать восемь различных значений:

000 001 010 011 100 101 110 111

Увеличивая на единицу количество разрядов в системе двоичного кодирования , мы увеличиваем в два раза количество значений, которое может быть выражено в данной системе, то есть общая формула имеет вид:

где N- количество независимых кодируемых значений;

m - разрядность двоичного кодирования, принятая в данной системе.

Одна и та же информация может быть представлена (закодирована) в нескольких формах. C появлением компьютеров возникла необходимость кодирования всех видов информации, с которыми имеет дело и отдельный человек , и человечество в целом. Но решать задачу кодирования информации человечество начало задолго до появления компьютеров. Грандиозные достижения человечества - письменность и арифметика - есть не что иное, как система кодирования речи и числовой информации . Информация никогда не появляется в чистом виде , она всегда как-то представлена, как-то закодирована.

Двоичное кодирование - один из распространенных способов представления информации. В вычислительных машинах, в роботах и станках с числовым программным управлением, как правило, вся информация, с которой имеет дело устройство, кодируется в виде слов двоичного алфавита.

Кодирование символьной (текстовой) информации.

Основная операция, производимая над отдельными символами текста - сравнение символов.

При сравнении символов наиболее важными аспектами являются уникальность кода для каждого символа и длина этого кода, а сам выбор принципа кодирования практически не имеет значения.

Для кодирования текстов используются различные таблицы перекодировки. Важно, чтобы при кодировании и декодировании одного и того же текста использовалась одна и та же таблица.

Таблица перекодировки - таблица, содержащая упорядоченный некоторым образом перечень кодируемых символов, в соответствии с которой происходит преобразование символа в его двоичный код и обратно.

Наиболее популярные таблицы перекодировки: ДКОИ-8, ASCII, CP1251, Unicode.

Исторически сложилось, что в качестве длины кода для кодирования символов было выбрано 8 бит или 1 байт. Поэтому чаще всего одному символу текста, хранимому в компьютере, соответствует один байт памяти.

Различных комбинаций из 0 и 1 при длине кода 8 бит может быть 28 = 256, поэтому с помощью одной таблицы перекодировки можно закодировать не более 256 символов. При длине кода в 2 байта (16 бит) можно закодировать 65536 символов.

Кодирование числовой информации

Сходство в кодировании числовой и текстовой информации состоит в следующем: чтобы можно было сравнивать данные этого типа, у разных чисел (как и у разных символов) должен быть различный код. Основное отличие числовых данных от символьных заключается в том, что над числами кроме операции сравнения производятся разнообразные математические операции: сложение, умножение, извлечение корня, вычисление логарифма и пр. Правила выполнения этих операций в математике подробно разработаны для чисел, представленных в позиционной системе счисления.

В процессе развития человечество пришло к осознанию необходимости хранить и передавать на расстояния ту или иную информацию. В последнем случае требовалось её преобразование в сигналы. Этот процесс называется кодированием данных. Текстовая информация , а также графические изображения при этом могут преобразоваться в числа. О том, каким образом это можно сделать, расскажет наша статья.

Передача информации на расстояние

  • фельдъегерско-почтовая;
  • акустическая (например, посредством громкоговорителя);
  • на основе того или иного способа электросвязи (проводная, радио, оптическая, радиорелейная, спутниковая, оптико-волоконная).

Наиболее распространенными на данный момент являются системы передачи последнего типа. Однако для их использования требуется предварительно применить тот или иной способ кодирования информации. С помощью чисел в привычном для современного человека десятичном исчислении сделать это крайне сложно.

Шифрование

Двоичная система счисления

На заре компьютерной эры ученые были озабочены поисками устройства, которое бы позволило максимально просто представлять числа в ЭВМ. Вопрос разрешился, когда Клод Шенон предложил использовать двоичную систему счисления. Она была известна с 17 века, и для ее реализации требовалось устройство с 2 устойчивыми состояниями, соответствующими логической «1» и логическому «0». Их на тот момент было известно предостаточно - от сердечника, который мог быть либо намагниченным, либо размагниченным, до транзистора, способного находиться или в открытом, или в закрытом состоянии.

Представление цветных картинок

Способ кодирования информации с помощью чисел для таких изображений реализуется несколько сложнее. С этой целью предварительно требуется декомпозиция картинки на 3 основных цвета (зеленый, красный и синий), так как в результате их смешения в определенных пропорциях можно получить любой оттенок, воспринимаемый человеческим глазом . Такой способ кодирования картинки с помощью чисел с использованием 24 двоичных разрядов называется RGB, или полноцветным (True Color).

Если же речь идет о полиграфии, то используется система CMYK. Она основана на идее о том, что каждую из основных компонент RGB можно поставить в соответствие с цветом, дополняющим её до белого. Ими являются голубой, пурпурный и желтый. Хотя их достаточно, с целью снижения полиграфических расходов, добавляют и четвертую компоненту - черную. Таким образом, для представления графики в системе CMYK требуется 32 двоичных разряда, а сам режим принято называть полноцветным.


Представление звуков

На вопрос о том, есть ли для этого способ кодирования информации с помощью чисел, ответ должен быть положительным. Однако на данный момент такие методы не считаются совершенными. К их числу относятся:

  • Метод FM. Он основан на разложении любого сложного звука на последовательность элементарных гармонических сигналов разных частот, которые можно описать кодом.
  • Таблично-волновой метод. В заранее составленных таблицах хранят сэмплы - образцы звуков для различных музыкальных инструментов . Числовые коды выражают тип и номер модели инструмента, высоту тона, интенсивность и продолжительность звука и пр.


Теперь вы знаете, что двоичное кодирование - один из распространенных способов представления информации, который сыграл огромную роль в развитии компьютерной техники.

С появлением технических средств хранения и передачи информации возникли новые идеи и приемы кодирования.

Первым техническим средством передачи информации на расстояние стал телеграф, изобретенный в \(1837\) году американцем Сэмюэлем Морзе.

Телеграфное сообщение - это последовательность электрических сигналов , передаваемая от одного телеграфного аппарата по проводам к другому телеграфному аппарату.

Эти технические обстоятельства привели Морзе к идее использования всего двух видов сигналов - короткого и длинного - для кодирования сообщения, передаваемого по линиям телеграфной связи.

Такой способ кодирования получил название азбуки Морзе . В ней каждая буква алфавита кодируется последовательностью коротких сигналов (точек) и длинных сигналов (тире). Буквы отделяются друг от друга паузами - отсутствием сигналов. В кодовой таблице ниже показана азбука Морзе применительно к русскому алфавиту. Специальных знаков препинания в ней нет. Их обычно записывают словами: «тчк» - точка, «зпт» - запятая и т. п.


Кодовая таблица - это соответствие между набором знаков (символов) и их кодами.

Самым знаменитым телеграфным сообщением является сигнал бедствия «SOS » (S ave O ur S ouls - спасите наши души ).

Вот как он выглядит в коде азбуки Морзе:
Три точки обозначают букву S, три тире - букву О. Две паузы отделяют буквы друг от друга.

Характерной особенностью азбуки Морзе является переменная длина кода разных букв , поэтому код Морзе называют неравномерным кодом . Буквы, которые встречаются в тексте чаще, имеют более короткий код, чем редкие буквы. Например, код буквы «Е» - одна точка, а код буквы «Ъ» состоит из шести знаков. Зачем так сделано? Чтобы сократить длину всего сообщения. Но из-за переменной длины кода букв возникает проблема отделения букв друг от друга в тексте. Поэтому приходится для разделения использовать паузу (пропуск). Следовательно, телеграфный алфавит Морзе является троичным, так как в нём используется три знака: точка, тире, пропуск.

Азбука Морзе - неравномерный телеграфный код, где каждая буква и знак представлены при помощи длинных и коротких сигналов, так называемых «тире» и «точек».

Равномерный телеграфный код был изобретен французом Жаном Морисом Бодо в конце \(XIX\) века. В нём использовалось всего два вида сигналов. Неважно, как их назвать: точка и тире, плюс и минус, ноль и единица. Это два отличающихся друг от друга электрических сигнала.

В коде Бодо длина кодов всех символов алфавита одинакова и равна пяти. В таком случае не возникает проблемы отделения букв друг от друга: каждая пятерка сигналов - это знак текста.

Код Бодо - это первый в истории техники способ двоичного кодирования информации. Благодаря идее Бодо удалось автоматизировать процесс передачи и печати букв. Был создан клавишный телеграфный аппарат . Нажатие клавиши с определенной буквой вырабатывает соответствующий пятиимпульсный сигнал, который передается по линии связи. Принимающий аппарат под воздействием этого сигнала печатает ту же букву на бумажной ленте.

Код Бодо - равномерный телеграфный \(5\) -битный код, использующий два отличающихся друг от друга электрических сигнала.

Почти в каждом доме есть компьютер и даже не один, а несколько. Но мало кто понимает, как компьютер обрабатывает информацию и понимает нас. Если вы недавно закончили школу или еще учитесь, то на уроках информатики наверняка проходили эту тему, а вот более старшее поколение этого наверняка не знает и даже не задумывается о том, что «разговаривает» с компьютером на языке цифр в двоичной системе исчисления.

Вся цифровая информация передается в битах. Бит – это единица информации, которую понимает компьютер. Все, что мы делаем на компьютере переводится в специальный двоичный код , который состоит из 0 и 1. Если есть сигнал, то это 1, если сигнала нет, то это 0. Для компьютера это не числа, а сигналы. Есть сигнал, нет сигнала. Любую цифру компьютер понимает по своему – в двоичной системе.

0 — 0 (ноль)

1 — 1 (один)

2 — 10 (один-ноль) (одна единица второго разряда)

3 — 11 (один-один)

4 — 100 (один-ноль-ноль) (одна единица третьего разряда

5 — 101 (один-ноль-один)

6 — 110 (один-один-ноль)

7 — 111 (один-один-один)

8 — 1000 (один-ноль-ноль-ноль) (одна единица четвертого разряда)

9 — 1001 (один-ноль-ноль-один)

10 – 1010 (один-ноль-один-ноль)

Если вы хотите понять язык компьютера, необходимо изучить двоичную систему исчисления.

Нули и единицы в компьютере называют битами , а группы из восьми битов называют байтами .

В один байт можно записать число от 0 до 255.

В двух байтах можно записать число от 0 до 65535.

В трех байтах можно записать число от 0 до 16 миллионов.

Например,

число 2000 = 00000111 11010000

записывается в двух байтах, по 8 битов в каждом.

С числами более-менее понятно, а как же компьютер понимает текст?

Любые буквы компьютер переводит в числа. Превратив букву в число, компьютер превращает число в сигналы и записывает их, как и числа, — битами, из которых собираются байты:

А – 192 – 11000000

Б – 193 — 11000001

В – 194 – 11000010

Г – 195 — 11000011

Полная таблица кодов русского алфавита Ascii

Нажимая на клавишу клавиатуры вы даете компьютеру сигнал в двоичной системе исчисления, (каждой клавише соответствует свой код). Он понимает ее и при помощи специальной программы переводит этот сигнал в понятный для нас символ и выводит его на монитор. Грубо говоря, получается, что клавиатура служит переводчиком между нами и компьютером.

Тоже самое происходит и с графической информацией. Для того, чтобы сохранить картинку и работать с ней на компьютере, ее необходимо превратить в сигналы, т.е. оцифровать . Для этой цели можно воспользоваться или цифровым фотоаппаратом или видеокамерой.

Каждая точка имеет свой код:

Черная точка: 0, 0, 0;

Белая точка: 255, 255, 255;

Коричневая: 153, 102, 51;

И т. д. У каждого цвета – свой шифр (цветовой код).

Таблица
соответствия цветов их шестнадцатиричным
RGB-составляющим
.

Русское название

In English

Код / Сode

Белоснежный Snow

FFFAFA

Призрачно-белый Ghostwhite

F8F8FF

Белый-антик Antique White

FAEBD7

Кремовый Cream

FFFBF0

Персиковый Peachpuff

FFDAB9

Белый-навахо Navajo White

FFDEAD

Шелковый оттенок Cornsilk

FFF8DC

Слоновая кость Ivory

FFFFF0

Лимонный Lemon Chiffon

FFFACD

Морская раковина Seashell

FFF5EE

Медовый Honeydew

F0FFF0

Лазурный Azure

F0FFFF

Бледно-лиловый Lavender

E6E6FA

Голубой с красным отливом Lavender Blush

FFF0F5

Тускло-розовый Misty Rose

FFE4E1

Белый White (*)

FFFFFF

Черный Black (*)

000000

Тускло-серый Dim Gray

696969

Синевато-серый Slate Gray

708090

Грифельно-серый Light Slate Gray

778899

Серый Gray

BEBEBE

Светло-серый Light Gray

C0C0C0

Серый нейтральный Medium Gray

A0A0A4

Темно-серый Dark Gray

808080

Полуночно-синий Midnight Blue

191970

Темно-синий Navy (*), Dark Blue

000080

Васильковый Cornflower

6495ED

Грифельно-синий Slate Blue

6A5ACD

Светлый грифельно-синий Light Slate Blue

8470FF

Голубой королевский Royal Blue

4169E1

Синий Blue

0000FF

Небесно-голубой Sky Blue

87CEEB

Небесно-голубой светлый Light Sky Blue

87CEFA

Синий со стальным
оттенком
Steel Blue

4682B4

Голубой со стальным
оттенком
Light Steel Blue

B0C4DE

Светло-синий Light Blue

A6CAF0

Синий с пороховым
оттенком
Powder Blue

B0E0E6

Бледно-бирюзовый Pale Turquoise

AFEEEE

Бирюзовый Turquoise

40E0D0

Зеленовато-голубой Cyan (*)

00FFFF

Светлый циан Light Cyan

E0FFFF

Темный циан Dark Cyan

008080

Серо-синий Cadet Blue

5F9EA0

Аквамарин Aquamarine

7FFFD4

Цвет морской волны Seagreen

54FF9F

Цвет морской волны,
светлый
Light Seagreen

20B2AA

Бледно-зеленый Pale Green

98FB98

Весенне-зеленый Spring Green

00FF7F

Зеленая лужайка Lawn Green

7CFC00

Зеленый Green (*)

00FF00

Средне-зеленый Medium Green

C0DCC0

Темно-зеленый Dark Green

008000

Зеленовато-желтый Chartreuse

7FFF00

Зелено-желтый Green Yellow

ADFF2F

Лимонно-зеленый Lime Green

32CD32

Желто-зеленый Yellow Green

9ACD32

Зеленый лесной Forest Green

228B22

Хаки Forest Green

F0E68C

Бледно-золотистый Pale Goldenrod

EEE8AA

Светло-желтый золотистый Light Goldenrod Yellow

FAFAD2

Светло-желтый Light Yellow

FFFFE0

Желтый Yellow (*)

FFFF00

Темно-желтый Dark Yellow

808000

Золотой Gold

FFD700

Светло-золотистый Light Goldenrod

FFEC8B

Золотистый Goldenrod

DAA520

Желтоватый Burly Wood

DEB887

Розово-коричневый Rosy Brown

BC8F8F

Кожано-коричневый Saddle Brown

8B4513

Охра Sienna

A0522D

Бежевый Beige

F5F5DC

Пшеничный Wheat

F5DEB3

Рыжевато-коричневый Tan

D2B48C

Шоколадный Chocolate

D2691E

Кирпичный Firebrick

B22222

Коричневый Brown

A52A2A

Сомон Salmon

FA8072

Светлый сомон Light Salmon

FFA07A

Оранжевый Orange

FFA500

Коралловый Coral

FF7F50

Коралловый светлый Light Coral

F08080

Оранжево-красный Orange Red

FF4500

Красный Red (*)

FF0000

Темно-красный Dark Red

800000

Теплый розовый Hot Pink

FF69B4

Розовый Pink

FFC0CB

Светло-розовый Light Pink

FFB6C1

Красно-фиолетовый бледный Pale Violet Red

DB7093

Темно-бордовый Maroon (*)

B03060

Красно-фиолетовый Violet Red

D02090

Информация бывает разного вида, например:

Запах, вкус, звук;

Символы и знаки.

В разных отраслях науки, культуры и техники разработаны специальные формы для записи информации.

Код - это группа обозначений, которую можно использовать для отображения информации.

Процесс преобразования сообщения в комбинацию символов в соответствии с кодом называется кодированием .

Существует три основных способа кодирования информации:

  • Числовой способ - с помощью чисел.
  • Символьный способ - информация кодируется с помощью символов того же алфавита, что и исходящий текст.
  • Графический способ - информация кодируется с помощью рисунков или значков.

Примеры кодирования информации:

Для отображения звуков русского алфавита используют буквы (АБВГДЕЁЖ…ЭЮЯ);

Для отображения чисел используют цифры (0123456789);

Звуки записывают нотами и другими символами ;

Слепые используют азбуку Брайля , где буква состоит из шести элементов: дырочек и бугорков.

Азбука Брайля

Надо учитывать, что не зная принципы кодирования информации, один и тот же код, можно понять по-разному, например, число 300522005 можно посчитать за число, номер телефона или за количество населения.

В компьютере кодируют введённую информацию: текст, изображения и звуки. В закодированном виде компьютер обрабатывает, хранит и пересылает информацию. Чтобы вывести информацию из компьютера в понятной для человека форме, её надо декодировать .

Методами шифрования занимается специальная наука - криптография .

В компьютере для кодирования любой информации используются только два символа: 0 и 1 , так как компьютерной технике проще реализовывать два состояния:

0 - сигнала нет (нету напряжения или не течёт ток);

1 - сигнал есть (есть напряжение или течёт ток).

Создание кода.

Одним битов можно кодировать два состояния: 0 и 1 (да и нет, чёрный и белый). При увеличении количества битов на один получится в два раза больше кодов.

Пример:

Два бита создают 4 разных кода: 00, 01, 10 и 11;

три бита создают 8 разных кодов: 000, 001, 010, 011, 100, 101, 110, и 111.

Кодирование различных видов информации

Кодирование текстов

При кодировании текста каждому символу присваивается какое-то значение, например, порядковый номер.

Первый популярный компьютерный стандарт кодирования текста имеет название ASCII (American Standart Code for Information Interchange), в котором для кодирования каждого символа используются 7 бит.

7-ю битами можно закодировать 128 символов: большие и маленькие латинские буквы, цифры, знаки препинания, а так же специальные символы, например, «§».

Стандарту создавали разные варианты, дополняя код до 8 бит (256 символов), чтобы можно было кодировать национальные символы, например, латышскую букву ā.

Но 256 символов не хватило, чтобы кодировать все символы разных алфавитов, поэтому создали новые стандарты. Один из самых популярных в наше время, это UNICODE . В котором каждый символ кодируют 2-мя байтами, получается в итоге 62536 разных кодов .

Кодирования графических данных

Почти все созданные и обработанные изображения, хранящиеся в компьютере, можно поделить на две группы:

Растровая графика;

Векторная графика.

Любое изображение созданное в растровой графике состоит их цветных точек. Эти точки называют пикселями (pixel) .

Для кодирования не цветных изображений обычно используют 256 оттенков серого , начиная от белого, заканчивая чёрным. Для кодирования всех цветов надо 8 битов (1 байт).

Для кодирования цветных изображений обычно используют три цвета: красный, зелёный и синий . Цветной тон получается при смешивании этих трёх цветов.

Кодирование звуков

Звуки появляются из-за колебаний воздуха. У звука есть две величины:

- амплитуда колебания , которая указывает на громкость звука;

- частота колебания , которая указывает на тональность звука.

Звук можно переделать в электрический сигнал, например, микрофоном.

Звук кодируют, после точного интервала времени измеряя размер сигнала и присваивая ему бинарную величину. Чем чаще проводятся эти измерения, тем лучше качество звука.

Пример:

На одном компакт диске, с объемом 700 Мб, может вместиться 80 минут звука CD качества.

Кодирование видео

Фильм состоит из кадров, которые быстро меняются. Кодированный фильм содержит информацию о размере кадра, используемых цветах, и количество кадров в секунду (обычно 30), как и способ записи звука - каждому кадру отдельно или всему фильму сразу.

Случайные статьи

Вверх