Двоичное кодирование текстовой информации

Содержание
  1. Кодирование текстовой информации — Кодирование информации
  2. Кодирование текстовой информации
  3. Таблица ASCII
  4. Коды из международной таблицы ASCII
  5. Кодировка слова МИР
  6. Двоичное кодирование текстовой информации
  7. Кодирование текстовой (символьной) информации
  8. 6. Двоичное кодирование текстовой информации
  9. 7. Аналоговый и дискретный способы представления изображений и звука
  10. 8. Двоичное кодирование графической информации
  11. Презентация по информатике на тему
  12. Кодирование информации. Двоичное кодирование. Единицы измерения информации. урок. Информатика 5 Класс
  13. Каким же образом текстовая информация представлена в памяти компьютера?
  14. Теперь возникает вопрос, какой именно восьмиразрядный двоичный код поставить в соответствие каждому символу.
  15. Таблица, в которой всем символам компьютерного алфавита поставлены в соответствие порядковые номера, называется таблицей кодировки
  16. Структура таблицы кодировки ASCII
  17. Первая половина таблицы кодов ASCII
  18. Вторая половина таблицы кодов ASCII
  19. Внутреннее представление слов в памяти компьютера

Кодирование текстовой информации — Кодирование информации

Двоичное кодирование текстовой информации

Кодированиетекстовой информации

Одна и та же информация может быть представлена (закодирована) в несколькихформах. C появлением компьютеров возникла необходимость кодирования всех видовинформации, с которыми имеет дело и отдельный человек, и человечество в целом.

Но решать задачу кодирования информации человечество начало задолго допоявления компьютеров. Грандиозные достижения человечества — письменность иарифметика — есть не что иное, как система кодирования речи и числовойинформации.

Информация никогда не появляется в чистом виде, она всегда как-топредставлена, как-то закодирована.

Двоичное кодирование – один из распространенных способов представленияинформации. В вычислительных машинах, в роботах и станках с числовымпрограммным управлением, как правило, вся информация, с которой имеет делоустройство, кодируется в виде слов двоичного алфавита.

Начиная с конца 60-х годов, компьютеры все больше стали использоваться дляобработки текстовой информации, и в настоящее время основная доля персональныхкомпьютеров в мире (и большая часть времени) занята обработкой именно текстовойинформации.

Все эти виды информации в компьютере представлены в двоичном коде,т. е. используется алфавит мощностью два (всего два символа 0 и 1).

Связано этос тем, что удобно представлять информацию в виде последовательностиэлектрических импульсов: импульс отсутствует (0), импульс есть (1).

Такое кодирование принято называть двоичным, а сами логическиепоследовательности нулей и единиц — машинным языком.

С точки зрения ЭВМ текст состоит из отдельных символов. К числу символовпринадлежат не только буквы (заглавные или строчные, латинские или русские), нои цифры, знаки препинания, спецсимволы типа «=», «(«,»&» и т.п. и даже (обратите особое внимание!) пробелы междусловами.

Тексты вводятся в память компьютера с помощью клавиатуры. На клавишахнаписаны привычные нам буквы, цифры, знаки препинания и другие символы. Воперативную память они попадают в двоичном коде. Это значит, что каждый символпредставляется 8-разрядным двоичным кодом.

Рис.1 Представление символа в виде двоичного кода.

            Традиционно для кодирования одного символа используетсяколичество информации, равное 1 байту, т. е. I = 1 байт = 8 бит.

При помощиформулы, которая связывает между собой количество возможных событий К иколичество информации I, можно вычислить сколько различных символов можно закодировать(считая, что символы — это возможные события): К = 2I = 28= 256, т. е. для представления текстовой информации можно использовать алфавитмощностью 256 символов.

  Такое количество символов вполне достаточно для пред­ставлениятекстовой информации, включая прописные и строчные буквы русского и латинскогоалфавита, цифры, знаки, графические символы и пр.

Кодирование заключается в том, что каждому символу ставится в соответствиеуникальный десятичный код от 0 до 255 или соответствующий ему двоичный код от00000000 до 11111111. Таким образом, человек различает символы по ихначертанию, а компьютер — по их коду.

Удобство побайтового кодирования символов очевидно, поскольку байт -наименьшая адресуемая часть памяти и, следовательно, процессор может обратитьсяк каждому символу отдельно, выполняя обработку текста. С другой стороны, 256символов – это вполне достаточное количество для представления самойразнообразной символьной информации.

В процессе вывода символа на экран компьютера произ­водитсяобратный процесс — декодирование, то есть преоб­разование кода символа в егоизображение. Важно, что присвоение символу конкретного кода — это вопроссоглашения, которое фиксируется в кодовой табли­це.

Теперь возникает вопрос, какой именно восьмиразрядный двоичный кодпоставить в соответствие каждому символу. Понятно, что это дело условное, можнопридумать множество способов кодировки.

Все символы компьютерного алфавита пронумерованы от 0 до 255. Каждомуномеру соответствует восьмиразрядный двоичный код от 00000000 до 11111111. Этоткод просто порядковый номер символа в двоичной системе счисления.

Виды таблицкодировок

Таблица, в которой всем символам компьютерного алфавита поставлены всоответствие порядковые номера, называется таблицей кодировки.

Для разных типов ЭВМ используются различные таблицы кодировки.

В качестве международного стандарта принята кодовая таблица ASCII (AmericanStandard Code for Information Interchange — Американский стандартный код дляинформационного обмена), кодирующая первую половину символов с числовыми кодамиот 0 до 127 ( коды от 0 до 32 отведены не символам, а функциональным клавишам).

Таблица кодов ASCII делится на две части.

Международным стандартом является лишь первая половина таблицы, т.е.символы с номерами от 0 (00000000), до 127 (01111111).

Структура таблицыкодировки ASCII

Порядковый номерКодСимвол
0 — 3100000000 — 00011111Символы с номерами от 0 до 31 принято называть управляющими.Их функция – управление процессом вывода текста на экран или печать, подача звукового сигнала, разметка текста и т.п.
32 — 1270100000 — 01111111Стандартная часть таблицы (английский). Сюда входят строчные и прописные буквы латинского алфавита, десятичные цифры, знаки препинания, всевозможные скобки, коммерческие и другие символы.Символ 32 — пробел, т.е. пустая позиция в тексте.Все остальные отражаются определенными знаками.
128 — 25510000000 — 11111111Альтернативная часть таблицы (русская).Вторая половина кодовой таблицы ASCII, называемая кодовой страницей (128 кодов, начиная с 10000000 и кончая 11111111), может иметь различные варианты, каждый вариант имеет свой номер.Кодовая страница в первую очередь используется для размещения национальных алфавитов, отличных от латинского. В русских национальных кодировках в этой части таблицы размещаются символы русского алфавита.

Рис. 2 Первая половина таблицы кодировки ASCII.

Обращается внимание на то, что в таблице кодировки буквы (прописные истрочные) располагаются в алфавитном порядке, а цифры упорядочены повозрастанию значений. Такое соблюдение лексикографического порядка врасположении символов называется принципом последовательного кодированияалфавита.

Для букв русского алфавита также соблюдается принцип последовательногокодирования.

Рис.3 Вторая половина таблицы кодировки ASCII.


К сожалению, в настоящее время существуют пять различных кодировоккириллицы (КОИ8-Р, Windows. MS-DOS, Macintosh и ISO). Из-за этого частовозникают проблемы с переносом русского текста с одного компьютера на другой,из одной программной системы в другую.

Хронологически одним из первых стандартов кодирования русских букв накомпьютерах был КОИ8 («Код обмена информацией, 8-битный»). Этакодировка применялась еще в 70-е годы на компьютерах серии ЕС ЭВМ, а ссередины 80-х стала использоваться в первых русифицированных версияхоперационной системы UNIX.

Рис.4  Кодировка КОИ8.

От начала 90-х годов, времени господства операционной системы MS DOS,остается кодировка CP866 («CP» означает «Code Page»,»кодовая страница»).

Рис.5  Кодировка CP866 .

Компьютеры фирмы Apple, работающие под управлением операционной системы MacOS, используют свою собственную кодировку Mac.

Рис.6 Кодировка  Mac.

Кроме того, Международная организация по стандартизации (InternationalStandards Organization, ISO) утвердила в качестве стандарта для русского языкаеще одну кодировку под названием ISO 8859-5.

Рис. 7 Кодировка ISO 8859-5. 

Наиболее распространенной в настоящее время является кодировка MicrosoftWindows, обозначаемая сокращением CP1251. Введена компанией Microsoft; с учетомширокого распространения операционных систем (ОС) и других программныхпродуктов этой компании в Российской Федерации она нашла широкоераспространение.

Рис. 8 Кодировка CP1251.

С конца 90-х годов проблема стандартизации символьного кодирования решаетсявведением нового международного стандарта, который называется Unicode.

Рис.9 Кодировка Unicode.

Это 16-разрядная кодировка, т.е. в ней на каждый символ отводится 2 байтапамяти. Конечно, при этом объем занимаемой памяти увеличивается в 2 раза.

Нозато такая кодовая таблица допускает включение до 65536 символов.

Полнаяспецификация стандарта Unicode включает в себя все существующие, вымершие иискусственно созданные алфавиты мира, а также множество математических,музыкальных, химических и прочих символов.

Внутреннее представление слов впамяти компьютера

с помощью таблицы ASCII

СловаПамять
file01100110011010010110110001100101
disk01100100011010010111001101101011

Иногда бывает так, что текст, состоящий из букв русского алфавита,полученный с другого компьютера, невозможно прочитать — на экране мониторавидна какая-то «абракадабра». Это происходит оттого, что накомпьютерах применяется разная кодировка символов русского языка.

Рис. 10.

Таким образом, каждая кодировка задается своейсобственной кодовой таблицей. Как видно из таблицы, одному и тому же двоичному коду в различных кодировках поставлены в соответствие различные символы.

Например,последовательность числовых кодов 221, 194, 204 в кодировке СР1251 образуетслово «ЭВМ» (Рис. 10), тогда как в других кодировках это будет бессмысленный наборсимволов.

К счастью, в большинстве случаев пользователь не должен заботиться о перекодировках текстовых документов, так как это делаютспециальные программы-конверторы, встроенные в приложения.

Источник: https://www.sites.google.com/site/ivanovsinform/teoreticeskij-material/kodirovanie-informacii/kodirovanie-tekstovoj-informacii

Кодирование текстовой информации

Двоичное кодирование текстовой информации

Минимальные единицы измерения информации – это бит и байт.

Один бит позволяет закодировать 2 значения (0 или 1).

Используя два бита, можно закодировать 4 значения: 00, 01, 10, 11.

Тремя битами кодируются 8 разных значений: 000, 001, 010, 011, 100, 101, 110, 111.

Из приведенных примеров видно, что добавление одного бита увеличивает в 2 раза то количество значений, которое можно закодировать:

1 бит кодирует     –> 2 разных значения    (21 = 2),

2 бита кодируют –> 4 разных значения    (22 = 4),

3 бита кодируют –> 8 разных значений    (23 = 8),

4 бита кодируют –> 16 разных значений   (24 = 16),

5 бит кодируют   –> 32 разных значения   (25 = 32),

6 бит кодируют   –> 64 разных значения   (26 = 64),

7 бит кодируют   –> 128 разных значения (27 = 128),

8 бит кодируют    –> 256 разных значений (28 = 256),

9 бит кодируют   –> 512 разных значений  (29 = 512),

10 бит кодируют –> 1024 разных значений (210 = 1024).

Мы помним, что в одном байте не 9 и не 10 бит, а всего 8. Следовательно, с помощью одного байта можно закодировать 256 разных символов. Как Вы думаете, много это или мало? Давайте посмотрим на примере кодирования текстовой информации.

В русском языке 33 буквы и, значит, для их кодирования надо 33 байта. Компьютер различает большие (заглавные) и маленькие (строчные) буквы, только если они кодируются различными кодами. Значит, чтобы закодировать большие и маленькие буквы русского алфавита, потребуется 66 байт.

Для больших и маленьких букв английского алфавита потребуется ещё 52 байта. В итоге получается 66 + 52 = 118 байт.

Сюда надо ещё добавить цифры (от 0 до 9), символ «пробел», все знаки препинания: точку, запятую, тире, восклицательный и вопросительный знаки, скобки: круглые, фигурные и квадратные, а также знаки математических операций: +, –, =, / (это деление), * (это умножение). Добавим также специальные символы: %, $, &, @, #, № и др. Все это вместе взятое как раз и составляет около 256 различных символов.

А дальше дело осталось за малым. Надо сделать так, чтобы все люди на Земле договорились между собой о том, какие именно коды (с 0 до 255, т.е. всего 256) присвоить символам.

Допустим, все люди договорились, что код 33 означает восклицательный знак (!), а код 63 – вопросительный знак (?). И так же – для всех применяемых символов.

Тогда это будет означать, что текст, набранный одним человеком на своем компьютере, всегда можно будет прочитать и распечатать другому человеку на другом компьютере.

Таблица ASCII

Такая всеобщая договоренность об одинаковом использовании чего-либо называется стандартом. В нашем случае стандарт должен представлять из себя таблицу, в которой зафиксировано соответствие кодов (с 0 до 255) и символов. Подобная таблица называется таблицей кодировки.

Но не всё так просто. Ведь символы, которые хороши, например, для Греции, не подойдут для Турции потому, что там используются другие буквы. Аналогично то, что хорошо для США, не подойдет для России, а то, что подойдет для России, не годится для Германии.

Поэтому приняли решение разделить таблицу кодов пополам.

Первые 128 кодов (с 0 до 127) должны быть стандартными и обязательными для всех стран и для всех компьютеров, это – международный стандарт.

А со второй половиной таблицы кодов (с 128 до 255) каждая страна может делать все, что угодно, и создавать в этой половине свой стандарт – национальный.

Первую (международную) половину таблицы кодов называют таблицей ASCII, которую создали в США и приняли во всем мире.

За вторую половину кодовой таблицы (с 128 до 255) стандарт ASCII не отвечает. Разные страны создают здесь свои национальные таблицы кодов.

Может быть и так, что в пределах одной страны действуют разные стандарты, предназначенные для различных компьютерных систем, но только в пределах второй половины таблицы кодов.

Коды из международной таблицы ASCII

0-31 – особые символы, которые не распечатываются на экране или на принтере, а служат для выполнения специальных действий (например, для «перевода каретки» – перехода текста на новую строку, или для «табуляции» – установки курсора на специальные позиции в строке текста и т.п.).

32 – пробел (разделитель между словами – это тоже символ, подлежащий кодировке, хоть он и отображается в виде «пустого места» между словами и символами),

33-47 – специальные символы (круглые скобки и пр.) и знаки препинания (точка, запятая и пр.),

48-57 – цифры от 0 до 9,

58-64 – математические символы (плюс (+), минус (-), умножить (*), разделить (/) и пр.) и знаки препинания (двоеточие, точка с запятой и пр.),

65-90 – заглавные (прописные) английские буквы,

91-96 –  специальные символы (квадратные скобки и пр.),

97-122 – маленькие (строчные) английские буквы,

123-127 – специальные символы (фигурные скобки и пр.).

За пределами таблицы ASCII, начиная с цифры 128 по 159, идут заглавные (прописные) русские буквы, а со 160 по 170 и с 224 по 239 – маленькие (строчные) русские буквы.

Кодировка слова МИР

Пользуясь показанной кодировкой, мы можем представить себе, как компьютер кодирует и затем воспроизводит, например, слово МИР (заглавными буквами). Это слово представляется тремя кодами: букве М соответствует код 140 (по национальной российской системе кодировки), И – это код 136 и Р – это 144.

Но как уже говорилось ранее, компьютер воспринимает информацию только в двоичном виде, т.е. в виде последовательности нулей и единиц. Каждый байт, соответствующий каждой букве слова МИР, содержит последовательность из восьми нулей и единиц. Используя правила перевода десятичной информации в двоичную, можно заменить десятичные значения кодов букв на их двоичные аналоги.

Десятичной цифре 140 соответствует двоичное число 10001100. Это можно проверить, если сделать следующие вычисления: 27 + 23 +22 = 140. Степень, в которую возводится каждая «двойка»  – это номер позиции двоичного числа 10001100, в которой стоит «1», причем позиции нумеруются справа налево, начиная с нулевого номера  позиции: 0, 1, 2 и т.д.

Более подробно о переводе чисел из одной системы счисления в другую можно узнать, например, из учебников по информатике или через Интернет.

Аналогичным образом можно убедиться, что цифре 136 соответствует двоичное число 10001000 (проверка: 27 + 23 = 136). А цифре 144 соответствует двоичное число 10010000 (проверка: 27 + 24 = 144).

Таким образом, в компьютере слово МИР будет храниться в виде следующей последовательности нулей и единиц (бит): 10001100  10001000  10010000.

Разумеется, что все показанные выше преобразования данных производятся с помощью компьютерных программ, и они не видны пользователям. Они лишь наблюдают результаты работы этих программ, как при вводе информации с помощью клавиатуры, так и при ее выводе на экран монитора или на принтер.

Следует отметить, что на уровне изучения компьютерной грамотности пользователям компьютеров не обязательно знать двоичную систему счисления. Достаточно иметь представление о десятичных кодах символов.

Только системные программисты на практике используют двоичную, шестнадцатеричную, восьмеричную и иные системы счисления.

Особенно это важно для них, когда компьютеры выводят сообщения об ошибках в программном обеспечении, в которых указываются ошибочные значения без преобразования в десятичную систему.

Упражнения по компьютерной грамотности, позволяющие самостоятельно увидеть и почувствовать описанные системы кодировок, приведены в статье «Проверяем, кодирует ли компьютер текст?»

P.S. Статья закончилась, но можно еще прочитать:

Представление информации в компьютере

Что такое переменная в программировании и чем она отличается от константы

Смотрим на кодировку цвета

Получайте актуальные статьи по компьютерной грамотности прямо на ваш почтовый ящик.
Уже более 3.000 подписчиков

.

Важно: необходимо подтвердить свою подписку! В своей почте откройте письмо для активации и кликните по указанной там ссылке. Если письма нет, проверьте папку Спам.

Источник: https://www.compgramotnost.ru/kodirovanie-informacii/kodirovanie-tekstovoj-informacii

Двоичное кодирование текстовой информации

Двоичное кодирование текстовой информации

Двоичное кодирование текстовой информации.

p align=»justify»>Традиционно для кодирования одного символа используется 1 байт (8 двоичных разрядов). Это позволяет закодировать N = 28 = 256 различных символов, которых обычно бывает достаточно для представления тексто­вой информации (прописные и заглавные буквы русского и латинского алфавита, цифры, знаки, графические символы и т.д.).

Начиная с 60 годов, компьютеры все больше стали использоваться для обработки текстовой информации.

Традиционно для кодирования одного символа используется 1 байт (8 двоичных разрядов). Это позволяет закодировать N = 28 = 256 различных символов, которых обычно бывает достаточно для представления тексто­вой информации (прописные и заглавные буквы русского и латинского алфавита, цифры, знаки, графические символы и т.д.).

При двоичном кодировании текстовой информации каждому символу ставится в соответствие своя уникальная последовательность из восьми нулей и единиц, свой уникаль­ный двоичный код от 00000000 до 11111111 (десятичный код от 0 до 255).

Присвоение символу конкретного двоичного кода — это вопрос соглашения, которое фиксируется в кодовой таблице. Первые 33 кода (с 0 по 32) соответствуют не символам, а операциям (перевод строки, ввод про­бела и т.д.). Коды с 33 по 127 являются интернациональными и соответствуют символам латинского алфавита, цифрам, знакам арифметических операций и знакам препинания.

Коды с 128 по 255 являются национальными, т.е. в национальных кодировках одному и тому же коду соответствуют различные символы. К сожалению, в настоящее время существуют пять различных кодовых таблиц для русских букв, поэтому тексты, созданные в одной кодировке, не будут правильно отображаться в другой.

Хронологически одним из первых стандартов кодирования русских букв на компьютерах был код КОИ-8 («Код обмена информацией 8-битный»). Эта кодировка применяется на компьютерах с операционной системой UNIX.

Наиболее распространенная кодировка- это стандартная кириллическая кодировка Microsoft Windows, обозначаемая сокращением СР1251 («СР» означает «Code Page», «кодовая страница»). Все Windows-приложения, работающие с русским языком, поддерживают эту кодировку.

Таблица 3.2. Кодировки символов

Для работы в среде операционной системы MS-DOS используется «альтернативная» кодировка, в терминологии фирмы Microsoft — кодировка СР866.

Фирма Apple разработала для компьютеров Macintosh свою собственную кодировку русских букв (Мае).

Международная организация по стандартизации (International Standards Organization, ISO) утвердила в качестве стандарта для русского языка еще одну кодировку под названием ISO 8859-5.

Как видно из таблицы, одному и тому же двоичному коду в различных кодировках поставлены в соответствие различные символы. Каждая кодировка задается своей собственной кодовой таблицей.

Например, последовательность числовых кодов 221, 194, 204 в кодировке СР1251 образует слово ЭВМ, тогда как в других кодировках это будет бессмысленный набор символов.

К счастью, в большинстве случаев пользователь не должен заботиться о перекодировках текстовых документов. При работе в приложениях Windows предусмотрена возможность автоматической перекодировки документов, созданных в приложениях MS-DOS. При работе в Интернет с использованием броузеров Internet Explorer и Netscape Communicator происходит автоматическая перекодировка Web-страниц.

В последнее время появился новый международный стандарт Unicode, который отводит на каждый символ не один байт, а два, и потому с его помощью можно закодировать не 256 символов, а N = 216 = 65536 различных символов. Эту кодировку поддерживает платформа Microsoft WindowsOffice 97.

Двоичное кодирование графической информации

С 80-х годов интенсивно развивается технология обработки на компьютере графической информации. Компьютерная графика позволяет создавать и редактировать рисунки, схемы, чертежи, преобразовывать изображения (фотографии, слайды и т.д.), представлять статистические данные в форме деловой графики, создавать анимационные модели (научные, игровые и т.д.), обрабатывать «живое видео».

Графическая информация на экране монитора представляется в виде изображения, которое формируется из точек (пикселей). В простейшем случае (черно-белое изображение без градаций серого цвета) каждая точка экрана может иметь лишь два состояния — «черная» или «белая», т.е. для хранения ее состояния необходим 1 бит.

Цветные изображения могут иметь различную глубину цвета (бит на точку 4, 8, 16, 24). Каждый цвет можно рассматривать как возможное состояние точки, и тогда по формуле N = 21 может быть вычислено количество цветов, отображаемых на экране монитора.

Таблица 3.3. Количество отображаемых цветов

Изображение может иметь различный размер, который определяется количеством точек по горизонтали и по вертикали В современных персональных компьютерах обычно используются четыре основных размера изображения или разрешающих способностей экрана: 640*480, 800*600, 1024*768 и 1280*1024 точки.

Для того чтобы на экране монитора формировалось изображение, информация о каждой его точке (цвет точки) должна храниться в видеопамяти компьютера. Рассчитаем необходимый объем видеопамяти для наиболее распространенного в настоящее время графического режима (800*600 точек, 16 бит на точку).

Всего точек на экране: 800 * 600 = 480000

Необходимый объем видеопамяти: 16 бит * 480000 = 7680000 бит = 960000 байт = 937,5 Кбайт.

Аналогично рассчитывается необходимый объем видеопамяти для других графических режимов.

Таблица 3.4. Объем видеопамяти для различных графических режимов

Современные компьютеры обладают такими техническими характеристиками, которые позволяют обрабатывать и выводить на экран, так называемое «живое видео», т.е. видеоизображение естественных объектов.

изображение формируется из отдельных кадров, которые сменяют друг друга с высокой частотой (не воспринимаемой глазом). Обычно частота кадров составляет 25 Гц, т.е. за 1 секунду сменяется 25 кадров.

Двоичное кодирование звуковой информации

С начала 90-х годов персональные компьютеры получили возможность работать со звуковой информацией Каждый компьютер, имеющий звуковую плату, микрофон и колонки, может записывать, сохранять и воспроизводить звуковую информацию С помощью специальных программных средств (редакторов аудиофайлов) открываются широкие возможности по созданию, редактированию и прослушиванию звуковых файлов Создаются программы распознавания речи и появляется возможность управления компьютером при помощи голоса

Звуковой сигнал — это непрерывная волна с изменяющейся амплитудой и частотой Чем больше амплитуда сигнала, тем он громче для человека, чем больше частота сигнала, тем выше тон Для того чтобы компьютер мог обрабатывать непрерывный звуковой сигнал, он должен быть дистретизирован, те превращен в последовательность электрических импульсов (двоичных нулей и единиц)

При двоичном кодировании непрерывного звукового сигнала он заменяется серией его отдельных выборок- отсчетов

Каждая выборка фиксирует реальную амплитуду сигнала и присваивается ей определенное, наиболее близкое, дискретное значение Чем большее количество дискретных значений может обеспечить звуковая карта и чем большее количество выборок производится за 1 секунду, тем точнее процедура двоичного кодирования

Современные звуковые карты могут обеспечить кодирование 65536 различных уровней сигнала или состояний Для определения количества бит, необходимых для кодирования, решим показательное уравнение

65536 = 21, т к 65536 = 216 , то I = 16 бит

Таким образом, современные звуковые карты обеспечивают 16-битное кодирование звука При каждой выборке значению амплитуды звукового сигнала присваивается 16-битный код

Количество выборок в секунду может быть в диапазоне от 8000 до 48000, т е частота дискретизации аналогового звукового сигнала может принимать значения от 8 до 48 Кгц При частоте 8 Кгц качество дискретизированного звукового сигнала соответствует качеству радиотрансляции, а при частоте 48 Кгц — качеству звучания аудио-CD Следует также учитывать, что возможны как моно-, так и стерео-режимы

Можно оценить информационный объем моноаудиофайла длительностью звучания 1 секунду при среднем качестве звука (16 бит, 24 Кгц) Для этого количество бит на одну выборку необходимо умножить на количество выборок в 1 секунду

16 бит * 24000 = 384000 бит = 48000 байт » 47 Кбайт

Источник: https://mirznanii.com/a/310345/dvoichnoe-kodirovanie-tekstovoy-informatsii

Кодирование текстовой (символьной) информации

Двоичное кодирование текстовой информации

План-конспект урока

Предмет: Информатика.

Класс: 10

Тема урока: “Кодирование текстовой
(символьной) информации”.

Тип урока: Обучающий.

Цели урока:

  • Познакомить учащихся со способами кодирования информации в компьютере;
  • Рассмотреть примеры решения задач;
  • Способствовать развитию познавательных интересов учащихся.
  • Воспитывать выдержку и терпение в работе, чувства товарищества и взаимопонимания.

Задачи урока:

  • Формировать знания учащихся по теме “Кодирование текстовой (символьной) информации”;
  • Содействовать формированию у школьников образного мышления;
  • Развить навыки анализа и самоанализа;
  • Формировать умения планировать свою деятельность.

Оборудование:

  • рабочие места учеников (персональный компьютер),
  • рабочее место учителя,
  • интерактивная доска,
  • практикум по информатике и информационным технологиям (авторы: Н. Угринович, Л. Босова, И. Михайлова),
  • мультимедийный проектор,
  • мультимедийная презентация,
  • электронные карточки zadachi.htm, kart_1(2,3).exe.

Ход урока

Презентация

I. Организационный момент.

На интерактивной доске первый слайд
мультимедийной презентации с темой урока.

Учитель:

Здравствуйте, ребята. Садитесь.
Дежурный, доложите об отсутствующих. (Доклад
дежурного). Спасибо.

II. Работа над темой урока.

1. Объяснение нового материала.

Объяснение нового материала проходит в форме
эвристической беседы с одновременным показом
мультимедийной презентации на интерактивной
доске (Приложение 1).

Учитель:

Кодирование какой информации мы
изучали на предыдущих занятиях?

Ответ

: Кодирование числовой информации и
представление чисел в компьютере.

Учитель

: Перейдём к изучению нового
материала. Запишите тему урока “Кодирование
текстовой информации” (слайд 1).
Рассматриваемые вопросы (слайд 2):

— исторический экскурс;

— двоичное кодирование текстовой информации;

— расчет количества текстовой информации.

Исторический экскурс

Человечество использует шифрование (кодировку)
текста с того самого момента, когда появилась
первая секретная информация. Перед вами
несколько приёмов кодирования текста, которые
были изобретены на различных этапах развития
человеческой мысли (слайд 3) [4]:

криптография – это тайнопись, система
изменения письма с целью сделать текст
непонятным для непосвященных лиц;

азбука Морзе или неравномерный
телеграфный код, в котором каждая буква или знак
представлены своей комбинацией коротких
элементарных посылок электрического тока (точек)
и элементарных посылок утроенной
продолжительности (тире);

сурдожесты – язык жестов, используемый
людьми с нарушениями слуха.

Вопрос

: Какие примеры кодирования текстовой
информации можно привести еще?

Учащиеся приводят примеры.

Учитель

: (Показ слайда 4). Один из
самых первых известных методов шифрования носит
имя римского императора Юлия Цезаря (I век до н.э.)
[4]. Этот метод основан на замене каждой буквы
шифруемого текста, на другую, путем смещения в
алфавите от исходной буквы на фиксированное
количество символов, причем алфавит читается по
кругу, то есть после буквы я рассматривается а.
Так слово байт при смещении на два
символа вправо кодируется словом гвлф.
Обратный процесс расшифровки данного слова –
необходимо заменять каждую зашифрованную букву,
на вторую слева от неё.

(Показ слайда 5) Расшифруйте фразу персидского
поэта Джалаледдина Руми “кгнусм ёогкг фесл
тцфхя фзужщз фхгрзх ёогксп”, закодированную с
помощью шифра Цезаря. Известно, что каждая буква
исходного текста заменяется третьей после нее
буквой. В качестве опоры используйте буквы
русского алфавита, расположенные на слайде.

Вопрос

: Что у вас получилось?

Ответ учащихся

:

Закрой глаза свои пусть сердце станет глазом

Ответ сравнивается с появившемся на слайде 5
правильным ответом.

Двоичное кодирование текстовой информации

Вопрос

: В каком из перечисленных приёмов
кодирования используется двоичный принцип
кодирования информации?

Ответ учащихся:

В азбуке Морзе.

Учитель

: В компьютере также используют
принцип двоичного кодирования информации.
Только вместо точки и тире используют 0 и 1 (слайд 6) [1].

Традиционно для кодирования одного символа
используется 1 байт информации.

Вопрос

: Какое количество различных символов
можно закодировать?

Ответ учащихся

: N = 2I = 28 = 256.

Учитель

: Верно. Достаточно ли этого для
представления текстовой информации, включая
прописные и строчные буквы русского и латинского
алфавита, цифры и другие символы?

Дети подсчитывают количество различных
символов:

— 33 строчные буквы русского алфавита + 33
прописные буквы = 66;

— для английского алфавита 26 + 26 = 52;

— цифры от 0 до 9 и т.д.

Учитель

: Ваш вывод?

Вывод учащихся

: Получается, что нужно 127
символов. Остается еще 129 значений, которые можно
использовать для обозначения знаков препинания,
арифметических знаков, служебных операций
(перевод строки, пробел и т.д.. Следовательно,
одного байта вполне хватает, чтобы закодировать
необходимые символы для кодирования текстовой
информации.

Учитель

: В компьютере каждый символ
кодируется уникальным кодом.

Принято интернациональное соглашение о
присвоении каждому символу своего уникального
кода. В качестве международного стандарта
принята кодовая таблица ASCII (American Standard Code for Information
Interchange) (слайд 7).

В этой таблице представлены коды от 0 до 127
(буквы английского алфавита, знаки
математических операций, служебные символы и
т.д.), причем коды от 0 до 32 отведены не символам, а
функциональным клавишам. Запишите название этой
кодовой таблицы и диапазон кодируемых символов.

Коды с 128 по 255 выделены для национальных
стандартов каждой страны. Этого достаточно для
большинства развитых стран.

Для России были введены несколько различных
стандартов кодовой таблицы (коды с 128 по 255).

Вот некоторые из них (слайд 8-9).
Рассмотрим и запишем их названия:

КОИ8-Р, СР1251, СР866, Мас,
ISO.

Откройте практикум по информатике на стр. 65-66 и
прочитайте про эти кодировочные таблицы.

Учитель

задает вопросы по прочитанному
материалу. Формулировки вопросов можно
варьировать по усмотрению преподавателя.

Например:

— какой стандарт был применён первым для
кодировки русскоязычных букв?

— какой стандарт кодировки наиболее
распространен в настоящее время?

— что означает сочетание букв “СР” в
кодировках СР1251, СР866?

Ученики

отвечают на поставленные вопросы.

Учитель

: В текстовом редакторе MS Word чтобы
вывести на экране символ по его номеру кода,
необходимо удерживая на клавиатуре клавишу “ALT”
набрать код символа на дополнительной цифровой
клавиатуре.

Запустите текстовый редактор MS Word. Удерживая
клавишу “ALT”, наберите коды на дополнительной
цифровой клавиатуре (слайд 10):

133 232 242

Какое слово получили?

Ответ

: бит.

Учитель

: Закройте файл без сохранения.

Понятие кодировки Unicode

(слайд 11) В мире существует
примерно 6800 различных языков. Если прочитать
текст, напечатанный в Японии на компьютере в
России или США, то понять его будет нельзя. Чтобы
буквы любой страны можно было читать на любом
компьютере, для их кодировки стали использовать
два байта (16 бит).

Вопрос

: Сколько символов можно закодировать
двумя байтами? (Для слабоуспевающих учащихся
можно предложить им воспользоваться инженерным
калькулятором).

Ответ учащихся: 65536

Такая кодировка называется Unicode и обозначается
как UCS-2. Этот код включает в себя все существующие
алфавиты мира, а также множество математических,
музыкальных, химических символов и многое
другое. Существует кодировка и UCS-4, где для
кодирования используют 4 байта, то есть можно
кодировать более 4 млрд. символов.

Расчет количества текстовой информации

Так как каждый символ кодируется 1 байтом, то
информационный объем текста можно узнать,
умножив количество символов в тексте на 1 байт.

Проверим это на практике. Включите монитор,
создайте текстовый документ в редакторе Блокнот
и напечатайте в нём пословицу (слайд 12): “Ученье
– атаман, а неученье – комар
”. [3]. Сколько в ней
символов?

Ответ

: 36

Учитель

: Сохраните и закройте файл.
Определите его объем в байтах. Каков он?

Ответ

: 36 байт.

Учитель

: Ваш вывод?

Ученики обсуждают и делают выводы.

2. Разбор и решение задач

Переход с режима просмотра презентации на
интерактивный режим доски.

Учитель (работа у доски)

: Рассмотрим пример
кодировки текста в различных кодировочных
таблицах. Откройте стр. 66 практикума по
информатике и информационным технологиям. В
качестве справочного материала будем
использовать представленные на рис. 2.4 и 2.5
таблицы кодировок КОИ8-Р и CP1251. (На интерактивной
доске размещаются при помощи галереи рисунков и
фото изображения этих же таблиц кодировок).
Закодируем слово “Рим” :

СР1251: 208  232 236

КОИ8-Р:242 201 205

Переведем с помощью инженерного калькулятора
последовательности кодов из десятичной системы
счисления в шестнадцатеричную. Получим:

СР1251: D0 E8 EC

КОИ8-Р: F2 C9 CD

(Переход на режим просмотра презентации).

Работа в парах.

(Класс делится на
пары).

Учитель

: Закодируем при помощи этих же таблиц
кодировки слова, предложенные вам на карточках.

Прочитайте внимательно задание на слайде (слайд 13).

Задание: Все понятия употребляются в
информатике или связаны с ней. Определите эти
понятия и закодируйте их при помощи таблиц КОИ8-Р
или CP1251.

Переведите с помощью инженерного
калькулятора последовательности кодов из
десятичной системы счисления в
шестнадцатеричную. Занесите полученный
шестнадцатеричный код без пробелов в
соответствующее Поле ввода.

Нажмите кнопку
Проверить и убедитесь в правильности решения.
Понятия записывать заглавными буквами, кроме
географических названий.

Карточка 1Карточка 2Карточка 3
Каким понятиям соответствуют приведенные ниже комментарии.1. И в дневнике ученика, и в таблице базы банных.2. И медицинская, и в компьютерной программе.Перечисленные географические названия используются в понятиях, употребляемых в информатике, или связаны с ними.1. Государство, столица которого Каир2. Город в Узбекистане, с названием которого связано понятие “алгоритм”Термины, соответствующие определениям, употребляются также в контексте устройства и работы автомобиля.1. Часть двигателя внутреннего сгорания2. Устройство в автомобиле для очистки топлива
Ответы
записьпроцедураЕгипет (египетский треугольник)Хорезм (алгоритм от фамилии среднеазиатского математика аль-Хорезми)цилиндр (совокупность дорожек с одинаковым номером на магнитных дисках)фильтр (условие, по которому производится отбор записей в базе банных)
Коды
записьСР1251: 231 224 239 232 241 252E7 E0 EF E8 F1 FCЕгипетСР1251:197 227 232 239 229 242C5 E3 E8 EF E5 F2цилиндрСР1251:246 232 235 232 237 228 240F6 E8 EB E8 ED E4 F0
процедураКОИ8-Р:208 210 207 195 197 196 213 210 193D0 D2 СF C3 C5 C4 D5 D2 C1ХорезмКОИ8-Р:232 207 210 197 218 205E8 CF D2 C5 DA CDфильтрКОИ8-Р:198 201 204 216 212 210C6 C9 CC D8 D4 D2

Учащиеся открывают карточки согласно номеру,
названному учителем для каждой пары учащихся. (Приложение 2, Приложение 3,
Приложение 4)

(При подготовке электронных карточек следует
учесть уровень сложности для различных групп
учащихся).

Учитель

: Назовите задуманные термины или
понятия. Кто получил правильный код? У кого не
получилось? В чем ваша ошибка, как вы считаете?

Учащиеся

отвечают на вопросы в форме
обсуждения.

(Переход на интерактивный режим работы доски).

Учитель

: Теперь переходим к решению задач на
количество текстовой информации и величин,
связанных с определением количества текстовой
информации.

Запишите условие задачи № 1. (На интерактивной
доске – условие задачи № 1.) [5] Считая, что
каждый символ кодируется одним байтом, оцените
информационный объем следующего предложения:

“Мой дядя самых честных правил, Когда не в
шутку занемог, Он уважать себя заставил И лучше
выдумать не мог.”

Решение: В данной фразе 108 символов,
учитывая знаки препинания, кавычки и пробелы.
Умножаем это количество на 8 бит. Получаем 108*8=864
бита. Есть ли вопросы по решению?

Учащиеся задают вопросы, если они возникают.

Учитель отвечает на вопросы или один ученик
отвечает на вопрос другого.

Учитель

: Рассмотрим задачу № 2. (Условие
выводится на интерактивной доске). Запишите её условие: Лазерный принтер Canon LBP
печатает со скоростью в среднем 6,3 Кбит в секунду.
Сколько времени понадобится для распечатки 8-ми
страничного документа, если известно, что на
одной странице в среднем по 45 строк, в строке 70
символов (1 символ – 1 байт) (см. рис. 2).

Решение:

1) Находим количество информации, содержащейся
на 1 странице:

45 * 70 * 8 бит = 25200 бит

2) Находим количество информации на 8 страницах:

25200 * 8 = 201600 бит

3) Приводим к единым единицам измерения. Для
этого Мбиты переводим в биты:

6,3*1024=6451,2 бит/сек.

4) Находим время печати: 201600: 6451,2 ? 31 секунда.

Ваши вопросы.

Учащиеся

задают вопросы, если они возникают.

Учитель отвечает на вопросы или один учащийся
отвечает на вопрос другого.

Учитель

: Теперь решим задачи на электронных
карточках. Откройте файл zadachi.htm. (Приложение
5) (Учитель называет номер карточки, для каждого
учащегося. Один ученик решает задачи у доски).
Решите задачи и запишите ответ в соответствующее
поле ввода.

В ходе выполнения задания учитель проверяет
ответы учащихся.

III. Обобщение

Вопросы учителя (слайд 14):

1. Какой принцип кодирования текстовой
информации используется в компьютере?

2. Как называется международная таблица
кодировки символов?

3. Перечислите названия таблиц кодировок для
русскоязычных символов.

4. В какой системе счисления представлены коды в
перечисленных вами таблицах кодировок?

IV. Домашнее задание

(Слайд 15) По учебнику Угриновича §
2.10, практикум по информатике и информационным
технологиям § 2.7, задания для самостоятельного
выполнения 2.58-2.63 (для учащихся со слабой
мотивацией к обучению) (2.58-2.66 для остальных
учащихся).

Учитель подводит итог урока, выставляет оценки.

До свидания, спасибо за урок.

Список используемой литературы:

  1. Информатика и информационные технологии. Учебник для 10-11 классов/Н.Д. Угринович. – М. БИНОМ. Лаборатория знаний, 2005. – 512 с.: ил.
  2. Практикум по информатике и информационным технологиям. Учебное пособие для общеобразовательных учреждений/Н.Д. Угринович, Л.Л. Босова, Н.И.

    Михайлова. – 3-е изд. – М. БИНОМ. Лаборатория знаний, 2005. – 394 с.: ил.

  3. Словарь русских пословиц и поговорок. – М.: Терра, 1997 – 350 с.
  4. Простейшие методы шифрования текста/ Д.М. Златопольский. – М.: Чистые пруды, 2007 – 32 с.
  5. Тексты демонстрационных тестов по информатике в форме и по материалам ЕГЭ 2004-2007 г.г.

28.01.2008

Источник: https://urok.1sept.ru/%D1%81%D1%82%D0%B0%D1%82%D1%8C%D0%B8/502820/

6. Двоичное кодирование текстовой информации

Двоичное кодирование текстовой информации

Кодирование заключаетсяв том, что каждому символу ставится всоответствие уникальный десятичныйкод от 0 до 255 или соответствующий емудвоичный код от 00000000 до 11111111. Такимобразом, человек различает символы поих начертаниям, а компьютер – по ихкодам.

Присвоение символуконкретного кода – это вопрос соглашения,которое фиксируется в кодовой таблице.

При вводе в компьютертекстовой информации происходит еедвоичное кодирование. Пользовательнажимает на клавиатуре клавишу ссимволом, а в компьютер поступает егодвоичный код (последовательность извосьми электрических импульсов). Кодсимвола хранится в оперативной памятикомпьютера, где занимает 1 байт.

При выводе символа наэкран происходит обратный процесс –декодирование, т.е. преобразование кодасимвола в его изображение.

7. Аналоговый и дискретный способы представления изображений и звука

Информация, в том числеграфическая и звуковая, может бытьпредставлена в аналоговойи дискретнойформе.

При аналоговомпредставлениифизическая величина принимает бесконечноемножество значений, причем ее значенияизменяются непрерывно.

При дискретном представлениифизическая величина принимает конечноемножество значений, причем величинаизменяется скачкообразно. Примерыаналогового и дискретного представленийинформации помещены в Таблице3.

Таблица 3. Примерыаналогового и дискретного представленийинформации

Тип информацииАналоговое представлениеДискретное представление
Графическая информацияПолотно живописной картины, цвет которой меняется непрерывноИзображение, напечатанное с помощью струйного принтера (состоит из отдельных точек разного цвета)
Звуковая информацияВиниловая пластинка (звуковая дорожка меняет свою форму непрерывно)-CD (звуковая дорожка содержит участки с различной отражающей способностью)

Преобразованиеграфической и звуковой информации изаналоговой формы в дискретную производитсяпутем дискретизации,т.е. разбиения непрерывного графическогоизображения (звукового сигнала) наотдельные элементы. В процесседискретизации производится кодирование,т.е. присвоение каждому элементуконкретного значения в форме кода.

Дискретизация– это преобразование непрерывныхизображений и звука в набор дискретныхзначений в форме кода.

8. Двоичное кодирование графической информации

В процессе кодированияизображения производится пространственнаядискретизация.Пространственную дискретизациюизображения можно сравнить с построениемизображения из мозаики. Изображениеразбивается на отдельные мелкие фрагменты(точки), каждому из которых присваиваетсякод цвета.

Качество кодированиязависит от размера точки (чем меньшеразмер точки, тем качество выше) и отцветовой палитры — количества цветов(чем больше количество, тем выше качествоизображения).

Формирование растровогоизображения.

Графическая информацияна экране монитора представляет собойрастровоеизображение,которое формируется из определенногоколичества строк, содержащих определенноеколичество точек – пикселей.

Качество изображенияопределяется разрешающей способностьюмонитора, например, 800*600, 1280*1024. Чембольше разрешающая способность, темвыше качество изображения.

Рассмотрим формированиена экране монитора растрового изображенияс разрешением 800*600 (800 точек на 600 строк,итого 480 000 точек на экране).

В простейшемслучае (черно-белое изображение безградаций серого цвета) – каждая точкаможет иметь одно из двух состояний –”черная” или “белая”, т.е для храненияее состояния необходим 1 бит.

Такимобразом, объем черно-белого изображения(количество информации) равен:

= *1 (бит)

Цветные изображенияформируются в соответствии с двоичнымкодом цвета каждой точки (хранится ввидеопамяти). Цветные изображения могутиметь различную глубину цвета, котораязадается количеством битов, используемыхдля кодирования цвета, например: 8, 16, 24или 32 бита.

Качество двоичногокодирования изображения определяетсяразрешающей способностью и глубинойцвета (См. Таблицу4).

Количество цветов Nможет быть вычислено по формуле: N=2i,где i– глубина цвета.

Таблица 4. Глубинацвета и количество отображаемых цветов.

Глубина цвета (i)816 (High Color)24 (True Color)32 (True Color)
Количество изображаемых цветов (N)28=256216=65 536224= 16 777 216232= 4 294 967 296

Цветное изображениена экране монитора формируется за счетсмешивания базовых цветов: красного,зеленого и синего. Для получения богатойпалитры цветов базовым цветам могутбыть заданы различные интенсивности.

Например, при глубине цвета в 24 бита накаждый из цветов выделяется по 8 бит,т.е. для каждого из цветов возможныN=28=256уровней интенсивности, заданные двоичнымикодами от минимальной 00000000 до максимальной11111111 (См.

Таблицу5).

Таблица 5. Формированиенекоторых цветов при глубине цвета 24бита.

НазваниеИнтенсивность
цветаКрасныйЗеленыйСиний
Черный000000000000000000000000
Красный111111110000000000000000
Зеленый000000001111111100000000
Синий000000000000000011111111
Голубой000000001111111111111111
Желтый111111111111111100000000
Белый111111111111111111111111

Задание 21.(Задание A20демоверсии 2005 г., А17 демоверсии 2006 г.)

Для хранения растровогоизображения размером 128*128 пикселейотвели 4 килобайта памяти. Каковомаксимально возможное число цветов впалитре изображения?

Решение.

Воспользуемся формулами:

= *(5)
=N = 2i, где i – глубина цвета.(6)

В нашем случае:

= 4 Кб = 4*210байт = 22*210байт = 212 байт == 8*212 бит = 23*212бит = 215 бит(8)
= 128*128 = 27*27=214.(9)

Подставив значения(8) и (9) в (5), получим, что: 215= 214 *i,откуда i=2.

Тогда по формуле (6): =N= 2i=22=4,что соответствует ответу №4.

Ответ:4.

Источник: https://studfile.net/preview/6229944/page:6/

Презентация по информатике на тему

Двоичное кодирование текстовой информации

Инфоурок › Информатика ›Презентации›Презентация по информатике на тему «Двоичное кодирование текстовой информации»

Описание презентации по отдельным слайдам:

1 слайд 2 слайдОписание слайда:

Начиная с 60-х годов, компьютеры все больше стали использовать для обработки текстовой информации и в настоящее время большая часть ПК в мире занято обработкой именно текстовой информации. Для представления текстовой информации достаточно 256 знаков. По формуле N = 2I 256= 28 , следовательно для кодирования одного символа используется количество информации равное 1 байту.

3 слайдОписание слайда:

Кодирование заключается в том, что каждому символу ставиться в соответствие уникальный двоичный код от 00000000 до 11111111 (или десятичный код от 0 до 255).

4 слайдОписание слайда:

Важно, что присвоение символу конкретного кода – это вопрос соглашения, которое фиксируется кодовой таблицей. Для разных типов ЭВМ используются различные кодировки

5 слайдОписание слайда:

С распространением IBM PC международным стандартом стала таблица кодировки ASCII (American Standart Code for Information Interchange) – Американский стандартный код для информационного обмена.

6 слайдОписание слайда:

Стандартной в этой таблице является только первая половина, т.е. символы с номерами от 0 (00000000) до 127 (0111111). Сюда входят буква латинского алфавита, цифры, знаки препинания, скобки и некоторые другие символы. Остальные 128 кодов используются в разных вариантах. В русских кодировках размещаются символы русского алфавита

7 слайд 8 слайдОписание слайда:

Таблица расширенного кода ASCII Кодировка Windows-1251 (CP1251)

9 слайдОписание слайда:

В настоящее время существует 5 разных кодовых таблиц для русских букв (КОИ8, СР1251, СР866, Mac, ISO). В настоящее время получил широкое распространение новый международный стандарт Unicode, который отводит на каждый символ два байта. С его помощью можно закодировать 65536 (216= 65536 ) различных символов.

10 слайдОписание слайда:

Цифры кодируются по стандарту ASCII в двух случаях – при вводе-выводе и когда они встречаются в тексте. Если цифры участвуют в вычислениях, то осуществляется их преобразование в другой двоичных код.

11 слайдОписание слайда:

Возьмем число 57. При использовании в тексте каждая цифра будет представлена своим кодом в соответствии с таблицей ASCII. В двоичной системе это – 0011010100110111. При использовании в вычислениях, код этого числа будет получен по правилам перевода в двоичную систему и получим – 00111001.

12 слайдОписание слайда:

Сегодня очень многие люди для подготовки писем, документов, статей, книг и пр. используют компьютерные текстовые редакторы. Компьютерные редакторы, в основном, работают с алфавитом размером 256 символов.

В этом случае легко подсчитать объем информации в тексте.

Если 1 символ алфавита несет 1 байт информации, то надо просто сосчитать количество символов; полученное число даст информационный объем текста в байтах.

13 слайдОписание слайда:

I=K×i, где I-информационный объем сообщения K- количество символов в тексте i- информационный вес одного символа 2i = N N- мощность алфавита

14 слайдОписание слайда:

Мощность алфавита равна 256. Сколько Кбайт памяти потребуется для сохранения 160 страниц текста, содержащего в среднем 192 символа на каждой странице?

15 слайдОписание слайда:

Мощность алфавита равна 64. Сколько Кбайт памяти потребуется, чтобы сохранить 128 страниц текста, содержащего в среднем 256 символов на каждой странице?

16 слайдОписание слайда:

Объем сообщения – 7,5 Кбайт. Известно, что данное сообщение содержит 7680 символов. Какова мощность алфавита?

17 слайдОписание слайда:

Объем сообщения равен 11 Кбайт. Сообщение содержит 11264 символа. Какова мощность алфавита?

18 слайдОписание слайда:

Племя Мумбу-Юмбу использует алфавит из букв: α β γ δ ε ζ η θ λ μ ξ σ φ ψ, точки и для разделения слов используется пробел. Сколько информации несет свод законов племени, если в нем 12 строк и в каждой строке по 20 символов?

19 слайдОписание слайда:

Для кодирования секретного сообщения используются 12 специальных значков-символов. При этом символы кодируются одним и тем же минимально возможным количеством бит. Чему равен информационный объем сообщения длиной в 256 символов?

20 слайдОписание слайда:

В чем заключается кодирование текстовой информации в компьютере? Закодируйте с помощью ASCII-кода свою фамилию, имя, номер класса. Считая, что каждый символ кодируется одним байтом, оцените информационный объем следующего предложения из пушкинского четверостишия: Певец-Давид был ростом мал, Но повалил же Голиафа!

Общая информация

Источник: https://infourok.ru/prezentaciya-po-informatike-na-temu-dvoichnoe-kodirovanie-tekstovoy-informacii-412491.html

Кодирование информации. Двоичное кодирование. Единицы измерения информации. урок. Информатика 5 Класс

Двоичное кодирование текстовой информации

На данном уроке будет рассмотрена тема «Кодирование информации. Двоичное кодирование. Единицы измерения информации». В ходе него пользователи смогут получить представление о кодировании информации, способах восприятия информации компьютеров, единицах ее измерения и двоичном кодировании.

Тема: Информация вокруг нас

Урок: Кодирование информации. Двоичное кодирование. Единицы измерения информации

На данном уроке будут рассмотрены следующие вопросы:

1. Кодирование как изменение формы представления информации.

2. Как компьютер распознает информацию?

3. Как измерить информацию?

4. Единицы измерения информации.

В мире кодов 

Зачем люди кодируют информацию? 

1. Скрыть ее от других (зеркальная тайнопись Леонардо да Винчи, военные шифровки).

2. Записать информацию короче (стенография, аббревиатура, дорожные знаки).

3. Для более легкой обработки и передачи (азбука Морзе, перевод в электрические сигналы — машинные коды).

Кодирование — это представление информации с помощью некоторого кода.

Код — это система условных знаков для представления информации. 

Способы кодирования информации 

1. Графический (см. Рис. 1) (с помощью рисунков и знаков). 

Рис. 1. Система сигнальных флагов (Источник)

2. Числовой (с помощью чисел).

Например: 11001111 11100101.

3. Символьный (с помощью символов алфавита).

Например: НКМБМ ЧГЁУ. 

Декодирование — это действие по восстановлению первоначальной формы представления информации. Для декодирования необходимо знать код и правила кодирования.

Средством кодирования и декодирования служит кодовая таблица соответствия. Например, соответствие в различных системах счисления — 24 — XXIV, соответствие алфавита каким-либо символам (Рис. 2). 

Рис. 2. Пример шифра (Источник)

Примеры кодирования информации 

Примером кодирования информации является азбука Морзе (см. Рис. 3). 

Рис. 3. Азбука Морзе (Источник)

В азбуке Морзе используется всего 2 символа — точка и тире (короткий и длинный звук).

Еще одним примером кодирования информации является флажковая азбука (см. Рис. 4). 

Рис. 4. Флажковая азбука (Источник)

Также примером является азбука флагов (см. Рис. 5). 

Рис. 5. Азбука флагов (Источник)

Всем известный пример кодирования — нотная азбука (см. Рис. 6). 

Рис. 6. Нотная азбука (Источник)

Рассмотрим следующую задачу:

Используя таблицу флажковой азбуки (см. Рис. 7), необходимо решить следующую задачу: 

Рис. 7

Старший помощник Лом сдает экзамен капитану Врунгелю. Помогите ему прочитать следующий текст (см. Рис. 8): 

Рис. 8

Представление информации происходит в различных формах в процессе восприятия окружающей среды живыми организмами и человеком, в процессах обмена информацией между человеком и человеком, человеком и компьютером, компьютером и компьютером. 

Кодирование — это операция преобразования знаков или групп знаков одной знаковой системы в знаки или группы знаков другой знаковой системы. 

Примером может служить язык жестов (см. Рис. 9). 

Рис. 9. Азбука жестов (Источник) 

Вокруг нас существуют преимущественно два сигнала, например:

— Светофор: красный — зеленый;

— Вопрос: да — нет;

— Лампа: горит — не горит;

— Можно — нельзя;

— Хорошо — плохо;

— Истина — ложь;

— Вперед — назад;

— Есть — нет;

— 1 — 0. 

Всё это сигналы, обозначающие количество информации в 1 бит.

1 бит — это такое количество информации, которое позволяет нам выбрать один вариант из двух возможных.

Компьютер — это электрическая машина, работающая на электронных схемах. Чтобы компьютер распознал и понял вводимую информацию, ее надо перевести на компьютерный (машинный) язык.

Алгоритм, предназначенный для исполнителя, должен быть записан, то есть закодирован, на языке, понятном компьютеру.

Это электрические сигналы: проходит ток или не проходит ток.

Машинный двоичный язык — последовательность «0» и «1». Каждое двоичное число может принимать значение 0 или 1.

Каждая цифра машинного двоичного кода несет количество информации, равное 1 бит. 

Устройства10
Электронные схемыПроводят электрический токНе проводят электрический ток
Участок поверхности магнитного носителя (жесткий диск, дискета)НамагниченРазмагничен
Участок поверхности лазерного дискаОтражает лучНе отражает луч

Двоичное число, которое представляет наименьшую единицу информации, называется бит. Бит может принимать значение либо 0, либо 1. Наличие магнитного или электронного сигнала в компьютере означает 1, отсутствие 0.

Строка из 8 битов называется байт. Эту строку компьютер обрабатывает как отдельный символ (число, букву).

Рассмотрим пример. Слово ALICE состоит из 5 букв, каждая из которых на языке компьютера представлена одним байтом (см. Рис. 10). Стало быть, Alice можно измерить как 5 байт. 

Рис. 10. Двоичный код (Источник) 

Кроме бита и байта, существуют и другие единицы измерения информации.

 Название  Сокращенное обозначение Размер в байтах Степень 
 Килобайт Кбайт, Kb1 024210
МегабайтМбайт, Mb1 048 576220
ГигабайтГбайт, Gb1 079 741 824230
ТерабайтТбайт, Tb 1 099 511 627 776 240

Список литературы

1. Босова Л.Л. Информатика и ИКТ: Учебник для 5 класса. – М.: БИНОМ. Лаборатория знаний, 2012.

2. Босова Л.Л. Информатика: Рабочая тетрадь для 5 класса. – М.: БИНОМ. Лаборатория знаний, 2010.

3. Босова Л.Л., Босова А.Ю. Уроки информатики в 5-6 классах: Методическое пособие. – М.: БИНОМ. Лаборатория знаний, 2010.

Рекомендованные ссылки на ресурсы интернет 

1. Учительский портал (Источник).

2. Фестиваль «Открытый урок» (Источник).

3. Информатика в школе (Источник).

Домашнее задание 

1. §1.6, 1.7 (Босова Л.Л. Информатика и ИКТ: Учебник для 5 класса).

2. Стр. 28, задания 1, 4; стр. 30, задания 1, 4, 5, 6 (Босова Л.Л. Информатика и ИКТ: Учебник для 5 класса).

Источник: https://interneturok.ru/lesson/informatika/5-klass/informatsiya-vokrug-nas/kodirovanie-informatsii-dvoichnoe-kodirovanie-edinitsy-izmereniya-informatsii

Каким же образом текстовая информация представлена в памяти компьютера?

Тексты вводятся в память компьютера с помощью клавиатуры. На клавишах написаны привычные нам буквы, цифры, знаки препинания и другие символы. В оперативную память они попадают в двоичном коде. Это значит, что каждый символ представляется 8-разрядным двоичным кодом.

Кодирование заключается в том, что каждому символу ставится в соответствие уникальный десятичный код от 0 до 255 или соответствующий ему двоичный код от 00000000 до 11111111. Таким образом, человек различает символы по их начертанию, а компьютер — по их коду.

Удобство побайтового кодирования символов очевидно, поскольку байт — наименьшая адресуемая часть памяти и, следовательно, процессор может обратиться к каждому символу отдельно, выполняя обработку текста. С другой стороны, 256 символов – это вполне достаточное количество для представления самой разнообразной символьной информации.

Теперь возникает вопрос, какой именно восьмиразрядный двоичный код поставить в соответствие каждому символу.

Понятно, что это дело условное, можно придумать множество способов кодировки.

Все символы компьютерного алфавита пронумерованы от 0 до 255. Каждому номеру соответствует восьмиразрядный двоичный код от 00000000 до 11111111. Этот код просто порядковый номер символа в двоичной системе счисления.

Таблица, в которой всем символам компьютерного алфавита поставлены в соответствие порядковые номера, называется таблицей кодировки

Для разных типов ЭВМ используются различные таблицы кодировки.

Международным стандартом для ПК стала таблица ASCII (читается аски) (Американский стандартный код для информационного обмена).

Таблица кодов ASCII делится на две части.

Международным стандартом является лишь первая половина таблицы, т.е. символы с номерами от 0 (00000000), до 127 (01111111).

Структура таблицы кодировки ASCII

Символы с номерами от 0 до 31 принято называть управляющими.
        Их функция – управление процессом вывода текста на экран или печать, подача звукового сигнала, разметка текста и т.п.

Стандартная часть таблицы (английский). Сюда входят строчные и прописные буквы латинского алфавита, десятичные цифры, знаки препинания, всевозможные скобки, коммерческие и другие символы.         Символ 32 — пробел, т.е. пустая позиция в тексте.

        Все остальные отражаются определенными знаками.

Альтернативная часть таблицы (русская).

        Вторая половина кодовой таблицы ASCII, называемая кодовой страницей (128 кодов, начиная с 10000000 и кончая 11111111), может иметь различные варианты, каждый вариант имеет свой номер.

        Кодовая страница в первую очередь используется для размещения национальных алфавитов, отличных от латинского. В русских национальных кодировках в этой части таблицы размещаются символы русского алфавита.

Первая половина таблицы кодов ASCII

Обращаю ваше внимание на то, что в таблице кодировки буквы (прописные и строчные) располагаются в алфавитном порядке, а цифры упорядочены по возрастанию значений. Такое соблюдение лексикографического порядка в расположении символов называется принципом последовательного кодирования алфавита.

Для букв русского алфавита также соблюдается принцип последовательного кодирования.

Вторая половина таблицы кодов ASCII

К сожалению, в настоящее время существуют пять различных кодировок кириллицы (КОИ8-Р, Windows. MS-DOS, Macintosh и ISO). Из-за этого часто возникают проблемы с переносом русского текста с одного компьютера на другой, из одной программной системы в другую.

Хронологически одним из первых стандартов кодирования русских букв на компьютерах был КОИ8 («Код обмена информацией, 8-битный»). Эта кодировка применялась еще в 70-ые годы на компьютерах серии ЕС ЭВМ, а с середины 80-х стала использоваться в первых русифицированных версиях операционной системы UNIX.

От начала 90-х годов, времени господства операционной системы MS DOS, остается кодировка CP866 («CP» означает «Code Page», «кодовая страница»).

Компьютеры фирмы Apple, работающие под управлением операционной системы Mac OS, используют свою собственную кодировку Mac.

Кроме того, Международная организация по стандартизации (International Standards Organization, ISO) утвердила в качестве стандарта для русского языка еще одну кодировку под названием ISO 8859-5.

Наиболее распространенной в настоящее время является кодировка Microsoft Windows, обозначаемая сокращением CP1251.

С конца 90-х годов проблема стандартизации символьного кодирования решается введением нового международного стандарта, который называется Unicode. Это 16-разрядная кодировка, т.е. в ней на каждый символ отводится 2 байта памяти.

Конечно, при этом объем занимаемой памяти увеличивается в 2 раза. Но зато такая кодовая таблица допускает включение до 65536 символов.

Полная спецификация стандарта Unicode включает в себя все существующие, вымершие и искусственно созданные алфавиты мира, а также множество математических, музыкальных, химических и прочих символов.

Внутреннее представление слов в памяти компьютера

Иногда бывает так, что текст, состоящий из букв русского алфавита, полученный с другого компьютера, невозможно прочитать — на экране монитора видна какая-то «абракадабра». Это происходит оттого, что на компьютерах применяется разная кодировка символов русского языка.

назад

Источник: http://www.school497.ru/download/u/02/les10/les.html

Refy-free
Добавить комментарий