Кодирование текстовой информации

Презентация к уроку по информатике и икт (9 класс) по теме: Кодирование текстовой информации

Кодирование текстовой информации

Слайд 1

Кодирование текстовой информации Автор: Сергеева Светлана Александровна, учитель информатики МБОУ СОШ № 27 , г. Дзержинска, Нижегородской обл.

Слайд 2

Текстовая информация – это информация, выраженная с помощью естественных или формальных языков в письменной форме.

Слайд 3

Двоичное кодирование текстовой информации Для кодирования 1 символа используется 1 байт информации. 1 байт 256 символов 66 букв русского алфавита 52 буквы английского алфавита 0-9 цифры Знаки препинания

Слайд 4

При двоичном кодировании текстовой информации каждому символу ставится в соответствие своя уникальная последовательность из восьми нулей и единиц, свой уникальный код от 00000000 до 11111111 (десятичный код от 0 до 255 ).

Слайд 5

Присвоение символу конкретного двоичного кода – это вопрос соглашения, которое фиксируется в кодовой таблице. Кодовая таблица – таблица , в которой устанавливается соответствие между числовыми кодами и символами.

Слайд 6

0 – 32 функциональные клавиши и операции: перевод строки, ввод пробела и т.д. 33 – 127 интернациональные: соответствуют символам латинского алфавита, цифрам, знакам арифметических операций и знакам препинания.

Слайд 8

128 – 255 национальные (кириллица), т.е. в национальных кодировках одному и тому же коду соответствуют различные символы.

Слайд 9

Кодировки знаков Двоичный код Десятичный код КОИ8 CP1251 CP866 Mac ISO 0000 0000 0 ……… 0000 1000 8 Удаление последнего символа (клавиша Backspace) ……… 0000 1101 13 Перевод строки (клавиша Enter ) ……… 0010 0000 32 Пробел 0010 0001 33 ! ……… 0101 1010 90 Z ……… 0111 1111 127  ……… 128 — Ъ А А К ……… 1100 0010 194 Б В — — Т ……… 1100 1100 204 Л М : : Ь ……… 1101 1101 221 Щ Э — Ё Н ……… 1111 1111 255 Ь я Нераз. пробел Нераз. пробел п

Слайд 10

Хронологически одним из первых стандартов кодирования русских букв на компьютерах был код КОИ – 8 («Код обмена информационный – 8 битный»). Эта кодировка применяется в компьютерах с операционной системой UNIX.

Слайд 11

Наиболее распространенная кодировка – это стандартная кириллистическая кодировка Microsoft Windows , обозначаемая сокращением CP1251 ( « CP » означает « Code Page »). Все Windows – приложения, работающие с русским языком, поддерживают эту кодировку.

Слайд 12

Для работы в среде операционной системы MS-DOS используется «альтернативная» кодировка, в терминологии фирмы Microsoft – кодировка CP 866 .

Слайд 13

Фирма Apple разработала для компьютеров Macintosh свою собственную кодировку русских букв (Mac ) .

Слайд 14

Международная организация по стандартизации (International Standards Organization, ISO) утвердила в качестве стандарта для русского языка еще одну кодировку под названием ISO 8859 – 5 .

Слайд 15

КОИ — 8 — UNIX CP1251 ( « CP » означает « Code Page ») — Microsoft Windows CP 866 — MS-DOS Mac — Macintosh ISO 8859 – 5 Стандарты кодировок:

Слайд 16

В последнее время появился новый международный стандарт Unicode , который отводит на каждый символ не один байт, а два, и поэтому с его помощью можно закодировать 65 536 различных символов. Эту кодировку поддерживает платформа Microsoft Windows.

Слайд 17

Решение задач N – количество символов в алфавите (мощность алфавита) i – информационный «вес» одного символа k – количество символов в тексте

Слайд 18

1 . Сколько килобайт составляет сообщение, содержащее 12288 бит? 2 . Каков информационный объем слова ПРОГРАММИРОВАНИЕ: А) в 16-битной кодировке; Б) в 8-битной кодировке. 3 . Книга, набранная с помощью компьютера, содержит 150 страниц, на каждой странице – 40 строк, в каждой строке – 60 символов. Каков объем информации в книге?

Слайд 19

Домашнее задание п. 2.1, № 2.1, 2.2 (стр. 52) письменно

Источник: https://nsportal.ru/shkola/informatika-i-ikt/library/2012/12/08/kodirovanie-tekstovoy-informatsii

Кодирование текстовой информации

Кодирование текстовой информации

Цели урока.

Образовательная цель: освоить способы представления информации в компьютере.

Задачи:

  1. Повторить что такое кодирование и декодирование, единицы измерения информации;
  2. Сформулировать определение текстовой информации и таблицы кодировки;
  3. Сформулировать процесс кодировки текстовой информации, продемонстрировать различные кодировки;
  4. Провести первичное закрепление.

Развивающая цель: развитие логического мышления, памяти, устойчивого познавательного интереса.

Задачи:

  1. Развивать память при повторении пройденного материала;
  2. Установить логическую связь между ранее изученными определениями и новыми;

Воспитательная цель: восприятие компьютера как инструмента обработки информационных объектов.

Задачи:

  1. Воспитывать у учащихся мотивацию к учебной деятельности.

ХОД УРОКА

1. Организационный момент

(Учитель приветствует учащихся, усаживает их на места, проверяет наличие учащихся)

Прежде чем приступить к изучению новой темы, в связи с началом новой четверти, необходимо повторить технику безопасности. Откройте тетради на первой страницы, где у вас записана техника безопасности.

2. Повторение

Мы приступаем к изучению новой главы «Кодирование и обработка текстовой информации». Откройте тетради, напишите дату и тему сегодняшнего урока «Кодирование текстовой информации»

Изучая знаковые системы вы изучали что такое кодирование. Юля, ответь, что же называется кодированием?

Кодирование — это представление информации  с помощью какой-либо знаковой системы

А процесс обратный кодированию называется…

Давайте вспомним единицы измерения. Какая наименьшая единица измерения информации?

Следующая за ней?

1 байт это сколько бит?

А следующая единица после байта?

Сколько в 1Кбайте байт?

А какую вы знаете основную формулу связанную с мощностью алфавита и количеством информации?

Информация всегда хранится и передается в закодированном виде. При разговоре информация кодируется с помощью звуков, а также жестов и мимики.

А в компьютере какие бывают виды информации?

3. Изучение нового материала

Сегодня речь пойдет о кодировании текстовой информации в компьютере. Кто может сформулировать что же такое текстовая информация? Давай Паша. Хорошо, присаживайся. Геля, а ты как думаешь. Хорошо, ну давайте теперь запишем определение текстовой информации, показанное на слайде.

Для представления текстовой информации в компьютере, это прописные и строчные буквы русского и латинского алфавита, также знаки, цифры и математические символы, т.е. все символы которые можно ввести с помощью клавиатуры, достаточно 256 знаков.

Тогда по формуле, связанной с нахождением количества информации, можно вычислить, какое количество информации необходимо, чтобы закодировать каждый знак.

Какая формула нахождения количества информации? Дима, пожалуйста

Если всего 256 знаков, то что будет равно 256 это?

Подставляя, вместо N — 256, получаем что I равно …?

Вы знаете, что вся информация в компьютере представляется в двоичной системе счисления, и текстовая информация не исключение.

Только что по формуле получили, что для кодирования каждого знака требуется количество информации равное 8 битам, т.е. длина двоичного кода знака составляет 8 двоичных знаков.

Т.е. каждому знаку необходимо поставить в соответствие уникальный код, если говорить о десятичной СС, то это от 0 до 255, а для компьютера это от 00000000 до 11111111.

При вводе в компьютер текстовой информации происходит ее двоичное кодирование. Пользователь нажимает на клавиатуре клавишу со знаком, и в компьютер поступает определенная последовательность из восьми электрических импульсов (двоичный код знака). Код знака хранится в оперативной памяти компьютера, где занимает одну ячейку.

Присваивание знаку конкретного двоичного кода — это вопрос соглашения, которое фиксируется в кодовой таблице.

Определение: Таблица, в которой всем символам компьютерного алфавита поставлены в соответствие порядковые номера, называется таблицей кодировки.

Для разных типов ЭВМ используются различные таблицы кодировки. С распространением персональных компьютеров типа IBM PC международным стандартом стала таблица кодировки под названием ASCII (American Standart Code for Information Interchange) – американский стандартный код для информационного обмена.

В процессе вывода текста на экран компьютера производится обратное перекодирование, т.е. преобразование двоичного кода знака в его изображение.

Рассмотрим кодировки знаков, представленных на экране.

Стандартной таблицей является только первая половина таблицы, т.е. символы от нуля (00000000) до 127 (01111111). Сюда входят буквы латинского алфавита, цифры, знаки препинания, скобки и некоторые другие символы.

Остальные 128 кодов, начиная с 10000000 и заканчивая 11111111, используются в разных вариантах. В русских национальных кодировках в этой части таблицы размещаются символы русского алфавита.

В настоящее время существует пять кодовых таблиц для русских букв (Windows, MS-DOS, КОИ-8, Mac, ISO), поэтому тексты, созданные в одной кодировке, не будут правильно отображаться в другой.

С таким думаю встречался хотя бы раз каждый, когда при посещении какого-нибудь интернет-ресурса, открывается страница, с так называемой «аброй-казяброй», т.е. непонятный текст. Вот это и обозначает, что кодировки не совпадают.

В последние годы широкое распространение получил новый международный стандарт кодирования текстовых символов Unicode, который отводит на каждый символ 2 байта, т.е 16 битов.

Тогда скажите пожалуйста, какое количество символов можно закодировать с помощью этой кодировки?

Такого количества символов оказалось достаточно, чтобы закодировать не только русский и латинский алфавиты, цифры, знаки, математические символы, но и греческий, арабский и другие алфавиты.

4. Закрепление

Теперь практическое задание. Я вам выдаю карточку с таблицей кодировки. И вам нужно провести кодирование написанных словосочетаний, и декодирование.

Если осталось время

1. Каков размер алфавита, используемого в компьютерах для представления текстов?

2. Сколько места в памяти занимает код одного символа?

3. Зачем ввели кодировку Unicode?

4. Имеются два текста на разных языках. Первый текст использует 32-символьный алфавит и содержит 200 символов, второй — 16-символьный алфавит и содержит 250 символов. Какой из текстов содержит большее количество информации и на сколько битов?

5. Постановка домашнего задания

Откройте дневники, запишите домашнее задание параграф 3.1 на стр.74, определения в тетради

6. Подведение итогов

Мне понравилась ваша работа на уроке. Мы начали новую программную тему, на следующем уроке продолжим с кодировками, уже вырабатывая умения на компьютере

Спасибо за урок, ребята. До свидания!

Источник: https://videouroki.net/razrabotki/kodirovanie-tekstovoy-informatsii-1.html

Кодирование текстовой информации

Кодирование текстовой информации

Если каждому символу алфавита сопоставить определенное целое число (например, порядковый номер), то с помощью двоичного кода можно кодировать и текстовую информацию. Восемь двоичных разрядов достаточно для кодирования 256 различных символов.

Этого хватит, чтобы выразить различными комбинациями восьми битов все символы английского и русского языков как строчные, так и прописные, а также знаки препинания, символы основных арифметических действий и некоторые общепринятые специальные символы, например, символ «§».

Технически это выглядит очень просто, однако всегда существовали достаточно веские организационные сложности.

В первые годы развития вычислительной техники они были связаны с отсутствием необходимых стандартов, а в настоящее время вызваны, наоборот, изобилием одновременно действующих и противоречивых стандартов.

Для того чтобы весь мир одинаково кодировал текстовые данные, нужны единые таблицы кодирования, а это пока невозможно из-за противоречий между символами национальных алфавитов, а также противоречий корпоративного характера.

Для английского языка, захватившего де-факто нишу международного средства общения, противоречия уже сняты.

Институт стандартизации США (ANSIAmericanNationalStandardInstitute) ввел в действие систему кодирования ASCII(AmericanStandardCodeforInformationInterchangeстандартный код информационного обмена США).

В системе ASCIIзакреплены две таблицы кодирования – базовая и расширенная. Базовая таблица закрепляет значения кодов от 0 до 127, а расширенная относится к символам с номерами от 128 до 255.

Первые 32 кода базовой таблицы, начиная с нулевого, отданы производителям аппаратных средств (в первую очередь производителям компьютеров и печатающих устройств).

В этой области размещаются так называемые управляющие коды, которым не соответствуют никакие символы языков, и, соответственно, эти коды не выводятся ни на экран, ни на устройства печати, но ими можно управлять тем, как производится вывод данных.

Начиная с кода 32 по код 127 размещены коды символов английского алфавита, знаков препинания, цифр, арифметических действий и некоторых вспомогательных символов. Русские буквы в таблице ASCII имеют следующие коды:

А – 10000000 И – 10001000 Р – 10010000

Б – 10000001 Й – 10001001 С – 10010001

В – 10000010 К – 10001010 Т – 10010010

Г – 10000011 Л – 10001011 У – 10010011

Д – 10000100 М – 10001100 Ф – 10010100

Е – 10000101 Н – 10001101 Х – 10010101

Ж – 10000110 О – 10001110 Ю – 10011110

З – 10000111 П – 10001111 Ь – 10011100 и т.д.

Аналогичные системы кодирования текстовых данных были разработаны и в других странах. Например, в СССР в этой области действовала система кодирования КОИ-7 (код обмена информацией, семизначный).

Однако поддержка производителей оборудования и программ вывела американский код ASCIIна уровень международного стандарта, и национальным системам кодирования пришлось «отступить» за вторую, расширенную часть системы кодирования, определяющую значения кодов от 128 по 255.

Отсутствие единого стандарта в этой области привело к множественности одновременно действующих кодировок. Только в России можно указать три действующих стандарта кодировки и еще два устаревших.

Например, кодировка символов русского языка, известная как кодировка Windows-1251, была введена «извне» – компанией Microsoft, но, учитывая широкое распространение операционных систем и других продуктов этой компании в России, она глубоко закрепилась и нашла широкое распространение. Эта кодировка используется на большинстве локальных компьютеров, работающих на платформе Windows.

Другая распространенная кодировка носит название КОИ-8 (код обмена информацией, восьмизначный) –ее происхождение относится к временам действия Совета Экономической Взаимопомощи государств Восточной Европы. Сегодня кодировка КОИ-8 имеет широкое распространение в компьютерных сетях на территории России и в российском секторе Интернета.

Международный стандарт, в котором предусмотрена кодировка символов русского алфавита, носит название кодировки ISO(InternationalStandardOrganization Международный институт стандартизации). На практике данная кодировка используется редко.

На компьютерах, работающих в операционных системах MSDOS, могут действовать еще две кодировки (ГОСТ– кодировка и ГОСТ–альтернативная). Первая из них считалась устаревшей даже в первые годы появления персональной вычислительной техники, но вторая используется и по сей день.

В связи с изобилием систем кодирования текстовых данных, действующих в России, возникает задача межсистемного преобразования данных – это одна из распространенных задач информатики.

Если проанализировать организационные трудности, связанные с созданием единой системы кодирования текстовых данных, то можно прийти к выводу, что они вызваны ограниченным набором кодов (256).

Если, например, кодировать символы не восьмиразрядными двоичными числами, а числами с большим количеством разрядов, то и диапазон возможных значений кодов станет намного больше. Такая система, основанная на 16-разрядном кодировании символов, получила название универсальной UNICODE.

Шестнадцать разрядов позволяют обеспечить уникальные коды для 65536 различных символов – этого поля достаточно для размещения в одной таблице символов большинства языков планеты.

Несмотря на тривиальную очевидность такого подхода, простой механический переход на данную систему долгое время сдерживался из-за недостаточных ресурсов средств вычислительной техники (в системе кодирования UNICODEвсе текстовые документы автоматически становятся вдвое длиннее).

Во второй половине 90-х годов технические средства достигли необходимого уровня обеспеченности ресурсами, и сегодня мы наблюдаем постепенный перевод документов и программных средств на универсальную систему кодирования.

Для индивидуальных пользователей это еще больше добавило забот по согласованию документов, выполненных в разных системах кодирования, с программными средствами, но это надо понимать как трудности переходного периода.

Источник: http://3ys.ru/osnovy-informatiki/kodirovanie-tekstovoj-informatsii.html

Как кодируется информация и в чем она измеряется — Полезное о компьютерах и программах

Как кодируется информация и в чем она измеряется - Полезное о компьютерах и программах

Страница создана: 2010-12-21, обновлена: 2017-10-27

Для того чтобы сохранить информацию, ее надо закодировать. Любая информация всегда хранится в виде кодов.

Код — набор условных обозначений для представления информации.

Кодирование — процесс представления информации в виде кода.

Для общения друг с другом мы используем код — русский язык. При разговоре этот код передается звуками, при письме — буквами.

Водитель передает сигнал с помощью гудка или миганием фар. Вы встречаетесь с кодированием информации при переходе дороги в виде сигналов светофора.

Закодировать можно и звуковую информацию: для этого существует особый метод кодирования — нотная грамота.

Та же проблема универсального средства кодирования достаточно успешно реализуется в отдельных отраслях техники, науки и культуры.

В качестве примеров можно привести систему записи математических выражений, телеграфную азбуку, морскую флажковую азбуку, систему Брайля для слепых и многое другое.

Таким образом, кодирование сводится к использованию совокупности символов по строго определенным правилам.

Кодировать информацию можно различными способами: устно; письменно; жестами или сигналами любой другой природы.

Единицы измерения информации

В качестве единицы информации условились принять один бит (английский bit — binary, digit — двоичная цифра).

Бит в теории информации — количество информации, необходимое для различения двух равновероятных сообщений.

В вычислительной технике битом называют наименьшую ;порцию; памяти компьютера, необходимую для хранения одного из двух знаков ;0; и ;1;, используемых для внутри машинного представления данных и команд.

Одним битом могут быть выражены два понятия: 0 или 1 (да или нет, черное или белое, истина или ложь и тому подобное).

Если количество битов увеличить до двух, то уже можно выразить четыре различных понятия:

00 01 10 11

Тремя битами можно закодировать восемь различных значений:

000 001 010 011 100 101 110 111

Увеличивая на единицу количество разрядов в системе двоичного кодирования, мы увеличиваем в два раза количество значений, которое может быть выражено в данной системе, то есть общая формула имеет вид:

N=2m

где N — количество независимых кодируемых значений; m — разрядность двоичного кодирования, принятая в данной системе.

Бит — слишком мелкая единица измерения. На практике чаще применяется более крупная единица — байт, равная восьми битам.

Именно восемь битов требуется для того, чтобы закодировать любой из 256 символов алфавита клавиатуры компьютера:

258=28

Широко используются также еще более крупные производные единицы информации:

Единицы измерения информации

В последнее время в связи с увеличением объемов обрабатываемой информации входят в употребление такие производные единицы, как:

Единицы измерения информации

Если каждому символу алфавита сопоставить определенное целое число (например, порядковый номер), то с помощью двоичного кода можно кодировать и текстовую информацию.

Для хранения двоичного кода одного символа выделен 1 байт=8 бит.

Учитывая, что каждый бит принимает значение 0 или 1, количество их возможных сочетаний в байте равно:

28=256

Значит, с помощью 1 байта можно получить 256 разных двоичных кодовых комбинаций и отобразить с их помощью 256 различных символов.

Такое количество символов вполне достаточно для представления текстовой информации, включая прописные и заглавные буквы русского и латинского алфавита, цифры, знаки, графические символы и так далее

Кодирование заключается в том, что каждому символу ставится в соответствие уникальный десятичный код от 0 до 255 или соответствующий ему двоичный код от 00000000 до 11111111.

Таким образом, человек различает символы по их начертанию, а компьютер — по их коду.

Важно, что присвоение символу конкретного кода — это вопрос соглашения, которое фиксируется в кодовой таблице.

Кодирование текстовой информации с помощью байтов опирается на несколько различных стандартов, но первоосновой для всех стал стандарт ASCII (American Standart Code for Information Interchange), разработанный в США в Национальном институте ANSI (American National Standarts Institute).

В системе ASCII закреплены две таблицы кодирования — базовая и расширенная.

Базовая таблица закрепляет значения кодов от 0 до 127, а расширенная относится к символам с номерами от 128 до 255.

Первые 33 кода (с 0 до 32) соответствуют не символам, а операциям (перевод строки, ввод пробела и так далее).

Коды с 33 по 127 являются интернациональными и соответствуют символам латинского алфавита, цифрам, знакам арифметических операций и знакам препинания.

Коды с 128 по 255 являются национальными, то есть в национальных кодировках одному и тому же коду соответствуют различные символы.

Как кодируется графическая информации

Графическая информация на экране монитора представляется в виде растрового изображения, которое формируется из определенного количества строк, которые, в свою очередь, содержат определенное количество точек (пикселей).

Каждому пикселю присвоен код, хранящий информацию о цвете пикселя.

Для получения черно-белого изображения (без полутонов) пиксель может принимать только два состояния: «белый» или «черный».

Тогда для его кодирования достаточно 1 бита: 1 — белый, 0 — черный.

Пиксель на цветном дисплее может иметь различную окраску. Поэтому 1 бита на пиксель — недостаточно.

Для кодирования 4-цветного изображения требуется два бита на пиксель, поскольку два бита могут принимать 4 различных состояния.

Может использоваться, например, такой вариант кодировки цветов:

00 — черный

10 — зеленый

01 — красный

11 — коричневый.

Цветное изображение на экране монитора формируется за счет смешивания трех базовых цветов: красного, зеленого, синего.

Из трех цветов можно получить восемь комбинаций:

  • Черный — 0 0 0
  • Синий — 0 0 1
  • Зеленый — 0 1 0
  • Голубой — 0 1 1
  • Красный — 1 0 0
  • Розовый — 1 0 1
  • Коричневый — 1 1 0
  • Белый — 1 1 1

Следовательно, для кодирования 8-цветного изображения требуется три бита памяти на один пиксель.

Для получения богатой палитры цветов базовым цветам могут быть заданы различные интенсивности, тогда количество различных вариантов их сочетаний, дающих разные краски и оттенки, увеличивается.

Шестнадцатицветная палитра получается при использовании 4-разрядной кодировки пикселя: к трем битам базовых цветов добавляется один бит интенсивности. Этот бит управляет яркостью всех трех цветов одновременно.

Также графическая информация может быть представлена в виде векторного изображения.

Векторное изображение представляет собой графический объект, состоящий из элементарных отрезков и дуг.

Положение этих элементарных объектов определяется координатами точек и длиной радиуса.

Для каждой линии указывается ее тип (сплошная, пунктирная, штрих-пунктирная), толщина и цвет.

Информация о векторном изображении кодируется как обычная буквенно-цифровая и обрабатывается специальными программами.

Качество изображения определяется разрешающей способностью монитора, то есть количеством точек, из которых оно складывается.

Чем больше разрешающая способность, то есть чем больше количество строк растра и точек в строке, тем выше качество изображение.

Как кодируется звуковая информация

Звук представляет собой звуковую волну с непрерывно меняющейся амплитудой и частотой.

Чем больше амплитуда, тем он громче для человека, чем больше частота сигнала, тем выше тон.

Программное обеспечение компьютера в настоящее время позволяет непрерывный звуковой сигнал преобразовывать в последовательность электрических импульсов, которые можно представить в двоичной форме.

Аудиоадаптер (звуковая плата) — специальное устройство, подключаемое к компьютеру, предназначенное для преобразования электрических колебаний звуковой частоты в числовой двоичный код при вводе звука и для обратного преобразования (из числового кода в электрические колебания) при воспроизведении звука.

В процессе записи звука аудиоадаптер с определенным периодом измеряет амплитуду электрического тока и заносит в регистр двоичный код полученной величины.

Затем полученный код из регистра переписывается в оперативную память компьютера.

Качество компьютерного звука определяется характеристиками аудиоадаптера: частотой дискретизации и разрядностью.

Источник: http://sd-company.su/article/help_computers/information_code

Кодирование текстовой информации. Язык как способ представления информации — презентация

Кодирование текстовой информации. Язык как способ представления информации - презентация

1 Кодирование текстовой информации.<\p>

2 Язык как способ представления информации Язык – система знаков (звуков, сигналов) для представления и передачи информации.<\p>

3 языки естественныеформальные Текстовая информация<\p>

4 Информацию можно выразить разными способами.<\p>

5 Знак – это элемент конечного множества отличных друг от друга элементов. Знак вместе с его смыслом называют символом. Набор знаков, в котором определен ихпорядок, называется алфавитом.<\p>

6 Коды и кодирование Код – это система условных знаков для представления информации. Кодирование – это перевод информации в удобную для передачи, обработки или хранения форму с помощью некоторого кода.<\p>

7 Кодирование числовой информации 12 – число, записанное арабскими цифрами – число, записанное римскими цифрами – число, записанное вавилонской клинописью<\p>

8 Кодирование текстовой информации КНИГА – русский язык BOOK – английский язык BUCH – немецкий язык LIVRE – французский язык<\p>

9 Азбука Брайля<\p>

10 Кодирование музыки<\p>

11 Кодирование на дорогах<\p>

12 Штрих-коды<\p>

13 «Школьное» кодирование»<\p>

14 Почтовые индексы – Волоколамск – Чухлома – Олонец – Богучар – Сургут<\p>

15 Сигнальные коды Азбука МорзеФлажковая азбука<\p>

16 Двоичное кодирование АБВАБВ<\p>

17 КОДИРОВАНИЕ ИНФОРМАЦИИ В ЭВМ Информация, циркулирующая в ЭВМ, с помощью электрических сигналов закодирована в виде последовательностей цифр 0 и 1, называемых битами. 1 символ = 8 бит информации = 1 байт.<\p>

18 Сколько нужно символов? В текстах мы используем: прописные и строчные русские буквы Аа Бб Вв … прописные и строчные латинские буквы Аа Bb Cc … знаки препинания !, ?. … цифры … знаки арифметических операций + — × … другие символы ( [ … Достаточно 256 различных символов.<\p>

19 С помощью 1 байта можно получить 256 разных двоичных кодовых комбинаций и отобразить с их помощью 256 различных символов. Кодирование заключается в том, что каждому символу ставится в соответствие уникальный десятичный код от 0 до 255 или соответствующий ему двоичный код от до Таким образом, человек различает символы по их начертанию, а компьютер — по их коду.<\p>

20 КОДИРОВАНИЕ ИНФОРМАЦИИ В ЭВМ А Q В R С S D Т Е U F V G W<\p>

21 Кодовые таблицы Соответствие символов и кодов задается с помощью специальных кодовых таблиц. В кодовых таблицах каждому символу ставится в соответветствие уникальная цепочка из восьми нулей и единиц. СимволДесятичный кодДвоичный код !…АБВ!…АБВ 33 … …<\p>

22 Присвоение символу конкретного кода — это вопрос соглашения, которое фиксируется в кодовой таблице. Кодовая таблица — это внутреннее представление символов в компьютере. Во всем мире в качестве стандарта принята таблица ASCII (American Standard Code for Information Interchange — Американский стандартный код для обмена информацией).ASCII<\p>

23 В последнее время появился новый международный стандарт Unicode, который отводит на каждый символ не один байт, а два, и потому с его помощью можно закодировать не 256, а различных символов. Эту кодировку поддерживают последние версии платформы Microsoft Windows&Office (начиная с 1997 года)<\p>

24 Кодовая таблица в системе Windows СимволДесятичный кодДвоичный кодСимволДесятичный кодДвоичный код Пробел ! * +, -. / = ? АБВГДЕЖЗИЙКЛМНОПАБВГДЕЖЗИЙКЛМНОП РСТУФХЦЧШЩЪЫЬЭЮЯРСТУФХЦЧШЩЪЫЬЭЮЯ<\p>

25 Домашнее задание: § 1.6 стр.51-54, §2.1<\p>

Источник: http://www.myshared.ru/slide/9389/

Кодирование текстовой информации

Кодирование текстовой информации

Кодирование заключается в том, что каждому символу ставится в соответствие уникальный десятичный код от 0 до 255 или соответствующий ему двоичный код от 00000000 до 11111111. Число символов в алфавите – это его мощность. Хронологически одним из первых стандартов кодирования русских букв на компьютерах был КОИ8 («Код обмена информацией, 8-битный»).

Да, не удивляйтесь: пустое место в тексте тоже должно иметь свое обозначение. Множество символов, с помощью которых записывается текст, называется алфавитом.

Двоичный код каждого символа в компьютерном тексте занимает 1 байт памяти. Тексты вводятся в память компьютера с помощью клавиатуры.

С другой стороны, 256 символов – это вполне достаточное количество для представления самой разнообразной символьной информации.

Все символы компьютерного алфавита пронумерованы от 0 до 255. Каждому номеру соответствует восьмиразрядный двоичный код от 00000000 до 11111111. Этот код просто порядковый номер символа в двоичной системе счисления. Международным стандартом является лишь первая половина таблицы, т.е. символы с номерами от 0 (00000000), до 127 (01111111).

Обращаю ваше внимание на то, что в таблице кодировки буквы (прописные и строчные) располагаются в алфавитном порядке, а цифры упорядочены по возрастанию значений. Для букв русского алфавита также соблюдается принцип последовательного кодирования.

К сожалению, в настоящее время существуют пять различных кодировок кириллицы (КОИ8-Р, Windows. MS-DOS, Macintosh и ISO).

Из-за этого часто возникают проблемы с переносом русского текста с одного компьютера на другой, из одной программной системы в другую.

Кроме того, Международная организация по стандартизации (International Standards Organization, ISO) утвердила в качестве стандарта для русского языка еще одну кодировку под названием ISO 8859-5.

Наиболее распространенной в настоящее время является кодировка Microsoft Windows, обозначаемая сокращением CP1251.

С конца 90-х годов проблема стандартизации символьного кодирования решается введением нового международного стандарта, который называется Unicode.

Конечно, при этом объем занимаемой памяти увеличивается в 2 раза. Но зато такая кодовая таблица допускает включение до 65536 символов. Полная спецификация стандарта Unicode включает в себя все существующие, вымершие и искусственно созданные алфавиты мира, а также множество математических, музыкальных, химических и прочих символов.

Иногда бывает так, что текст, состоящий из букв русского алфавита, полученный с другого компьютера, невозможно прочитать — на экране монитора видна какая-то «абракадабра». Современный компьютер может обрабатывать числовую, текстовую, графическую, звуковую и видео информацию.

Кодирование информации в компьютере

Наглядно это можно представить в виде фрагмента объединенной таблицы кодировки символов.

Впрочем, в большинстве случаев о перекодировке текстовых документов заботится на пользователь, а специальные программы — конверторы, которые встроены в приложения. В диалоговом окне появляется таблица символов для выбранного шрифта.

Для определения числового кода символа в кодировке Windows (СР1251) нужно при помощи мыши или клавиш управления курсором выбрать нужный символ, затем щелкнуть по кнопке Клавиша.

I = 1/512 * 1024 * 1024 * 8 = 16384 бит. — перевели в биты информационный объем сообщения. 216 = 65536 символов — мощность использованного алфавита. В середине 50-х годов для больших ЭВМ, которые применялись в научных и военных исследованиях, впервые в графическом виде было реализовано представление данных.

Каким же образом текстовая информация представлена в памяти компьютера?

Путем разбиения графического изображения (дискретизации) происходит преобразование графической информации из аналоговой формы в дискретную. При этом производится кодирование — присвоение каждому элементу конкретного значения в форме кода. При кодировании изображения происходит его пространственная дискретизация.

Чем меньше размер точки, а, значит, изображение составляется из большего количества точек, тем выше качество кодирования.

Создание и хранение графических объектов возможно в нескольких видах — в виде векторного, фрактального или растрового изображения.

Отдельным предметом считается 3D (трехмерная) графика, в которой сочетаются векторный и растровый способы формирования изображений. Она изучает методы и приемы построения объемных моделей объектов в виртуальном пространстве.

Чем она выше, то есть больше количество строк растра и точек в строке, тем выше качество изображения. Это происходит в результате анализа светового потока, попадающего на сетчатку глаза от отражающих или излучающих объектов. Если говорить о кодировании цветных графических изображений, то нужно рассмотреть принцип декомпозиции произвольного цвета на основные составляющие.

Источник: http://zdravbaza.ru/kodirovanie-tekstovoy-informatsii-2/

Кодирование текстовой (символьной) информации

Cлайд 1

Cлайд 2

Рассматриваемые вопросы: — исторический экскурс; — двоичное кодирование текстовой информации; — расчет количества текстовой информации.

Cлайд 3

Историческая справка Криптография — это тайнопись, система изменения письма с целью сделать текст непонятным для непосвященных лиц Азбука Морзе или неравномерный телеграфный код, в котором каждая буква или знак представлены своей комбинацией коротких элементарных посылок электрического тока (точек) и элементарных посылок утроенной продолжительности (тире) Сурдожесты — язык жестов, используемый людьми с нарушениями слуха Вопрос: Какие примеры кодирования текстовой информации можно привести еще?

Cлайд 4

Примеры кодирования «Здравствуй, Саша!» Русский текст –латинскими буквами «Zdravstvuy, Sasha!» Семафор (положение) Наскальный рисунок – БИЗОН Иероглиф «Торговец рыбой» (Китай)

Cлайд 5

Код Цезаря А Б В Г Д Е Ё Ж З И Й К Л М Н О П Р С Т У Ф Х Ц Ч Ш Щ Ъ Ы Ь Э Ю Я1 Юлий Цезарь (I век до н.э.) Замени каждую букву шифруемого текста на другую путем смещения в алфавите от исходной буквы на фиксированное количество символов! Закодируем Б А Й Т – сместим на 2 символа вправо Получим: Г В Л Ф

Cлайд 6

Задание: Расшифруйте фразу персидского поэта Джалаледдина Руми «кгнусм ёогкг фесл тцфхя фзужщз фхгрзх ёогксп», закодированную с помощью шифра Цезаря. Известно, что каждая буква исходного текста заменяется третьей после нее буквой. Руми 1207-1273 А Б В Г Д Е Ё Ж З И Й К Л М Н О П Р С Т У Ф Х Ц Ч Ш Щ Ъ Ы Ь Э Ю Я Ответ: Закрой глаза свои пусть сердце станет глазом

Cлайд 7

Двоичное кодирование текстовой информации Для представления текстовой информации в компьютере используется алфавит мощностью 256 символов.

Один символ такого алфавита несет 8 бит информации: 28=256, 8 бит=1 байту, следовательно, двоичный код каждого символа в компьютерном тексте занимает 1 байт памяти 1 байт 256 символов 66 букв русского алфавита 52 буквы английско- го алфавита 0-9 цифры

Cлайд 8

Кодовая таблица ASCII American Standard Code for Information Interchange коды от 0 до 32 функциональные клавиши коды от 33 до 127 буквы английского алфавита, знаки математических операций и т.д.

Cлайд 9

Таблицы кодировки русскоязычных символов КОИ8-Р CP1251 CP866

Cлайд 10

Mac ISO

Cлайд 11

Работа в текстовом редакторе MS Word Запустите текстовый редактор MS Word. Удерживая клавишу «ALT», наберите коды на дополнительной цифровой клавиатуре: 161 168 226 Какое слово получили? Ответ: бит

Cлайд 12

Кодировка Unicode 1 символ — 2 байта (16 бит), которыми можно закодировать ? символов

Cлайд 13

Количество информации в сообщении Iсообщения=Iсимвола* K Iсообщения- информационный объем сообщения Iсимвола- информационный объем символа (мощность алфавита) К – количество символов

Cлайд 14

Расчет количества текстовой информации Создайте текстовый документ в редакторе MS Word и напечатайте в нём пословицу: Ученье – атаман, а неученье – комар. Вопрос: Сколько символов? Вопрос: Каков информационный объем файла?

Cлайд 15

Задачи Какова мощность алфавита, с помощью которого записано сообщение, содержащее 2048 символов, если его объем составляет 1,25 Кбайта. Арифметически перевести информационный объем сообщения в биты: I = 10 240 бит Определить количество бит, приходящееся на один символ: 10 240 бит : 2 048 = 5 бит По формуле N = 2I определить количество символов в алфавите: N = 2I = 25 = 32

Cлайд 16

Задачи В фразе 108 символов, учитывая знаки препинания, кавычки и пробелы. Сколько бит информации несет эта фраза? Лазерный принтер Canon LBP печатает со скоростью в среднем 6,3 Кбит в секунду. Сколько времени понадобится для распечатки 8-ми страниц документа, если известно, что на одной странице в среднем по 45 строк, в строке 70 символов (1 символ – 1 байт).

Cлайд 17

Задачи Какова мощность алфавита, с помощью которого записано сообщение, содержащее 2048 символов, если его объем составляет 1/512 часть одного мегабайта.

Пользователь компьютера, хорошо владеющий навыками ввода информации с клавиатуры, может вводить в минуту 100 знаков. Мощность алфавита, используемого в компьютере равна 256.

Какое количество информации в байтах может ввести пользователь в компьютер за 1 минуту.

Cлайд 18

Вопросы: 1. Какой принцип кодирования текстовой информации используется в компьютере? 2. Как называется международная таблица кодировки символов? 3. Перечислите названия таблиц кодировок для русскоязычных символов.

Источник: http://bigslide.ru/informatika/20694-kodirovanie-tekstovoy-simvolnoy-informacii.html

Презентация на тему «Кодирование текстовой информации»

  • Скачать презентацию (0.52 Мб)
  • 68 загрузок
  • 3.9 оценка

ВКонтакте

Одноклассники

Facebook

Твиттер

Телеграм

Ваша оценка презентации

Оцените презентацию по шкале от 1 до 5 баллов

Презентация для школьников на тему «Кодирование текстовой информации» по информатике. pptCloud.ru — удобный каталог с возможностью скачать powerpoint презентацию бесплатно.

  • Формат

    pptx (powerpoint)

  • Количество слайдов

    10

  • Аудитория

  • Слова

    информатика информация кодирование текст

  • Конспект

    Отсутствует

  • Слайд 1

    Информатика и ИКТ 8 класс Помаскин Юрий Иванович МБОУ СОШ №5 г. Кимовск[email protected]

  • Слайд 2

    Автор презентации «Кодирование текстовой информации» Помаскин Юрий Иванович — учитель информатики МБОУ СОШ№5 г. Кимовска Тульской области.

    Презентация сделана как учебно-наглядное пособие к учебнику «Информатика и ИКТ 8» автор Н.Д. Угринович. Предназначена для демонстрации на уроках изучения нового материала Используемые источники: Н.Д.

    Угринович «Информатика и ИКТ 8», Москва, БИНОМ Лаборатория знаний, 2012 стр.37-39.

  • Слайд 3

    Информация, выраженная с помощью естественных и формальных языков в письменной форме, обычно называется текстовой информацией.

  • Слайд 4

    Для кодирования прописных и строчных букв русского и латинского алфавитов, цифр и ряда специальных знаков достаточно 256 различных символов. N = 2I → 256 = 2I→ 28 → I = 8битов = 1 байт Каждому символу становится в соответствие уникальный десятичный код от 0 до 255 или соответствующий ему двоичный код от 00000000 до 11111111

  • Слайд 5

    Присвоение символу конкретного кода – это вопрос соглашения, которое фиксируется в кодировочной таблице Русский алфавит присутствует в пяти однобайтовых кодировочных таблицах Windows, MS-DOS, Mac, ISO, КОИ-8 Двух байтовая таблица Unicode(65 536 знаков)

  • Слайд 6

    Коды с 0 по32 – коды операций (перевод строки, пробел и др.) Коды с 33 по 127 – интернациональные (символы латинского алфавита, цифры, знаки математических операций и знаки препинания) Коды с 128 по 255 – национальные (русский алфавит)

  • Слайд 9

    Как связаны между собой количество знаков алфавита и информационный вес одного знака? Сколько бит информации используется для кодирования знаков текстовой информации? Сколько знаков можно закодировать восьми битным кодом? В каких кодировочных таблицах есть русский алфавит? Как распределены знаки в кодировочных таблицах? Какое место в кодировочных таблицах занимает русский (национальный ) алфавит? Почему для кодирования текстовой информации в компьютере перешли от однобайтовых кодировок двухбайтовой кодировке?

  • Слайд 10

    В текстовом режиме экран монитора компьютера обычно разбивается на 25 строк по 80 символов в строке. Определите объем текстовой информации, занимающей весь экран монитора, в кодировке Unicode.

    Пользователь компьютера, хорошо владеющий навыками ввода информации с клавиатуры, может вводить в минуту 100 знаков.

    Какое количество информации может ввести пользователь в компьютер за одну минуту в кодировке Windows? В кодировке Unicode?

Посмотреть все слайды

Источник: https://pptcloud.ru/informatika/kodirovanie-tekstovoy

Ссылка на основную публикацию