Тексты в компьютерной памяти
I. Преимущества компьютерного документа по сравнению с бумажным
Любой согласится с тем, как много сил и времени затрачивается на многочисленные записи, которые приходится делать в разных ситуациях (в школе, дома, на работе) на исправления, на переписывания, на редактирование текста. При этом приходится зачёркивать, стирать, заклеивать, что портит вид текста, а необходимость переписывать ведёт к увеличению расхода бумаги и к потере времени.
С помощью компьютера можно создавать текстовые документы и хранить их на магнитных и других носителях в виде файлов. Например, на компакт-диске (700 Мб) можно разместить тексты более сотен книг объёмом в 500 страниц каждая. А если использовать специальные методы сжатия, то это количество можно увеличить в несколько раз.
Если текст становится ненужным, то дискету, как бумагу, не надо выбрасывать или сдавать в макулатуру. С неё с помощью компьютера легко стереть этот текст и на его место записать новый.
С помощью компьютера легко скопировать файлы в любом количестве на другие носители.
Файл с текстом можно быстро переслать другому человеку по электронной почте, правда, для этого нужно иметь связь через компьютерную сеть.
Самое поразительное отличие компьютерного текста от бумажного можно почувствовать, если встретиться с текстом, информация в котором организована по принципу гипертекста. Чаще всего это компьютерные справочники, энциклопедии, учебники. Такую «книгу» можно читать не только в обычном порядке, «листая страницы» на экране, но и перемещаясь по смысловым связям в произвольном порядке.
Таким образом, можно выделить следующие преимущества файлового хранения документа:
Ø компактное размещение;
Ø возможность многократного использования компьютерных носителей для хранения разных документов;
Ø возможность быстрого копирования на множество других носителей;
Ø возможность передачи текста по линиям компьютерной связи.
Отсюда следует
Ø экономия бумаги Þ сохранение лесов.
Ø возможность организации компьютерного текста в виде гипертекста.
Гипертекст – это способ организации текстовой информации, внутри которой установлены смысловые связи между её различными фрагментами (гиперсвязи).
II. Представление текста в памяти компьютера
Текстовая информация состоит из символов: букв, цифр, знаков препинания, скобок и других символов.
Широко распространённым способом представления текстовой информации в компьютере является использование алфавита мощностью в 256 символов. Один символ такого алфавита несёт 8 битов информации: 28 = 256. 8 битов = 1 байт, следовательно: двоичный код каждого символа занимает 1 байт памяти компьютера.
Все символы компьютерного алфавита пронумерованы от 0 до 255. каждому номеру соответствует восьмиразрядный двоичный код от 00000000 до 11111111. этот код – порядковый номер символа в двоичной системе счисления.
Таблица, в которой всем символам компьютерного алфавита поставлены в соответствие порядковые номера, называется таблицей кодировки.
На ЭВМ первых поколений для разных типов машин использовались различные таблицы кодировки. С распространением персональных компьютеров типа IBM PC международным стандартом стала таблица кодировки под названием ASCII (American Standart Code for Information Interchange – американский стандартный код для обмена информацией), состоящая из двух частей:
1) стандартная часть: 0 (00000000) – 127 (01111111)
Сюда входят буквы латинского алфавита, цифры, знаки препинания, скобки и некоторые другие символы. Коды от 0 до 31 (управляющие) имеют особое назначение: не отражаясь какими-либо знаками на экране и не включаясь в данную таблицу, они управляют процессом вывода на экран или печать, подачей звукового сигнала, разметкой текста и т. п. Код № 32 – пробел, т. е. пустая позиция в тексте.
2) альтернативная часть: 128 (10000000) – 255 (11111111) образуют кодовую страницу
Символы этой половины таблицы используются для кодировки букв национальных алфавитов, символов псевдографики и научных символов. Кодовая страница CP1251 содержит русский алфавит и используется в ОС WINDOWS. Таблицу кодировки, используемую в WINDOWS, называют ANSI (American National Standart Institute – Американский национальный институт стандартов). Первые половины таблиц ASCII и ANSI полностью совпадают.
В этих таблицах буквы (прописные и строчные) расположены в алфавитном порядке, а цифры по возрастанию значений. Это правило называется принципом последовательного кодирования алфавитов. Благодаря этому понятие «алфавитный порядок» сохраняется и в машинном представлении символьной информации. Но для русского алфавита принцип последовательного кодирования соблюдается не во всех существующих кодовых страницах с русским алфавитом.
Помимо восьмиразрядной кодировки символов всё больше распространение получает шестнадцатиразрядная – двухбайтовая кодировка. Международный стандарт такой кодировки носит название UNICODE.
Тексты вводятся в память компьютера с помощью клавиатуры. На клавишах написаны привычные нам буквы, цифры, знаки препинания и другие символы. В оперативную память они попадают в форме двоичного кода.
Из памяти компьютера текст может быть выведен на экран или на печать в символьной форме. Но для долговременного хранения его следует записать на внешний носитель в виде файла.Домашнее задание
Учить лекцию, подготовиться к тесту по теме.
Домашнее задание на 28.09
Текст занимает полных 5 страниц. На каждой странице размещается 30 строк по 70 символов в строке. Какой объём оперативной памяти (в байтах) займёт этот текст?
Домашнее задание на 05.10
Свободный объём оперативной памяти компьютера 640 Кбайт. Сколько страниц книги поместится в ней, если на странице:
1) 32 строки по 64 символа в строке;
2) 64 строки по 64 символа в строке;
3) 16 строк по 64 символа в строке?
Домашнее задание на 12.10
Текст занимает полных 10 секторов на односторонней дискете объёмом 180 Кбайт. Дискета разбита на 40 дорожек по 9 секторов. Сколько символов содержит текст?