Тема 1.3. Операционные системы (ОС)
Тема 1.3. Операционные системы (ОС)
Занятие № 39 Архивирование информации
Дата проведения занятия – 23.01.2023г.
Дисциплина: Технологии создания и обработки цифровой мультимедийной информации
Группа: 4 «Мастер по обработке цифровой информации»
Тип занятия: Изучение нового материала
Цели занятия:
Обучающая:
- сформировать знания о расширении и форматах файлов, программах архивации;
Развивающая:
- развитие логического мышления, познавательного интереса студентов;
- развитие самостоятельности при изучении нового материала и выполнении заданий;
Воспитательная:
- способствовать воспитанию дисциплины и исполнительности, ответственному отношению к образовательному процессу.
Теоретические сведения
Расширения, форматы файлов
Расширение файла - это часть имени файла, которое отделяется от основного имени точкой. Прежде всего, по расширению можно понять какое содержимое находится в файле: музыка, видео, изображение, база данных или архив. Например, в файле "filename.txt" расширение ".txt" указывает на то, что это текстовый документ, который можно открыть, например, в блокноте.
Каждый файл создан какой-то программой и для чего-то предназначен. Форматов файлов существует тысячи, но лишь небольшую часть из них удается напрямую открыть какой-либо программой. Иногда по каким-либо причинам открыть файл просто необходимо. Но где взять информацию что это за файл и какое именно приложение необходимо использовать для его открытия? Для этого и создан наш сайт.
Сайт open-file.ru посвящен различным форматам файлов. На данный момент в нашей базе данных типов файлов насчитывается более 6500 уникальных расширений файлов и 7500 форматов. На одно расширение может приходиться несколько форматов файлов, т.к. файл одного и того же расширения может содержать различные данные и, соответственно, открываться различными приложениями.
Для каждого формата файла дано краткое название на русском и английском языке, тип файла и, самое главное, программы, рекомендуемые для открытия файла определенного формата. Для части типов файлов дано подробное описание, а также информация о заголовке файла, необходимая для его дополнительной идентификации (HEX, ASCII-дескрипторы). Данная информация будет очень полезна в случае, если файл переименован и его истинное расширение неизвестно.
Для удобного просмотра все файлы разбиты по категориям (типу данных) и по алфавиту (по первой букве расширения). Для быстрого поиска расширения файла введите его в соответствующую форму (вверху страницы). Для более подробного поиска воспользуйтесь расширенной формой поиска, с помощью которой можно искать по четырем параметрам: расширению, описанию файла, HEX или ASCII-дескрипторам заголовка файла.
База данных расширений и форматов файлов постоянно пополняется. Если Вы не нашли нужного Вам расширения, пожалуйста, сообщите об этом через форму запроса на добавление/изменение расширений. Если файл такого формата можно открыть, то он будет обязательно добавлен на сайт.
Программы архивирования данных
Архивация - это сжатие одного или более файлов с целью экономии памяти и размещение сжатых данных в одном архивном файле.
Архивация данных - это уменьшение физических размеров файлов, в которых хранятся данные, без значительных информационных потерь.
Архивация проводится в следующих случаях:
§ когда необходимо создать резервные копии наиболее ценных файлов;
§ когда необходимо освободить место на диске;
§ когда необходимо передать файлы по E-mail.
Архивный файл представляет собой набор из нескольких файлов (одного файла), помещенных в сжатом виде в единый файл, из которого их можно при необходимости извлечь в первоначальном виде. Архивный файл содержит оглавление, позволяющее узнать, какие файлы содержатся в архиве.
В оглавлении архива для каждого содержащегося в нем файла хранится следующая информация:
- имя файла,
- дата и время создания или модификации,
- объем файла до и после архивации,
- процент сжатия,
- код циклического контроля для каждого файла (контрольная сумма)
Любой из архивов имеет свою шкалу степени сжатия. Чаще всего можно встретить следующую градацию методов сжатия:
1. Без сжатия (соответствует обычному копированию файлов в архив без сжатия).
2. Скоростной.
3. Быстрый (характеризуется самым быстрым, но наименее плотным сжатием).
4. Обычный.
5. Хороший.
6. Максимальный (максимально возможное сжатие является одновременно и самым медленным методом сжатия).
Лучше всего архивируются графические файлы в формате .bmp, документы MS Office и Web-страницы.
Архиваторы – это программы (комплекс программ) выполняющие сжатие и восстановление сжатых файлов в первоначальном виде. Процесс сжатия файлов называется архивированием. Процесс восстановления сжатых файлов – разархивированием. Современные архиваторы отличаются используемыми алгоритмами, скоростью работы, степенью сжатия (WinZip 9.0, WinAce 2.5, PowerArchiver 2003 v.8.70, 7Zip 3.13, WinRAR 3.30, WinRAR 3.70 RU).
Другие названия архиваторов: утилиты - упаковщики, программы - упаковщики, служебные программы, позволяющие помещать копии файлов в сжатом виде в архивный файл.
Архиваторов очень много: ARJ, RAR, ZIP, CAB, LZH, GIF, TIF, PCX …
Архивные файлы могут быть непрерывными, многотомными, самораспаковывающимися.
Непрерывный архив — это архив, запакованный специальным способом, при котором все сжимаемые файлы рассматриваются как один последовательный поток данных.
Тома — это фрагменты архива, состоящего из нескольких частей. Тома поддерживаются только в формате RAR, вы не можете создавать тома ZIP. Обычно тома используются для сохранения большого архива на нескольких дискетах или других сменных носителях.
Многотомные архивы - это архивы, разбитые на несколько отдельных файлов. Их применяют, когда необходимо перенести большой объём информации на дискетах: на каждую дискету помещается отдельный том архива. При извлечении данных из многотомного архива архиватор будет последовательно обрабатывать том за томом, и запрашивать смену дискеты.
Самораспаковывающийся (SFX, от англ. SelF-eXtracting) архив — это архив, к которому присоединен исполнимый модуль. Этот модуль позволяет извлечь файлы, просто запустив архив как обычную программу. Таким образом, для извлечения содержимого SFX-архива не требуется дополнительных внешних программ. SFX-архивы, как и любые другие исполнимые файлы, обычно имеют расширение .EXE.
Самораспаковывающиеся архивы (SFX-архивы) используются в тех случаях, когда необходимо перенести информацию на другой компьютер, но неизвестно, установлен ли там соответствующий архиватор. Самораспаковывающийся архив представляет собой исполняемый (.EXE) файл, который включает в себя заархивированные данные и программу для их распаковки.
Алгоритм сжатия
Как иллюстрацию сжатия информации рассмотрим пример одного из способов сжатия. Допустим, есть такая строчка символов: "АААААААБББББВВВВВВВВВВГГГГГГ". Длина такой строчки - 28 символов. Но в ней есть повторяющиеся одинаковые символы, поэтому можно просто записать количество повторений и сам повторяющийся символ, в результате получится следующее: "7А5Б10В6Г". Строчка стала занимать всего 9 символов, т.е. сократилась более чем в три раза!
Разумеется, такой метод сжатия будет работать не для всех данных, например, возьмём такую строчку: "АБВБГАБГВАВГБАГ". Её длина - 15 символов. Если мы применим к ней тот же метод, то её длина увеличится вдвое: "1А1Б1В1Б1Г1А1Б1Г1В1А1В1Г1Б1А1Г". Отсюда следует важный вывод: один и тот же алгоритм сжатия для одних исходных данных сокращает их размер, а для других может и увеличить.
Алгоритмов сжатия данных существует великое множество. Некоторые алгоритмы подходят для одних типов данных, другие - для других. Хорошо сжимаются простые растровые изображения, не содержащие большого количества деталей (.BMP, .PSD и др.). Коэффициент сжатия во многом зависит от используемого алгоритма и сложности изображения. Например, чёрно-белое изображение чертёжного качества может быть сжато даже в сотню раз, цветные рисунки - в пять-десять раз, а цветные изображения высокого фотографического качества сжимаются менее чем в два раза. Хорошо сжимаются текстовые файлы (.TXT, .DOC, .PAS и др.). Если файл содержит текст, написанный на естественном языке, например, повесть или рассказ, то коэффициент сжатия будет равен двум-трём, а если в файле записан текст программы, то коэффициент сжатия может достигать пяти и выше. Коэффициент сжатия исполняемых файлов(.EXE, и др.) также сильно колеблется, однако, в среднем он равен примерно трём.
В отношении звука (.WAV, .AU), использование универсальных методов сжатия редко даёт хорошие результаты - звуковой файл сокращается всего на 20-40%. То же самое касается и высококачественных изображений, имеющих много деталей. Поэтому для этих типов изображений используются специальные методы сжатия, особо хорошие результаты дают так называемые алгоритмы сжатия с потерями. Одна из идей этих алгоритмов состоит в том, что человеческий глаз и ухо не очень восприимчивы к некоторым мелким деталям изображения или звука, поэтому лишнюю информацию можно просто отбросить. Разумеется, кроме отбрасывания лишней информации, используются и другие алгоритмы, в результате чего достигается несравнимый коэффициент сжатия при минимальных потерях качества (с точки зрения восприятия человека). Такой подход используется в файлах формата JPEG, предназначенного для хранения статичных изображений и MPEG, предназначенного для хранения видео- и аудиоинформации. Сегодня особенно популярны такие форматы, как MPEG-3 (или MP3), предназначенный для хранения аудиоинформации и позволяющий достигнуть десятикратного сжатия почти без потери качества, и MPEG-4, используемый для хранения видеофильмов.
Плохо архивируются, либо вообще увеличиваются в размере файлы, данные в которых уже сжаты, в том числе архивы (.RAR, .ZIP, .ARJ и др.), графические файлы тех форматов, которые имеют собственное сжатие (.GIF, .JPG, .PNG и др.), аудиофайлы (.MP3), видеофайлы (.MPG, .AVI и др.), самораспаковывающиеся архивы (.EXE).
Архиватор WinRAR
Для архивации файлов в среде Windows разработаны две программы WinZip и WinRAR. Программа WinRAR имеет более удобный интерфейс (рис. 6.1.2). Алгоритм работы при архивации и разархивации файлов также предельно прост.
WinRAR – это 32 разрядная версия архиватора RAR для Windows. Это - мощное средство создания архивов и управления ими. Есть несколько версий RAR, для разных операционных систем: Windows, Linux, UNIX, DOS, OS/2 и т.д.
Существует две версии RAR для Windows:
§ версия с графическим пользовательским интерфейсом - WinRAR.EXE;
§ Консольная версия RAR.EXE пульт линии команды (способ текста) версия - Rar.exe.
Рис. 1.
Возможности WinRAR:
1. Позволяет распаковывать архивы CAB, ARJ, LZH, TAR, GZ, ACE, UUE, BZ2, JAR, ISO, и обеспечивает архивирование данных в форматы ZIP и RAR.
2. Обеспечивает полную поддержку архивов ZIP и RAR.
3. Имеет специальные алгоритмы, оптимизированные для текста и графики. Для мультимедиа сжатие можно использовать только с форматами RAR.
4. Поддерживает технологию перетаскивания (drag & drop).
5. Имеет интерфейс командной строки.
6. Может осуществлять непрерывное архивирование, что обеспечивает более высокую степень сжатия по сравнению с обычными методами сжатия, особенно при упаковке большого количества небольших файлов однотипного содержания.
7. Обеспечивает поддержку многотомных архивов, то есть осуществляет разбивку архива на несколько томов (например, для записи большого архива на диски). Расширение томов: RAR, R01, R02 и т.д. При самораспаковывающемся архиве первый том имеет расширение EXE.
8. Создает самораспаковывающиеся архивы (SFX) обычные и многотомные архивы, обеспечивает защиту их паролями.
9. Обеспечивает восстановление физически поврежденных архивов.
10. Имеет средства восстановления, позволяющие восстанавливать отсутствующие части многотомного архива.
11. Поддерживает UNICODE в именах файлов.
12. Для новичков предназначен режим Мастер (Wizard), с помощью которого можно легко осуществить все операции над архивами.
WinRAR имеет и другие дополнительные функции. WinRAR способен создать архив в двух различных форматах: RAR иZIP.
Рассмотрим преимущества каждого формата.