В общем случае, каталог (папка) - это такой же файл, но в нем в качестве информации хранятся сведения о других файлах и каталогах. Все ограничения, существующие для имен файлов, распространяются, естественно, и на имена каталогов, причем в имени каталога расширение, как правило, отсутствует.
6. Краткая характеристика файловых систем
FAT 16. Файловая система FAT (File Allocation Table) работает с единицами дискового пространства, называемыми кластерами, включающими один или несколько секторов жесткого диска. Минимальный размер кластера - 512 байт, а максимальный - 32 Кбайта. Таблица FAT идентифицирует записи, соответствующие дисковым кластерам, при помощи 16-разрядных чисел, т. е. в таблице можно разместить не более 65 536 записей (216). Не сложно подсчитать, что при максимальном размере кластера в 32 Кбайта максимальный раздел дискового тома будет составлять 2 Гбайта.
В FAT один файл должен занимать как минимум один кластер. Это приводит к тому, что при размере файла 10 Кбайт и размере 32 Кбайта файл займет кластер, т. е. 22 Кбайт будут потеряно безвозвратно. Тоже самое относится и к файлу размером 40 Кбайт. В этом случае будет занято два кластера, один полностью (32 Кбайта) и часть второго 8 Кбайт, а 24 Кбайта окажутся «не у дел».
Как правило, имя файла состоит из двух частей - имени и расширения. Полное имя файла строится следующим образом: [имя_диска:] [путь\] имяфайла. V дисков могут быть имена А:, В: - для гибких дисков (дискет); С:, D:, Е: и т. д. вплоть до Z: - для жестких дисков и их логических разделов, дисков CD-ROM и других сменных носителей.
Имя файла в MS DOS может содержать от одного до восьми символов, а расширение - до трех включительно, это обуславливается особенностями файловой системы FAT 16. Имя и расширение отделяются друг от друга точкой. Расширение является необязательным параметром и в принципе может отсутствовать.
В названии файлов могут использоваться прописные и строчные латинские буквы (причем MS DOS не проводит различия между большими и маленькими буквами, т. е. символ G и символ q в названии файла будут восприняты совершенно одинаково), символы $ & # @! °/° л 0 {}[]-_ и цифры. Недопустимо использование символов ? *.,:; = + / \ | < > и символа кавычек.
FAT 32. На смену FAT16 пришла FAT32. Принципиальным отличием FAT32 от FAT16 в том, что она идентифицирует записи, соответствующие дисковым кластерам, при помощи 32-разрядных чисел, т. е. максимальное количество записей становится равным 4 294 967 296 (232). Это позволило обеспечить поддержку дискового раздела до 2 Тбайт. Во всем остальном FAT32 «повторяет» FAT 16.
Имя файла в ОС Windows 9Х, NT, 2000, ХР длина имени файла вместе с расширением может достигать 255 символов. Нельзя использовать символы ? *: / \ | < ? и символы кавычек. Это сделано для повышения наглядности имени файла. WINDOWS 9Х различает прописные и строчные буквы при создании файла, но игнорирует регистр при обращении к файлу.
В Windows 9х для совместимости с ранними версиями MS-DOS введено понятие короткого имени, или DOS. Формируется оно следующим образом. Если имя файла в WINDOWS 9Х соответствует всем требованиям имени DOS, то имя DOS будет в точности соответствовать имени WINDOWS 9Х, только большие буквы станут маленькими. Если имя WINDOWS 9Х имеет большую длину, чем допустимо в DOS, то короткое имя будет сформировано чаще всего так: от имени будет оставлено 6 символов, к нему будет добавлено ~1, а расширение также будет усечено до трех символов. Если в имени WINDOWS 9Х встречаются символы, запрещенные в DOS, то они будут заменены на _ (символ подчеркивания).
NTFS. New Technology File System (NTFS) по сравнению с FAT является более сложной структурой и с более широкими возможностями. Она не хранит всю информацию о расположении файлов в одном месте, сведения о распределении дискового пространства между файлами сохраняются в составе специальных пакетов.
Файловая система NTFS обладает встроенной поддержкой длинных имен и расширяемых атрибутов файлов. Благодаря этому, разделы NTFS могут хранить информацию, связанную с защитой файлов, аудитом доступа к файлам, а также сведения, связанные с правами на владение файлами.
В NTFS можно задавать дисковую квоту, суть которой в том, что пользователю можно назначить определенный размер дискового пространства, который он может использовать для хранения своих файлов.
Новые возможности NTFS версии 5, начиная с Windows 2000, позволяют задействовать архитектуру открытых ключей для шифрования файлов, каталогов или томов с помощью специальной системы шифрования. С помощью возможности монтирования можно подсоединить любой диск в любое место файловой системы.
NTFS поддерживает диски, максимальный размер которых может достигать 16 Экзабайт (экзабайт - это 1 073 741 824 Гбайт). Это практически безграничный размер, который в обозримом будущем на практике вряд ли будет достигнут.
Когда имеет смысл переходить на NTFS? Основными условиями такого перехода является то, в каких целях используется компьютер и каков размер имеющейся оперативной памяти. Во-первых, NTFS работает несколько медленнее, чем FAT, из-за дополнительно загружаемых служб и систем безопасности. Во-вторых, если размер оперативной памяти небольшой, то переходить на NTFS нежелательно.
Если диск или раздел преобразован в формат NTFS, то его нельзя просто преобразовать обратно в формат FAT или FAT 32. Необходимо переформатировать диск или раздел, что приведет к уничтожению всех содержащихся в нем данных, включая программы и личные файлы пользователя.
В табл. 2 приведены данные по совместимости каждой файловой системы с различными ОС и сведения по размерам дисков и файлов.
Таблица 2. Сравнение файловых систем
Характеристика | NTFS | FAT | FAT32 |
Типы ОС | Windows ХР или 2000. Для Windows NT 4.0 с пакетом обновления версии 4 или более поздней, может получить доступ к некоторым файлам | MS-DOS, любые версии Windows, OS/2 | Windows 95 OSR2, Windows 98, Windows ME, Windows 2000, Windows XP |
Размер тома | 10 Гбайт - 2 Тбайт | 1,44 Мбайт -4 Гбайт | 512 Мбайт -2 Тбайт |
Максимальный размер файла | Ограничен только размером тома | 2 Гбайт | 4 Гбайт |
Использование для дискет | Нет | да | нет |
Безопасность | Высокая | низкая | низкая |
Требования к размеру оперативной памяти | Высокие | низкие | низкие |
Быстродействие | Низкое | высокое | высокое |
6.1 Файловая система CD-ROM
Организацию файловой системы на CD-ROM описывает стандарт ISO 9660. Уровень 1 этого стандарта включает форматы файловых систем MS-DOS и HFS (Apple Macintosh), а уровень 2 описывает файловую систему с длинными именами и уровнем вложенности до 32.
Расширение Rock Ridge описывает формат файловой системы UNIX.
Частным случаем CD-R является формат Kodak Photo CD, используемый для многосеансовой записи коллекций фотографий. Photo CD использует формат CD-Bridge, оформленный в файловую систему ISO 9660. Диски Photo CD могут воспроизводиться специальными проигрывателями на бытовой телевизор или считываться компьютерными дисководами CD-ROM.
6.2 Файловая система DVD-Video
Для дисков всех типов (DVD-ROM, DVD-Video, DVD-Audio) используется общая файловая система UDF Bridge Format. Она является комбинацией Micro-UDF и ISO 9660. UDF (Universal Disk Format) - файловая система, разработанная ассоциацией OSTA (Optical Storage Technology Association) на базе стандарта ISO 13346.
Базовой единицей файловой системы DVD-диска являются файлы VOB (Video Object), которые включают в себя не только видео- и аудиоданные, но вспомогательные субизображения и данные по навигации. Каждый VOB-файл построен из ячеек - самых мелких единиц DVD-диска, к которым можно адресоваться при интерактивном просмотре. Они состоят из целого числа групп изображений (MPEG GOP). Ячейки связаны друг с другом навигационными цепочками, определяющими порядок воспроизведения ячеек (переходов между ними) в соответствии с выбранной программой.
6.3 Файловая система MacOS
ОС MacOS, используемая в компьютерах Apple Macintosh, - это иерархическая оптимизированная для работы с дисками больших размеров, а размер кластера даже на многогигабайтных дисках составляет 1-2 Кбайта.
В MacOS у файлов нет трехбуквенных расширений - максимальная длина имени файла - 255 символов.
Но это только пользователю не предоставляется никаких расширений, в действительности роль расширений играет два параметра. Каждый из этих параметров представляет собой обыкновенное 32-битовое число без знака, которое принято для удобства передавать комбинациями из 4 символов ASCII. Этот тип-амфибия очень широко применяется в MacOS для идентификации типов ресурсов, для самых разнообразных дескрипторов в Apple Events, для идентификации содержимого буфера обмена данными.
Параметрами файла являются его тип и сигнатура (подпись). Комбинации этих двух параметров обычно соответствует комплект значков разного разрешения и размера. Тип файла, например, 'TEXT', APPL', 'EPSF', 'PDF ', несет сведения о его формате.
В именах файлов в MacOS можно применять любые символы, кроме двоеточия. Двоеточие в MacOS выполняет примерно ту же функцию, что косая черта разной ориентации выполняет в UNIX или DOS - разделитель в имени файла, позволяющий определить путь к нему.
6.4 Файловые системы UNIX и Linux
Обычные файлы в UNIX состоят как бы из двух частей, разобщенных в пространстве на диске, но обязательно находящихся в одном дисковом разделе. Первая часть - область метаданных, в которой записываются идентификатор диска, сведения об атрибутах файла, а также информация о том, в каких блоках дискового раздела физически размещена область данных файла. Вторая часть содержит те самые последовательности байтов, которые образуют доступный пользователю текст в формате ASCII.