Структура хранения информации windows

Структура хранения информации

Проблема хранения данных и их защищённость – одна из самых важных проблем любого владельца компьютера. И когда данных слишком много, то встает ещё одна проблема — проблема организации информации.

Наш читатель Виталий Губский рассказывает о том, как организовать хранение файлов, чтобы на любом носителе в любой операционной системе и без каких-либо дополнительных программ их всегда можно было увидеть в нужном порядке. Орфография и пунктуация автора сохранены.

Проблема хранения данных и их защищенность – одна из важных проблем любого владельца компьютера. И когда данных слишком много, то встает еще одна проблема — проблема организации информации. Какие-то из них можно решить с помощью самого Windows, какие-то с помощью сторонних программ, однако здесь я попытаюсь рассказать, как организовать свои данные, так чтобы на любом носителе в любой операционной системе (даже Dos), и без каких либо программ вы увидите свои данные в нужном вам порядке. Стоит сказать, что этой статье для кого-то я не открою что-то нового, у многих людей все организованно именно таким образом, но не многих до конца.

У многих пользователей все их нужные данные храниться или на «рабочем столе», или в «моих документах», и как показывает практика действительно нужных данных там не так много, а хранятся они далеко не в одной папке. Это очень затрудняет поиск нужной информации, а не дай бог при поломке, и процесс восстановления. Да и сам пользователь может элементарно забыть что, где у него было, а информацию уже не восстановить.

И так рассмотрим на примере Windows. За основы берем только файлы, папки и ярлыки – это гарантирует, что ваша информация будет отображаться во всех ОС одинаково (а Dos все кроме ярлыков).

Существует несколько типов организации информации в Windows:

1) По типам файлов: создаётся n каталогов по типам информации (видео, музыка, фото) и соответственно в этих папках хранятся файлы по расширениям. Это хорошо умеют делать сторонние программы, а теперь и библиотеки в Windows 7.

+ немного каталогов.
— большое количество информации в одной папке, причем однотипной.

2) По событиям («день рождение», «фильм 1», разного рода «документы»): в созданных папках храниться уже разного рода информация (Видео + музыка + картинки + текст) объединяет их только одна тема (Например, «фильм 1», здесь может быть описание (txt, doc), само видео (mkv), рекламные ролики к этому фильму (avi), фотографии из фильма (jpeg)).

+ в папке только та информация, которая связана с этим событием.
— большое количество папок.

Вот уже два способа, хорошо и быстро (в первом случае) все организовать. Это подходит тем, кто ценит свое время, а для тех кто хочет навести полный порядок, идем дальше…

Дальше идет их сочетание:

1 в 2 : За основу берётся тип файла (информации), например, картинки, в них создается подпапки («фото», «природа», «города») в которых в свою очередь храниться информация по типам. Из этого следует, что главный минус 1 пункта (большое кол-во информации) плавно исчезает. Но этого недостаточно.

А для того чтобы было достаточно, в каждой второй категории необходимо создать три — четыре папки и т.д. В «природе» можно сделать папки «деревья», «закаты», «животные», а в «животных» — «лошади», «тигры», «медведи» и так далее до бесконечности. Таким образом от минуса можно совсем избавиться. (Примечание: здесь речь идет о сочетании 1-2-2-2… и далее 2-1-1-1…)

2 в 1: нетрудно видеть, что в этом способе за основу берётся уже событие. Возьмём день рождение. В этой папке, допустим, присутствует: текстовые документы (поздравления), фотографии и видео съемка. И мы соответственно создаем 3 папки «поздравления», «фотографии» и «видео». Теперь у нас в каждой папке свой формат, а все они обледенены общей темой. Этот способ также может использовать эффект Масштабируемости. Вот и минус второго пункта так же плавно исчезает.

Но к сожалению и тут не все так просто, особенно в случае «1 в 2». Для примера возьмем все те же фотографии:

Мы создаем папку «фото» в ней «дача» в ней «дата» (1-2-2) и в нее записываются фото

затем папку «видео», в ней «дача» и в ней опять «дата», в неё записываем видео того же события (D -> фото -> дача -> 01.08.09 и D -> видео -> дача ->01.08.09). Согласитесь не очень удобно лазить по папкам, чтобы найти разные типы информации одного события. (хотя как раз на этот случай и придумали «проводник» в Windows). Второй способ «2 в 1» на первый взгляд, кажется лучше, чем первый, но это только на начальном этапе, когда уровней папок не так много, а дальше начинаются те же проблемы что и в первом способе. Однако даже эти два способа абсолютно точно помогут многим пользователям.

Достаточным также может оказаться дальнейшие, но уже перекрестное сочетание пунктов 1) и 2). 1 в 2 в 1 в 2 и т.д : вот пример (диск D -> foto->21/01/03->фото, видео, текст->событие). Здесь идет сначала организация по типу, в ней по событиям, а в событиях пять по типу информации. Этот прием также можно использовать бесконечно. Причем не важно с чего начинать с 2 или 1. это уже кому как нравиться. (Примечание: из личного опыта автора, в корневом каталоге лучше начинать с 1 т.к. типов хранимых файлов гораздо меньше, чем событий происходящих с ними и с нами в жизни). Такой способ, несомненно, лучше организовывает хранящуюся на диске информацию. Смотрим дальше.

На диске созданы 2 папки «статьи» (Вся текстовая информация) и «музыка» (вся музыка), а в какую папку поместить статьи о «музыке» — не понятно. Можно положить её в «статьи» (это будет правильно), но сегодня я помню, что они там, а завтра логика пойдет другим путём, и я буду уверен, что статьи лежат в папке «музыка» (и это тоже логично). Что же делать? А делать можно вот что: В Win придумали замечательную вещь под названием «ярлык». Т.е. не меняя положения файла можно задать с ним связь из любой папки компьютера. Чем можно воспользоваться и в нашей ситуации. Поместить статьи о музыке, например, в «музыку», а в «статьях» сделать на неё ярлык. Но, во-первых, ярлыки имеют жесткую привязку, как к диску, так и к файлу. Перемещать файлы после создания ярлыков просто нельзя, иначе весь ваш труд будет впустую.

Читайте также:  Windows steam on ubuntu

Рассмотрим другую ситуацию: наступает момент, когда компьютер вдруг неожиданно сломался.

(«А я- то хотел вот-вот на этой недельке сделать резервную копию, но вот чего-то времени не было» — такие фразы я, увы, слышал не один раз, так что не откладывайте сегодня то, чего завтра уже может не быть – делайте резервную копию).

Хорошо если с вашим винчестером ничего серьезного не произошло. Восстановление сводиться к простому копированию. Но после восстановления придется начинать всю процедуру создания ярлыков сначала. Конечно, есть способ и быстрее – изменить букву диска на ту, которая была до восстановления и вернуть туда все данные, и при создании новых логических дисков их объемы не должны быть меньше исходного, иначе какая-то часть файлов просто не влезет. Да и диск С, если он единственный логический уже никак не переименуешь. В общем, это ненужные себе проблемы. Поэтому с ярлыками нужно быть поосторожнее.

Не смотря на минусы, в целом эта система хорошо работает, хотя я не исключаю, да и просто уверен что найдётся более лучшая система организации информации, вот например Web-страница любого сайта соединяет тысячи файлов, а пользователь видит только один. В общем, есть куда развиваться.

Файлы и их имена.

Ещё хотеться сказать несколько слов про сами файлы. Давая им разные имена можно так же эффективно повысить их организованность. Создаем папку с фотографиями и называем её «Поездка на юг 01-21.06.09». Мы обозначили наше событие, уже привязав его к дате. Теперь в ней лежат целая куча файлов с видео и фотографиями. Что делать дальше? Можно разделить фото и видео. Начинаем смотреть: вот идут фотографии, а вот здесь вы уже снимали видео. Где же оно? А оно, как правило, или перед всеми фотографиями или после всех. А вот, допустим, вы поехали не одни, а с друзьями, и они, «по совету друзей», купили точно такой же фотоаппарат, а потом вы обменялись своими фотографиями. Начиная скидывать их в ту же папку, вы обнаруживаете, что файлы с такими именами уже есть. Ну, допустим, мы сохраняем обе копии (как в Win vista). И что получаем кашу из фотографий, которые располагаются, как им хочется. Вот вы прилетели, а вот уже в море, потом вдруг вы отеле, потом снова перескочили в море. Смотреть, а тем более комментировать последовательность событий, мягко скажем, неудобно. Выход один надо организовывать файлы по именам. Вот, например, «отель 01-N» «На море 01-N» «Приезд 01-N». А вот Windows обычно сортирует файлы по имени, и в нашем случае Приезд окажется позже отеля. Не логично. Чтобы всё встало на свои места номер нужно ставить в начале, а уж потом название события, тогда никаких ошибок не будет. Конечно переименовывать несколько сотен файлов вручную долго и нудно, а вот на этот случай придумали автоматическое переименование файлов с помощью сторонних программ. (при этом стоит заметить что некоторые версии Windows, особенно старые, формируют списки файлов по первым цифрам 1,10,11…3,30,31. Так что при таком переименовании, перед младшими цифрами ставятся 0. (01 — Достаточно, если файлов меньше 100 и 001 — если меньше 1000 и т.д.). В ряд с фото теперь по порядку можно поставить и видео. А добавить в нашу коллекцию новые фотографии можно дальнейшим расширением имен: между файлами 014 и 015 можно вставить 014_1, 014_2, 014_07, а лучше 014 (0), 014 (1) и т.д. Конечно, есть недостаток (куда без них?), что при добавлении файлов в коллекцию придется делать переименование вручную. Но зато мы получим ту настоящую последовательность событий, которая была, даже, если информация была записана с разных источников, и это касается не только фото. Кроме того эту коллекцию можно дать посмотреть и друзьям и на DVD-плеере и на других устройствах, не боясь что фотографии и видео будет не в том порядке, как в альбоме Windows.(это справедливо если сортировка делается по имени, хотя и при любой другой сортировке легко можно отыскать нужную вам последовательность).

Ну и наконец, символы клавиатуры. Всякие

— = + можно так же использовать в названиях файлов, но в разных ОС их сортировка происходит по-разному, хотя и впереди букв и цифр, так что и с ними нужно быть осторожнее.

Так что, с помощью самых простых средств и действий, мы получаем наш упорядоченный архив данных, который можем расширять и дополнять, и можем не боятся, что после переустановки ОС или замене жесткого диска, нам придется разбирать файлы, ставить дополнительные программы, организовывать альбомы Windows, а достаточно просто скопировать нужную нам информацию.

Структура хранения информации windows

Структура хранения данных на внешних носителях информации

2.1. Единица хранения данных

При хранении данных решаются две проблемы: как сохранить данные в наиболее компактном виде и как обеспечить к ним удобный и быстрый доступ (если доступ не обеспечен, то это не хранение). Для обеспечения доступа необходимо, чтобы данные имели упорядоченную структуру. При этом образуются адресные данные. Без них нельзя получить доступ к нужным элементам данных, входящих в структуру.

Поскольку адресные данные тоже имеют размер и тоже подлежат хранению, хранить данные в виде мелких единиц, таких, как байты, неудобно. Их неудобно хранить и в более крупных единицах (килобайтах, мегабайтах и т. п.), поскольку частичное заполнение одной единицы хранения приводит к неэффективности хранения.

Читайте также:  Windows loader by daz softportal

В качестве единицы хранения данных принят объект переменной длины, называемый файлом.

Файл – это последовательность произвольного числа байтов, обладающая уникальным собственным именем.

Обычно в отдельном файле хранят данные, относящиеся к одному типу. В этом случае тип данных определяет тип файла.

Поскольку в определении файла нет ограничений на размер, можно представить себе файл, имеющий 0 байтов (пустой файл), и файл, имеющий любое число байтов.

В определении файла особое внимание уделяется имени. Оно фактически несет в себе адресные данные, без которых данные, хранящиеся в файле, не станут информацией из-за отсутствия метода доступа к ним. Кроме функций, связанных с адресацией, имя файла может хранить и сведения о типе данных, заключенных в нем. Для автоматических средств работы с данными это важно, поскольку по имени файла они могут автоматически определить адекватный метод извлечения информации из файла.

Имя файла состоит из двух частей: собственно имени и расширения файла. Например:

Собственно имя файла может состоять из букв русского и английского алфавитов, цифр и специальных символов. При этом его длина не должна превышать 256 символов.

В зависимости от расширения все файлы делятся на две большие группы: исполняемые и неисполняемые.

Исполняемые файлы – это такие файлы, которые могут выполняться самостоятельно, т. е. не требуют каких-либо специальных программ для их запуска. Имеют следующие расширения:

– exe – готовый к исполнению файл (tetris.exe; winword.exe);

– com – файл операционной системы (command.com);

– sys – файл операционной системы (Io.sys);

– bat – командный файл операционной системы MS-DOS (autoexec.bat).

Неисполняемые файлы для запуска требуют установки специальных программ. Так, например, для того чтобы просмотреть текстовый документ, требуется наличие какого-либо текстового редактора. По расширению неисполняемого файла можно судить о типе данных, хранящихся в данном файле. Вот несколько примеров:

2.2. Файловая структура

Требование уникальности имени файла очевидно – без этого невозможно гарантировать однозначность доступа к данным. В средствах вычислительной техники требование уникальности имени обеспечивается автоматически – создать файл с именем, тождественным уже имеющемуся, не могут ни пользователь, ни автоматика.

Хранение файлов организуется в иерархической структуре, которая в данном случае называется файловой структурой. В качестве вершины структуры служит имя носителя, на котором сохраняются файлы. Далее файлы группируются в каталоги (папки), внутри которых могут быть созданы вложенные каталоги (папки).

Каталоги (папки) – важные элементы иерархической структуры, необходимые для обеспечения удобного доступа к файлам, если файлов на носителе слишком много. Файлы объединяются в каталоги по любому общему признаку, заданному их создателем (по типу, по принадлежности, по назначению, по времени создания и т. п.). Каталоги низких уровней вкладываются в каталоги более высоких уровней и являются для них вложенными. Верхним уровнем вложенности иерархической структуры является корневой каталог диска.

Все современные операционные системы позволяют создавать каталоги. Правила присвоения имени каталогу ничем не отличаются от правил присвоения имени файлу, хотя негласно для каталогов не принято задавать расширения имен. Все промежуточные каталоги разделяются между собой обратной косой чертой (\). На рисунке 2.1 приведен пример иерархической структуры диска C:

2.3. Имена внешних носителей информации

Диски, на которых хранится информация в компьютере, имеют свои имена – каждый диск назван буквой латинского алфавита, а затем ставится двоеточие. Так, для дискет всегда отводятся буквы A: и B:. Логические диски винчестера именуются, начиная с буквы C:. После всех имен логических дисков следуют имена дисководов для компакт-дисков. Например, установлены: дисковод для дискет, винчестер, разбитый на 3 логических диска и дисковод для компакт-дисков. Определить буквы всех носителей информации. A: – дисковод для дискет;

C:, D:, E: – логические диски винчестера;

F: – дисковод для компакт-дисков.

Полное имя файла

Уникальность имени файла обеспечивается тем, что полным именем файла считается собственное имя файла вместе с путем доступа к нему. Понятно, что в этом случае на одном носителе не может быть двух файлов с тождественными полными именами.

Пример записи полного имени файла:

Вот пример записи двух файлов, имеющих одинаковое собственное имя и размещенных на одном носителе, но отличающихся путем доступа, то есть полным именем. Для наглядности имена каталогов (папок) напечатаны прописными буквами.

D: \Документы\Сведения о студентах\2004—05 учебный год\Результаты аттестации. doc

D: \Деканат\Аттестация студентов\Результаты аттестации. doc

2.4. Файловые системы

Все современные дисковые операционные системы обеспечивают создание файловой системы, предназначенной для хранения данных на дисках и обеспечения доступа к ним. Принцип организации файловой системы – табличный. Поверхность жесткого диска рассматривается как трехмерная матрица, измерениями которой являются номера поверхности, цилиндра и сектора. Под цилиндром понимается совокупность всех дорожек, принадлежащих разным поверхностям и находящихся на равном удалении от оси вращения. Физическая структура хранения данных представлена на рисунке 2.2.

Рисунок 2.2. Физическая структура хранения информации

Данные о том, в каком месте диска записан тот или иной файл, хранятся в системной области диска в специальных таблицах размещения файлов (FAT-таблицах). Поскольку нарушение FAT-таблицы приводит к невозможности воспользоваться данными, записанными на диске, к ней предъявляются особые требования надежности и она существует в двух экземплярах, идентичность которых регулярно контролируется средствами операционной системы.

Наименьшей физической единицей хранения информации является сектор. Размер сектора равен 512 байт. Поскольку размер FAТ-таблицы ограничен, то для дисков, размер которых превышает 32 Мбайта, обеспечить адресацию к каждому отдельному сектору не представляется возможным. В связи с этим группы секторов условно объединяются в кластеры. Кластер является наименьшей единицей адресации к информации. Размер кластера, в отличие от размера сектора, не фиксирован и зависит от емкости диска.

Читайте также:  Не удаляются значки с рабочего стола windows 10

Как было сказано ранее, информация на дисках записывается в секторах фиксированной длины, и каждый сектор и расположение каждой физической записи (сектора) на диске однозначно определяется тремя числами: номерами поверхности диска, цилиндра и сектора на дорожке. И контроллер диска работает с диском именно в этих терминах. А пользователь желает использовать не сектора, цилиндры и поверхности, а файлы и каталоги. Поэтому как-то требуется при операциях с файлами и каталогами на дисках перевести это в понятные контроллеру действия: чтение и запись определенных секторов диска. А для этого необходимо установить правила, по которым выполняется этот перевод, то есть, прежде всего, определить, как должна храниться и организовываться информация на дисках. Набор этих правил и называется файловой системой.

Файловая система – это набор соглашений, определяющих организацию данных на носителях информации. Наличие этих соглашений позволяет операционной системе, другим программам и пользователям работать с файлами и каталогами, а не просто с участками (секторами) дисков. Файловая система определяет:

• как хранятся файлы и каталоги на диске;

• какие хранятся сведения о файлах и каталогах;

• как можно узнать, какие участки диска свободны, а какие – нет;

• формат каталогов и другой служебной информации на диске.

Для использования дисков, записанных (размеченных) с помощью некоторой файловой системы, операционная система или специальная программа должна поддерживать эту файловую систему.

Файловая система, наиболее распространенная на IBM PC-совместимых компьютерах, была введена еще в начале 80-х годов в операционных системах MS DOS 1.0 и 2.0. Эта файловая система достаточно примитивна, так как она была создана для хранения данных на дискетах. Обычно эта файловая система называется FAT, так как самой важной структурой данных в ней является таблица размещения файлов на диске, по-английски – file allocation table, сокращенно – FAT. Эта таблица содержит информацию о том, какие участки (кластеры) диска свободны, и о цепочках кластеров, образующих файлы и каталоги.

В файловой системе FAT имена файлов и каталогов должны состоять не более чем из 8 символов плюс три символа в расширении имени. Она приводит к значительным потерям (до 20 %) дискового пространства из-за больших размеров кластеров на дисках высокой емкости. Это связано с тем, что в конце последнего кластера файла остается свободное место, в среднем равное половине кластера. А на больших дисках размер кластеров FAT может достигать 32 Кбайт. Таким образом, на диске емкостью 2 Гбайта с 20000 файлов потери составят 320 Мбайт, то есть около 16 %. Наконец, файловая система FAT малопроизводительна, особенно для больших дисков, не приспособлена к многозадачной работе (все операции требуют обращений к таблице размещения файлов, а потому до завершения одной операции нельзя начинать другую).

При разработке Windows 95 фирма Microsoft решила не вводить новую файловую систему, а залатать имеющуюся файловую систему FAT, позволив присваивать файлам и каталогам длинные имена. Эта файловая система стала называться FAT 32. Принятый в Windows 95 подход хорош тем, что позволяет использовать старые диски с файловой системой FAT – на них просто начинают записываться длинные имена. Но все же это решение весьма искусственное, и многие программы – для починки файловой системы дисков, «сжатия» дисков, резервного копирования и т. д., – могут привести к потере длинных имен на диске. FAT 32 поддерживает меньшие размеры кластеров, что позволяет более эффективно использовать дисковое пространство.

При разработке операционной системы Windows NT была создана новая файловая система – NTFS. Она была ориентирована на диски большого объема, содержащие множество файлов, в них приняты существенные меры по обеспечению эффективности хранения данных и контроля доступа к ним. Эта файловая система поддерживает длинные имена файлов. На логических дисках емкостью 1–2 Гбайта файловая система NTFS позволяет хранить в среднем на 10–15 % больше информации, чем FAT. А доступ к файлам в ней осуществляется заметно быстрее, особенно в многозадачной среде.

Разработчики NTFS, не забывая об эффективности, старались также обеспечить надежность файловой системы и восстанавливаемость данных при сбоях. Для этого, в частности, NTFS дублирует всю критически важную информацию и обеспечивает регистрацию всех изменений на дисках в специальном файле регистрации, причем для каждого изменения запоминается и способ его отмены. В результате практически при любых сбоях NTFS автоматически восстанавливается. NTFS также (в отличие от FAT) может работать с логическими дисками и файлами размером более 2 Гбайт – максимальный размер логических дисков и файлов там – 4х1018 байт.

Если файловая система на диске не поддерживается данной операционной системой, то вся информация на этом диске окажется недоступной (при работе в этой операционной системе, естественно). Для таких логических дисков может быть либо вообще не назначена буква (то есть к диску нельзя будет обратиться), либо при любом доступе к диску будет выдаваться сообщение об ошибке.

Таблица 1. Сравнительные характеристики файловых систем

Особая файловая система разработана для компакт-дисков (CD-ROM). Это оказалось необходимым, так как само физическое устройство компакт-дисков не такое, как у жестких дисков или дискет: в них информация записывается не в кольцевых дорожках, а в единственной спиралеобразной дорожке (как у аудиокомпакт-дисков). Эта файловая система называется CDFS.

1. Какой объект выбран в качестве хранения информации в ЭВМ?

2. Из каких частей состоит имя файла?

3. Как различаются файлы в зависимости от расширения?

4. В чем заключается уникальность имени файла?

5. Чем образована файловая структура?

6. Как обозначаются имена внешних носителей информации?

7. Что такое полное имя файла? Приведите пример.

8. Дайте характеристику физической структуры хранения информации.

9. Что такое файловая система?

10. Какие основные файловые системы выделяют и в чем их отличие?

Оцените статью