Динамическое распределение памяти (стр. 1 из 2)

Список - конечная последовательность, состоящая из нуля или более атомов или Списков.

Рассмотрим Список L = (a: N, b, c: (d: N), e: L), N = (f: ( ), g: (h: L, j: N)) а соответствующей диаграммой для него будет

Существует много способов для представления Списочных структур в памяти машины. Обычно все они являются вариациями на одну и ту же основную тему, согласно которой для представления общих лесов деревьев используются бинарные деревья: одно поле, скажем RLINK, используется для указания на следующий элемент Списка, а другое поле DLINK можно использовать для указания на первый элемент под-Списка.

Тогда Список можно представить в виде:

Но эта простая идея не вполне пригодна для наиболее часто встречающихся приложений, включающих обработку Списков.

По этой причине верхняя схема обычно заменяется на другую, но теперь каждый Список начинается с головы Списка. Каждый список содержит

дополнительный узел, называемый головой Списка.

На практике введение этих головных узлов не приводит к реальной потере памяти, поскольку обнаруживается немало применений для них. Например, можно потребоваться для счетчика ссылок, или указателя на правый конец Списка, или для буквенного имени, или для рабочего поля, которое оказывается полезным в алгоритмах прохождения дерева, и т. д.

В сущности, Список - не что иное, как линейный список, элементы которого могут содержать указатели на другие Списки. Наиболее распространенными операциями, которые мы захотим выполнять над Списками, являются обычные операции, необходимые и для линейных списков (создание, разрушение, включение, исключение, расщепление, конкатенация), и еще некоторые дополнительные операции, которые интересны, прежде всего для древовидных структур (копирование, прохождение, ввод и вывод вложенной информации).

Но поскольку общие Списки могут расти и умирать во время работы программы совершенно непредвиденным образом, зачастую очень трудно сказать точно, когда тот или иной узел становиться ненужным. Следовательно, проблема обслуживания списка свободного пространства представляется значительно более трудной при работе со Списками.

Представим себе, что мы разрабатываем универсальную систему для обработки Списков, которая будет использоваться сотнями других программистов. Для обслуживания списка свободного пространства предлагается два основных метода: счетчики ссылок и сбор мусора. В методе счетчиков используется специальное поле в каждом узле, в котором учитывается, сколько стрелок указывает на этот узел. За таким счетчиком довольно легко следить во время работы программы, и всякий раз, когда счетчик сбрасывается в нуль, данный узел становится свободным. Метод сбора мусора использует в каждом узле специальное поле размером в один бит, которое называют "битом маркировки" или просто "маркером". В этом случае идея состоит в том, что почти все алгоритмы не возвращают узлы в список свободной памяти и программа беззаботно работает до тех пор, пока не исчерпается весь этот список; тогда алгоритм "сбора мусора", используя биты маркировки, возвращает в свободную память все узлы, которые в данный момент программе недоступны, после чего программа продолжает работать.

Ни один из этих методов нельзя считать вполне удовлетворительным. Принципиальный недостаток метода счетчиков состоит в том, что он не всегда возвращает в список свободной памяти те узлы, которые фактически являются свободными. Он хорошо работает с частично перекрывающимися списками. Кроме того метод счетчиков ссылок отнимает вполне ощутимое пространство в памяти (правда, иногда это пространство, так или иначе, остается свободным из-за размера машинного слова).

Кроме неприятной потери одного бита в каждом узле, трудность метода сбора мусора заключается в том, что он крайне медленно работает, когда загрузка памяти почти достигает предела; в таких случаях количество свободных ячеек, полученных с помощью процесса сбора, не окупает затраченных на это усилий. Те программы, которым не хватает памяти (а это происходит со многими не отлаженными программами!), часто впустую расходуют массу времени, многократно и почти бесплодно вызывая сборщик мусора непосредственно перед тем, как окончательно исчерпать память. Эту проблему можно частично решить, позволив программисту указывать число k, и если на этапе сбора мусора найдено не более k свободных узлов, то работа программы прекращается. Еще одна проблема связана с затруднениями, которые возникают иногда при определении, какие Списки на данном этапе не являются мусором; если программист пользуется какими-либо нестандартными приемами или хранит какую-либо указательную информацию в необычном

месте, то велика вероятность неправильной работы сборщика мусора. Некоторые наиболее мистические случаи в истории отладки связаны с тем, что во время выполнения программ, до этого неоднократно работавших, вдруг в неожиданный может включался сбор мусора. Сбор мусора требует также, чтобы программисты все время хранили правильную информацию во всех указательных полях, хотя иногда удобно в полях, к которым программа никогда не обращается оставить бессмысленную информацию. Можно также отметить, что сбор мусора неудобен для работы в "реальном режиме", поскольку, даже если сборщик мусора включается нечасто, он требует в этих случаях много машинного времени .

Хотя сбор мусора требует одного бита маркировки для каждого узла, можно хранить отдельную таблицу всех битов маркировки, скомпонованных вместе, в другой области памяти, установив соответствие между адресом узла и его битом маркировки. Алгоритмы сбора мусора интересны по нескольким причинам. В первую очередь такие алгоритмы полезны в других ситуациях, когда мы хотим отметить все узлы, на которые прямо или косвенно ссылается данный узел. (Можно, например, найти все подпрограммы, к которым прямо или косвенно обращается некоторая подпрограмма.)

Сбор мусора обычно распадается на две фазы. Мы предполагаем, что первоначально биты маркировки во всех узлах равны нулю (или мы все их устанавливаем в нуль). Теперь во время первой фазы отмечаются все узлы, не являющиеся мусором, отправляясь от узлов, которые непосредственно доступны из главной программы. Во второй фазе осуществляется последовательный проход по всей области пула памяти и все неотмеченные узлы заносятся в список свободного пространства.

Наиболее интересная особенность сбора мусора состоит в том, что во время работы этого алгоритма в нашем распоряжении остается очень ограниченный объем свободной памяти, которую можно использовать для управления алгоритмом маркировки.

Следующий алгоритм маркировки относится, наверное, к наиболее очевидным.

Алгоритм А. (Маркировка.) Пусть вся память, используемая для хранения Списков, состоит из узлов NODE (1), NODE (2),... ..., NODE (М), и предположим, что эти слова являются либо "атомами", либо содержат два поля связи ALINK и BLINK. Предположим, что первоначально все узлы немаркированные. Назначение этого алгоритма состоит в том, чтобы отметить все узлы, которые можно достичь по цепочке указателей ALINK и (или) BLINK в неатомарных узлах, отправляясь от множества "непосредственно доступных" узлов.

A1 [Начальная установка.] Отметить все "непосредственно доступные" узлы, т.е. узлы, указатели на которые находятся в фиксированных ячейках в главной программе и которые служат отправными пунктами для доступа ко всей памяти. Установить К¬1.

А2. [Следует ли за NODE(К) другой узел ?] Установить К¬К+1.Если NODE(K) - атом или немаркированный узел, то перейти к шагу А3. В противном случае, если узел NODE(ALINK(K)) не отмечен, то отметить его и, если он не атом, установить К1¬min(K1,ALINK(K)). Точно также, если узел NODE(BLINK(K)) не отмечен, то отметить его и, если он не атом, установить K1¬min(K1,BLINK(K)).

A3. [Конец ?] Установить K¬K1. Если K¬M, то вернуться к шагу А2, в противном случае алгоритм завершен.

Возможен несколько лучший вариант, предусматривающий использование стека фиксированного размера.

Алгоритм B. (Маркировка.) В этом алгоритме используется таблица, содержащая Н ячеек STACK [0], STACK [1I, ... ..., STACK[H-1] , и получается тот же результат, что и в алгоритме А .

В этом алгоритме действие "занести Х в стек" означает следующее: "Установить T¬(T+l) mod H и STACK[T]¬X. Если Т = В, то установить В¬ (В+1) mod Н и К1 ¬min (Kl, STACK [В])". (Заметим, что Т указывает на текущую "вершину" стека, а В указывает на одну позицию ниже текущего "низа"; STACK работает, по существу, как дек, с ограниченным входом.)

B1. [Начальная установка.] Установить Т¬Н-1, В¬Н-1, Kl ¬М+1. Отметить все непосредственно доступные узлы и последовательно занести их адреса в стек (с помощью только что описанного действия).