Смекни!
smekni.com

ЯЗЫК МАКРОАССЕМБЛЕРА IBM PC (стр. 3 из 9)

В простейшем случае в директиве DB, DW или DD описывается одна константа, которой дается имя для последующих ссылок на нее. По этой директиве ассемблер формирует машинное представление константы (в час­тности, если надо, "переворачивает" ее) и записывает в очередную ячей­ку памяти. Адрес этой ячейки становится значением имени: все вхождения имени в программу ассемблер будет заменять на этот адрес. Имена, ука­занные в директивах DB, DW и DD, называются именами переменных (в от­личие от меток - имен команд).

В MASM числа записываются в нормальном (неперевернутом) виде в cи­стемах счисления с основанием 10, 16, 8 или 2. Десятичные числа запи­сываются как обычно, за шестнадцатиричным числом ставится буква h (ес­ли число начинается с "цифры" A, B, ..., F, то вначале обязателен 0), за восьмиричным числом - буква q или o, за двоичным числом - буква b.

Примеры:

A DB 162 ;описать константу-байт 162 и дать ей имя A

B DB 0A2h ;такая же константа, но с именем B

С DW -1 ;константа-слово -1 с именем С

D DW 0FFFFh ;такая же константа-слово, но с именем D

E DD -1 ;-1 как двойное слово

Константы-символы описываются в директиве DB двояко: указывается либо код символа (целое от 0 до 255), либо сам символ в кавычках (оди­нарных или двойных); в последнем случае ассемблер сам заменит символ на его код. Например, следующие директивы эквивалентны (2A - код звез­дочки в ASCII):

CH DB 02Ah


CH DB '*' CH DB "*"

Константы-адреса, как правило, задаются именами. Так, по директиве

ADR DW CH

будет отведено слово памяти, которому дается имя ADR и в которое запи­шется адрес (смещение), соответствующий имени CH. Если такое же имя описать в директиве DD, то ассемблер автоматически добавит к смещению имени его сегмент и запишет смещение в первую половину двойного слова, а сегмент - во вторую половину.

По любой из директив DB, DW и DD можно описать переменную, т.е. отвести ячейку, не дав ей начального значения. В этом случае в правой части директивы указывается вопросительный знак:

F DW ? ;отвести слово и дать ему имя F, ничего в этот байт не ;записывать

В одной директиве можно описать сразу несколько констант и/или пе­ременных одного и того же размера, для чего их надо перечислить через запятую. Они размещаются в соседних ячейках памяти. Пример:

G DB 200, -5, 10h, ?, 'F'

Имя, указанное в директиве, считается именующим первую из констант. Для ссылок на остальные в MASM используются выражения вида <имя>+<це­лое>; например, для доступа к байту с числом -5 надо указать выражение G+1, для доступа к байту с 10h - выражение G+2 и т.д.

Если в директиве DB перечислены только символы, например:

S DB 'a','+','b'

тогда эту директиву можно записать короче, заключив все эти символы в одни кавычки:

S DB 'a+b'

И, наконец, если в директиве описывается несколько одинаковых кон­стант (переменных), то можно воспользоваться конструкцией повторения

k DUP(a,b,...,c)

которая эквивалентна повторенной k раз последовательности a,b,...,c. Например, директивы

V1 DB 0,0,0,0,0

V2 DW ?,?,?,?,?,?,?,?,?,'a',1,2,1,2,1,2,1,2

можно записать более коротко таким образом:

V1 DB 5 DUP(0)

V2 DW 9 DUP(?), 'a', 4 DUP(1,2)

1.3. ПРЕДСТАВЛЕНИЕ КОМАНД. МОДИФИКАЦИЯ АДРЕСОВ.

1.3.1 Структура команд. Исполнительные адреса

Машинные команды ПК занимают от 1 до 6 байтов.

Код операции (КОП) занимает один или два первых байта команды. В ПК столь много различных операций, что для них не хватает 256 различ­ных КОПов, которые можно представить в одном байте. Поэтому некоторые операции объединяются в группу и им дается один и тот же КОП, во вто­ром же байте этот КОП уточняется. Кроме того, во втором байте указыва­ются типы и способ адресации операндов. Остальные байты команды указы­вают на операнды.

Команды могут иметь от 0 до 3 операндов, у большинства команд ­один или два операнда. Размер операндов - байт или слово (редко ­двойное слово). Операнд может быть указан в самой команде (это т.н. непосредственный операнд), либо может находиться в одном из регистров ПК и тогда в команде указывается этот регистр, либо может находиться в ячейке памяти и тогда в команде тем или иным способом указывается ад­рес этой ячейки. Некоторые команды требуют, чтобы операнд находился в фиксированном месте (например, в регистре AX), тогда операнд явно не указывается в команде. Результат выполнения команды помещается в ре­гистр или ячейку памяти, из которого (которой), как правило, берется первый операнд. Например, большинство команд с двумя операндами реали­зуют действие

op1 := op1 _ op2

где op1 - регистр или ячейка, а op2 - непосредственный операнд, ре­гистр или ячейка.

Адрес операнда разрешено модифицировать по одному или двум регист­рам. В первом случае в качестве регистра-модификатора разрешено ис­пользовать регистр BX, BP, SI или DI (и никакой иной). Во втором слу­чае один из модификаторов обязан быть регистром BX или BP, а другой -

регистром SI или DI; одновременная модификация по BX и BP или SI и DI недопустима. Регистры BX и BP обычно используются для хранения базы (начального адреса) некоторого участка памяти (скажем, массива) и по­тому называются базовыми регистрами, а регистры SI и DI часто содержат индексы элементов массива и потому называются индексными регистрами. Однако такое распределение ролей необязательно, и, например, в SI мо­жет находиться база массива, а в BX - индекс элемента массива.

В MASM адреса в командах записываются в виде одной из следующих конструкции:

A, A[M] или A[M1][M2],

где A - адрес, M - регистр BX, BP, SI или DI, M1 - регистр BX или BP, а M2 - регистр SI или DI. Во второрм и третьем варианте A может отсут­ствовать, в этом случае считается, что A=0.

При выполнении команды процессор прежде всего вычисляет т.н. ис­полнительный (эффективный) адрес - как сумму адреса, заданного в ко­манде, и текущих значений указанных регистров-модификаторов, причем все эти величины рассматриваются как неотрицательные и суммирование

ведется по модулю 2^16 ([r] означает содержимое регистра r):

A : Aисп = A

A[M] : Aисп = A+[M] (mod 2^16)

A[M1][M2]: Aисп = A+[M1]+[M2] (mod 2^16)

Полученный таким образом 16-разрядный адрес определяет т.н. смеще­ние - адрес, отсчитанный от начала некоторого сегмента (области) памя­ти. Перед обращением к памяти процессор еще добавляет к смещению на­чальный адрес этого сегмента (он хранится в некотором сегментном реги­стре), в результате чего получается окончательный 20-разрядный ад­рес, по которому и происходит реальное обращение к памяти (см. 1.4).

1.3.2 Форматы команд

В ПК форматы машинных команд достаточно разнообразны. Для примера приведем лишь основные форматы команд с двумя операндами.

1) Формат "регистр-регистр" (2байта):

------------- ----------------

| КОП |d|w| | 11 |reg1|reg2|

------------- ----------------

7 2 1 0 7 6 5 3 2 0

Команды этого формата описывают обычно действие reg1:=reg1_reg2 или

reg2:=reg2_reg1. Поле КОП первого байта указывает на операцию (_), ко­торую надо выполнить. Бит w определяет размер операндов, а бит d ука­зывает, в какой из регистров записывается результат:

w = 1 - слова d = 1 - reg1:=reg1_reg2

= 0 - байты = 0 - reg2:=reg2_reg1

Во втором байте два левых бита фиксированы (для данного формата), а трехбитовые поля reg1 и reg2 указывают на регистры, участвующие в опе­рации, согласно следующей таблице:


reg w=1 w=0 reg w=1 w=0 ----------------- ----------------­

000 AX AL 100 SP AH

001 CX CL 101 BP CH

010 DX DL 110 SI DH

011 BX BL 111 DI BH

2) Формат "регистр-память" (2-4 байта):


------------- ------------- -------------------

| КОП |d|w| |mod|reg|mem| |адрес (0-2 байта)|

------------- ------------- -------------------

Эти команды описывают операции reg:=reg_mem или mem:=mem_reg. Бит w первого байта определяет размер операндов (см. выше), а бит d указыва­ет, куда записывается результат: в регистр (d=1) или в ячейку памяти (d=0). Трехбитовое поле reg второго байта указывает операнд-регистр (см. выше), двухбитовое поле mod определяет, сколько байтов в команде занимает операнд-адрес (00 - 0 байтов, 01 - 1 байт, 10 - 2 байта), а трехбитовое поле mem указывает способ модификации этого адреса. В сле­дующей таблице указаны правила вычисления исполнительного адреса в за­висимости от значений полей mod и mem (a8 - адрес размером в байт, a16


- адрес размером в слово):

mem &bsol; mod | 00 01 10

------------------------------------------------------­000 | [BX]+[SI] [BX]+[SI]+a8 [BX]+[SI]+a16

001 | [BX]+[DI] [BX]+[DI]+a8 [BX]+[DI]+a16

010 | [BP]+[SI] [BP]+[SI]+a8 [BP]+[SI]+a16

011 | [BP]+[DI] [BP]+[DI]+a8 [BP]+[DI]+a16

100 | [SI] [SI]+a8 [SI]+a16


101 | [DI] [DI]+a8 [DI]+a16

110 | a16 [BP]+a8 [BP]+a16

111 | [BX] [BX]+a8 [BX]+a16


Замечания. Если в команде не задан адрес, то он считается нулевым. Если адрес задан в виде байта (a8), то он автоматически расширяется со знаком до слова (a16). Случай mod=00 и mem=110 указывает на отсутствие регистров-модификаторов, при этом адрес должет иметь размер слова (ад­ресное выражение [BP] ассемблер транслирует в mod=01 и mem=110 при a8=0). Случай mod=11 соответствует формату "регистр-регистр".

3) Формат "регистр-непосредственный операнд" (3-4 байта): ----------- ------------- --------------------------

| КОП |s|w| |11|КОП"|reg| |непосред.операнд (1-2 б)|

----------- ------------- --------------------------

Команды этого формата описывают операции reg:=reg_immed (immed - не­посредственный операнд). Бит w указывает на размер операндов, а поле reg - на регистр-операнд (см. выше). Поле КОП в первом байте определя­ет лишь класс операции (например, класс сложения), уточняет же опера­цию поле КОП" из второго байта. Непосредственный операнд может зани­мать 1 или 2 байта - в зависимости от значения бита w, при этом опе­ранд-слово записывается в команде в "перевернутом" виде. Ради экономии памяти в ПК предусмотрен случай, когда в операции над словами непос­редственный операнд может быть задан байтом (на этот случай указывает 1 в бите s при w=1), и тогда перед выполнением операции байт автомати­чески расширяется (со знаком) до слова.