Смекни!
smekni.com

Реализация сети в операционной системе Linux (стр. 2 из 3)

Установление соединения

Рассмотрим стандартный пример

/* lookuphost */

server = gethostbyname(SERVER_NAME);

/* get socket */

sockfd = socket(AF_INET, SOCK_STREAM, 0);

/* set up address */

address.sin_family = AF_INET;

address.sin_port = htons(PORT_NUM);

memcpy(&address.sin_addr,server->h_addr,server->h_length);

/* connect to server */

connect(sockfd, &address, sizeof(address));

socketсоздаёт обект сокета определенного типа и инициализирует его также делает дефолтовские очереди (incoming,outgoing,error,backlog) и заголовок TCP

connectопределяет маршруты вызывая протокольно зависимые функции (tcp_v4_connect(),udp_connect()) net/socket.c

asmlinkage long sys_connect(int fd, struct sockaddr *uservaddr, int addrlen)

{

................................

err = sock->ops->connect(sock, (struct sockaddr *) address, addrlen,

sock->file->f_flags);

..........................

}

int sock_create(int family, int type, int protocol, struct socket **res)

{

.....................................

//cоздаемпротокольнозависимыйсокет!

//--------------------------------------

if ((i = net_families[family]->create(sock, protocol)) < 0)

{

sock_release(sock);

goto out;

}

.................

}

Функции

Socket

Проверяем ошибки

Выделяем память

Ложим сокет в список inode

Устанавливаем указатели на протокольно зависимые части

Сохраняем данные про тип и параметры сокета

Устанавливаем сокет в положение закрыт

Инициализируем очереди пакетов

Connect

Проверяем ошибки

Определяем Маршрут

Проверяем кэш

Смотрим в FIB

Создаем новую запись в таблице маршрутизации

Заполняем её и возвращаем

Сохраняем указатель на запись маршрутизации в сокете

Вызываем протокольно зависимую функцию connect

Устанавливаем сокет в соединенный

Также надо не забыть закрыть сокет

Close вызывает sock_close in socket.c

void sock_release(struct socket *sock)

{

if (sock->ops)

sock->ops->release(sock);

...........................

}

а та через цепочку вызовов протокольнозависимую функцию

Дополнительныефункции

void inet_sock_release(struct sock *sk) -net/ipv4/af_inet.c

назвние говорит за себя + хороший комментарий Алана Коха

fib_lookup() - include/net/ip_fib.h

возвращает маршрут .Написана русским -Кузнецов!

fn_hach_lookup net/fib_hash.c

возвращаетмаршрутпоадресу

inet_create net/ipv4/af_inet.c

создаетсокет

inet_release <||>

ip_route_connect

вызывает ip_route_output для определении адреса назначения

ip_route_output

ip_route_output_slow

rt_intern_hash полезные для маршрутизации функции

sock_close()

sock_create()

sock_init_data net/core/sock.c инициализируетосновныеполясокета

sock_release net/socket.c

sys_socket

tcp_close net/ipv4/tcp.c

устанавливаетфлаг FYN

tpc_connect net/ipv4/tpc_output.c

сохдает пакеты для соединения с установленным размером окна

и соответствующими битами, ложит пакет в очередь и выpывает

tcp_transmit_skb чтоб послать пакет

tcp_transmit_skb -заполняет заголовок пакета и передает его

науроветь IP

tcp_v4_connect()

вызывает ip_route_connect

создает соединительный пакет и вызывает tcp_connect

udp_close

udp_connect

Обменданными

Эта часть описывает процесс обмена данными между различными уровнями ядра и сети Когда приложение отправляет данные то оно пишет в сокет тот в своб очередь определяет свой тип и вызывает соответствующую функцию,та передает данные протоколу транспортного уровня(tcp,udp) функции етого уровня создают структуру sk_buff,копируют в неё данные заполняют заголовок своего уровня,считают контрольную сумму и шлют на уровень IP.Там дописывается заголовок ip,checksum,возможно пакет фраг менторуется и шлётся на xmit очередь сетевого девайса ,тот посылает пакет в сеть.

dev_queue_xmit() - net/core/dev.c

spin_lock_bh() -блокируем девайс

если у него есть очередь

calls enqueue() добавляем пакет

calls qdis() пробуждаем девайс

else calls dev->hard_start_xmit()

calls spin_unlock_bh() освобождаемдевайс

DEVICE->hard_start_xmit() - зависитотдевайса, drivers/net/DEVICE.c

в общем проверяет открыто ли устройство

посылает заголовок

говорит системной шине послать пакет

обновляетстатус

inet_sendmsg() - net/ipv4/af_inet.c

int inet_sendmsg(struct socket *sock, struct msghdr *msg, int size,

struct scm_cookie *scm)

{

struct sock *sk = sock->sk;

/*биндимсокет. */

if (sk->num==0 && inet_autobind(sk) != 0)

return -EAGAIN;

вызываем функцию протокола чтоб послать данные

return sk->prot->sendmsg(sk, msg, size);

}

ip_build_xmit - net/ipv4/ip_output.c (604)

calls sock_alloc_send_skb() выделяемпамять

=заголовочек=

if(!sk->protinfo.af_inet.hdrincl) {

iph->version=4;

iph->ihl=5;

iph->tos=sk->protinfo.af_inet.tos;

iph->tot_len = htons(length);

iph->frag_off = df;

iph->ttl=sk->protinfo.af_inet.mc_ttl;

ip_select_ident(iph, &rt->u.dst, sk);

if (rt->rt_type != RTN_MULTICAST)

iph->ttl=sk->protinfo.af_inet.ttl;

iph->protocol=sk->protocol;

iph->saddr=rt->rt_src;

iph->daddr=rt->rt_dst;

iph->check=0;

iph->check = ip_fast_csum((unsigned char *)iph, iph->ihl);

err = getfrag(frag, ((char *)iph)+iph->ihl*4,0, length-iph->ihl*4);

}

calls getfrag() копируем данные у юзера

returns rt->u.dst.output() [= dev_queue_xmit()]

ip_queue_xmit() - net/ipv4/ip_output.c (234)

cмотри маршрут

достраиваем ip заголовок

фрагментирум если надо

adds IP checksum

calls skb->dst->output() [= dev_queue_xmit()]

qdisc_restart() - net/sched/sch_generic.c (50)

вырываем пакет из очереди

calls dev->hard_start_xmit()

обновляем статистику

if если ошибка опять стввим пакет в очередь

sock_sendmsg() - net/socket.c (325)

проверяемправаивсётакое

calls scm_sendmsg() [socket control message]

шлёмсданные

calls sock->ops[inet]->sendmsg() and destroys scm

>>> sock_write() - net/socket.c (399)

calls socki_lookup() accоциируемсокетс inode

заполняем заголовок сообщения

returns sock_sendmsg()

tcp_sendmsg() - net/ipv4/tcp.c (755)

ждемссоединения

skb = tcp_alloc_pskb память

calls csum_and_copy_from_user() делаем checksum & копируем

calls tcp_send_skb()

tcp_send_skb() - net/ipv4/tcp_output.c (160)

это главная routine посылки буфера

мы ставим буфер в очередь и решаем оставить его там или послать

calls __skb_queue_tail() добавляем в очередь

calls tcp_transmit_skb() еслиможет

tcp_transmit_skb() - net/ipv4/tcp_output.c (77)

строимзаголовок tcp ичексумму

calls tcp_build_and_update_options()

проверяем ACKs,SYN

calls tp->af_specific[ip]->queue_xmit()

udp_getfrag() - net/ipv4/udp.c

копируем из адресного пространства пользователя и добавляем checksum

udp_sendmsg() - net/ipv4/udp.c

проверяем флаги и тд

заполняем заголовок

проверяем мультикаст

заполняем маршутную информацию

calls ip_build_xmit()

обновляем статистику udp

returns err

Получение данных

Получение данных начинается с прерывания от сетевой карты. Драйвер девайса выделяет память и пересылает данные в то пространство. Потом передает пакет в связующий уровень который вызывает bottom-halv,которое обрабатывает событие вне прерывания пересылая данные на уровень выше -ip.Тот проверяет ошибки фрагменты, маршрутизирует пакет или отсылает на уровень выше(tcp || udp) Этот уровень снова проверяет ошибки определяет сокет которому предназначен пакет и ложит его в очередь сокета. Тот в свою очередь будит пользовательский процесс и копирует данные в его буфер.

Чтение из сокета(1)

Пытаемся что-то прочитать(и засыпаем)

Заполняем заголовок сообщения указателем на буфер(сокет)

проверяем простые ошибки

передаем сообщение inet сокету

Получение пакета

Пробуждение устройства(прерывание)

проверка девайса

Получение заголовка

выделение памяти

ложим пакет в то место судя по всему используя DMA

ставим пакет в очередь

выставляем флаг запуска bottom-halv

BottomHalv

Запуск сетевого ботом-халва

Пересылка пакетов из девайса чтоб не было прерываний

пересылка пакетов на уровень ip

очистка очереди отсылки

возврат

Уровень IP

Проверка ошибок

Дефрагментация если необходимо

Определение маршрута(форвардить или нет)

Отсылка пакета по назначению(TCP||UDP||forwarding)

Получение пакета в UDP

Проверка ошибок

проверка сокета назначения

пересылка пакета в очередь сокета

пробуждения ждущего процесса

Получение TCP

Проверка флагов и ошибок а также не был ли получен пакет ранее

Определение сокета

пересылка пакета в очередь сокета

пробуждения ждущего процесса

Чтение из сокета(2)

Пробуждение процесса

Вызов соответствуюшей функции доставки(udp ||tcp) в буфер пользователя

Возврат

IP forwarding

Рассмотрим подробнее процесс форвардинга пакетов

Сначала идет проверка TTL и уменьшение его на 1 Проверка пакета на наличие действительного маршрута если такого нет то отсылается соответствующее icmp сообщение копирование пакета в новый буфер и освобождение старого Установка нужных ip опций фрагменторование если необходимо отправка пакета на нужный девайс

DEVICE_rx() девайсно зависимая функция,

пример drivers/net/de600.c

здесь я попытаюсь перевести замечательные комментарии автора

Linux driver for the D-Link DE-600 Ethernet pocket adapter.

*

* Portions (C) Copyright 1993, 1994 by Bjorn Ekwall

* The Author may be reached as bj0rn@blox.se

/*

* Если у нас хороший пакет то забираем его из адаптера

*/

static void

de600_rx_intr(struct net_device *dev)

{

struct sk_buff *skb;

unsigned long flags;

int i;

int read_from;

int size;

register unsigned char *buffer;

save_flags(flags);

cli();

/* Определяем размер пакета */

size = de600_read_byte(RX_LEN, dev); /* нижниябайт */

size += (de600_read_byte(RX_LEN, dev) << 8); /* верхнийбайт */

size -= 4; /* Ignore trailing 4 CRC-bytes */

/* Сообщаем адаптеру куда ложить следующий пакет и получаем */

read_from = rx_page_adr();

next_rx_page();

de600_put_command(RX_ENABLE);

restore_flags(flags);

if ((size < 32) || (size > 1535)) {

printk("%s: Bogus packet size %d.&bsol;n", dev->name, size);

if (size > 10000)

adapter_init(dev);

return;

}

skb = dev_alloc_skb(size+2);

if (skb == NULL) {

printk("%s: Couldn't allocate a sk_buff of size %d.&bsol;n",

dev->name, size);

return;

}

/* Иначе*/

skb->dev = dev;

skb_reserve(skb,2); /* Align */

/* 'skb->data' указывет на начало буфера данных. */

buffer = skb_put(skb,size);

/* копируемпакетвбуфер */

de600_setup_address(read_from, RW_ADDR);

for (i = size; i > 0; --i, ++buffer)

*buffer = de600_read_byte(READ_DATA, dev);

/* Определяемтиппротокола

skb->protocol=eth_type_trans(skb,dev);

/*Передаем на верхний уровень см net/core/dev.c

netif_rx(skb);

/* обновляем статистику */

dev->last_rx = jiffies;

((struct net_device_stats *)(dev->priv))->rx_packets++; /* количествополучений */

((struct net_device_stats *)(dev->priv))->rx_bytes += size; /* количествополученныхбайт */

/*

* Если случится что-то плохое во время доставки, netif_rx()

* сделало amark_bh(INET_BH) для нас и будет работать

* когда мы войдем в bottom-halv.

*/

}

ip_finish_output() net/ipv4/ip_output

определяет девайс для данного маршрута

вызывает функцию девайса[=dev_queue_xmit]

ip_forward -net/ipv4/ip_forward

в этом файле хорошие комментарии

проверяем роутер

если пакет никому не предназначен то дропаем

если плохой TTLаналогично

если неможет пакет отфорвардится то отправляем icmpпакет ICMP_DEST_UNREACH