Синхронизация процессов c linux

Синхронизация потоков в OC Linux

Если вы хотя бы раз разрабатывали многопоточное приложение, не важно под какую ос — думаю вы сталкивались с понятием синхронизации. Т.е. я не собираюсь досконально разбирать что это такое и для чего нужно — есть масса руководств по этой теме :). Здесь будет рассматриваться один конкретный случай синхронизации потоков применительно к ОС Linux. И так приступим.

Для создания потока используется библиотека pthread и вызов pthread_create, для синхронизации в этой же библиотеке описаны специальные объекты — мутексы. Мутекс — это объект который может принадлежать в некий момент времени только одному потоку и имеющий два состояния — занят и свободен. Поток пытающийся получить доступ к мутексу в случае если последний занят будет остановлен системой до освобождения объекта. На этом собственно и основана синхронизация — перед использованием общего ресурса потоки сначала обращаются к мутексу и в конечном счете выстраиваются в очередь.

Все отлично работает — но рассмотрим ситуацию когда есть много потоков выполняющих только чтение некоего ресурса(они не нуждаются в синхронизации между собой) и один или несколько потоков выполняющих изменение этого ресурса. Т.е. синхронизировать нужно этот пишущий поток со всеми читателями. Если просто использовать мутекс для синхронизации доступа к ресурсу очевидно что и потоки чтения будут получать доступ туда последовательно, что в свою очередь замедлит приложение, фактически превратив его в однопоточное :). В этой ситуации одним из вариантов решения будет применение семафора. Семафор — это специальный объект ядра предназначенный для взаимодействия процессов в системе. Не буду утомлять описанием этого объекта, это прекрасно сделали до меня, например тут Linux Interprocess Communications. Упомяну только что в системе создается именованное множество семафоров(содержащее минимум 1 семафор), каждый семафор содержит некое количество ресурсов выраженное целым числом. Поток может запрашивать ресурсы у семафора и естественно должен отдавать их обратно когда они более не нужны. В случае если запрошенное количество ресурсов недоступно, но меньше максимального имеющегося количества — поток ожидает освобождения(в случае если не установлена опция — без ожидания)- иначе возвращается ошибка. Таким образом семафор более гибкий механизм синхронизации(однако неприятность в том что это объект ядра). Попробуем применить его к озвученной выше задаче.

Для облегчения работы рассмотрим объектный интерфейс реализующий множество семафоров состоящее из одного семафора: В примере 2 файла — можно безболезненно слить их в один, например sem.cpp 🙂

Создадим семафор с 10 ресурсами например, читающие потоки будут запрашивать по 1 ресурсу за раз, пишущий сразу 10. В итоге читающие потоки будут блокировать друг друга только в случае если их запущенное число превысит 10(нужно самостоятельно подбирать нужное значение). Поток записи же при старте будет гарантированно ждать освобождения ресурса всеми потоками чтения и заставлять ждать позднее стартующие потоки окончания своей работы. Хочу обратить внимание на один нюанс — перед запросом получения ресурса потоком чтения следует ставить запрос на разрешение обратиться за получением этого самого ресурса. Т.е. поток чтения в случае если не установлен некий флаг разрешения зацикливается и ждет пока его установят, только после этого приступая к запросу. Это нужно для того чтобы потоки чтения не оттесняли поток записи в конец цикла ожидания — например освобождено уже 9 ресурсов из 10, поток записи ждет, но запускается поток чтения, запрашивает ресурс и естественное его получает — в итоге 8 свободных ресурсов :), запись оттесняется. Кстати очень удобно если требуется выполнение какой-либо работы во время простоя системы :).

Рассмотрим пример программы:

Собирается эта программа очень просто: g++ -g stest.cpp sem.cpp -lpthread -o stest

Вывод примерно такой:

Заметно что запустившийся поток записи заблокировал ресурс, отработал и только после этого дал зеленый свет остальным потокам. Потоки чтения не блокируют друг друга — об этом можно судить по порядку вывода записей освобождения ресурсов — происходит не в порядке захвата.

Собственно на этом заканчивается мое повествование, для более подробной информации по семафорам можно пройти по ссылке которая упоминалась выше. Надеюсь этот материал поможет вам в решении ваших задач.

Источник

Синхронизация процессов

Пытался засинронизировать процессы как в QNX 4.25: именнованая память shm_open(), в ней семафор sem_init(), sem_wait(). Не работает.

Как решить задачу синхронизации?

Re: Синхронизация процессов

Семафоры: смотри sem_open() — все прекрасно работает — только нужно примонтировать tmpfs в /dev/shm

Re: Re: Синхронизация процессов

Где же искать tmpfs ? в мане ни чего нет. в /dev и в /proc нет tmpfs.

Re: Re: Re: Синхронизация процессов

$ cat /proc/filesystems | grep tmpfs
nodev tmpfs

если нет — пересобирай ядро с включенной опцией [*] Virtual memory file system support (former shm fs) это в File Systems.

потом:
mount -t tmpfs tmpfs /dev/shm/

иначе будет ругаться типа not implemented

Re: Re: Re: Re: Синхронизация процессов

Хотя помнится это было с shm_open а не с sem_open на sem_open даже при приманченной tmpfs ругалось 🙁
Ну заюзай тогда Sys V семафоры, правда там уродский ftok()

Читайте также:  Неудачное обновление mac os

Re: Re: Re: Re: Re: Синхронизация процессов

Спасибо, я добавил строку в fstab: tmpfs /dev/shm tmpfs defaults 0 0

Re: Re: Re: Re: Re: Синхронизация процессов

shm_open() вроде работает, процессы даже показывают одинаковый указатель на именнованную shared memory. Раньше такого не было — когда я не монтировал tmpfs процессы обменивались данными через именнованную shared memory, но указатели на неё были разными.

Cейчас пытаюсь делать семафоры sem_init() и sem_wait() — но пока синхронизации процессов добиться не удалось, создаётся ощущение, что процессы работают сами посебе. Что надо перепроверить или где почитать по этой теме? HELP!

Re: Re: Re: Re: Re: Re: Синхронизация процессов

Читай R. Stevens, UNIX Network Programming.
Есть перевод на русский язык в двух томах:
UNIX: разработка сетевых приложений (У.Стивенс)
и
UNIX: взаимодействие процессов (У.Стивенс)

Можно заказать их на сайте издательства «Питер» www.piter.com

Re: Re: Re: Re: Re: Re: Re: Синхронизация процессов

Обе книги есть. В частности «UNIX взаимодействие процессов»

Цитат из неё: стр 237, ГЛАВА 10 Семафоры Posix

10.1 Введение . Мы рассматриваем три типа семафоров: *именованные семафоры. *размещаемые в разделяемой памяти семафоры Posix *семафоры System V (глава 11), обслуживаемые ядром.

Все три типа семафоров могут использоваться для синхронизации как отдельных процессов, так и потоков одного процесса.

Вот я чем и занимаюсь: «*размещаемые в разделяемой памяти семафоры Posix» и «синхронизации как отдельных процессов» и ни чего не получается.

100 лет назад в рамках одного процесса потоки синхронизировались нормально. Сейчас засинхронизировать процессы через Posix семафоры размещаемые в именованной разделяемой памяти не получается.

Где искать exampl-ы ? Где искать форумы по ядерным примочкам?

Re: Re: Re: Re: Re: Re: Re: Re: Синхронизация процессов

Источник

Синхронизация процессов c linux

Мы продолжаем знакомство с многопоточностью в Linux. В предыдущей статье мы научились создавать потоки и досрочно завершать их. Мы уже знаем, что если запрос на досрочное завершение потока поступил в неподходящий момент, поток может отложить досрочное завершение до тех пор, пока не станет готов к нему.

Механизм отложенного досрочного завершения очень полезен, но для действительно эффективного управления завершением потоков необходим еще и механизм, оповещающий поток о досрочном завершении. Оповещение о завершении потоков в Unix-системах реализовано на основе тех же принципов, что и оповещение о завершении самостоятельных процессов. Если нам нужно выполнять какие-то специальные действия в момент завершения потока (нормального или досрочного), мы устанавливаем функцию-обработчик, которая будет вызвана перед тем, как поток завершит свою работу. Для потоков наличие обработчика завершения даже более важно, чем для процессов. Предположим, что поток выделяет блок динамической памяти и затем внезапно завершается по требованию другого потока. Если бы поток был самостоятельным процессом, ничего особенно неприятного не случилось бы, так как система сама убрала бы за ним мусор. В случае же процесса-потока не высвобожденный блок памяти так и останется «висеть» в адресном пространстве многопоточного приложения. Если потоков много, а ситуации, требующие досрочного завершения, возникают часто, утечки памяти могут оказаться значительными. Устанавливая обработчик завершения потока, высвобождающий занятую память, мы можем быть уверены, что поток не оставит за собой бесхозных блоков памяти (если, конечно, в системе не случится какого-то более серьезного сбоя).

Для установки обработчика завершения потока применяется макрос pthread_cleanup_push(3). Подчеркиваю жирной красной чертой, pthread_cleanup_push() – это макрос, а не функция . Неправильное использование макроса pthread_cleanup_push() может привести к неожиданным синтаксическим ошибкам. У макроса pthread_cleanup_push() два аргумента. В первом аргументе макросу должен быть передан адрес функции-обработчика завершения потока, а во втором – нетипизированный указатель, который будет передан как аргумент при вызове функции-обработчика. Этот указатель может указывать на что угодно, мы сами решаем, какие данные должны быть переданы обработчику завершения потока. Макрос pthread_cleanup_push() помещает переданные ему адрес функции- обработчика и указатель в специальный стек. Само слово «стек» указывает, что мы можем назначить потоку произвольное число функций-обработчиков завершения. Поскольку в стек записывается не только адрес функции, но и ее аргумент, мы можем назначить один и тот же обработчик с несколькими разными аргументами.

В процессе завершения потока функции-обработчики и их аргументы должны быть извлечены из стека и выполнены. Извлечение обработчиков из стека и их выполнение может производиться либо явно, либо автоматически. Автоматически обработчики завершения потока выполняются при вызове потоком функции pthread_exit(), завершающей работу потока, а также при выполнении потоком запроса на досрочное завершение. Явным образом обработчики завершения потока извлекаются из стека с помощью макроса pthread_cleanup_pop(3). Во всех случаях обработчики извлекаются из стека (и выполняются) в порядке, противоположном тому, в котором они были помещены в стек. Если мы используем макрос pthread_cleanup_pop() явно, мы можем указать, что обработчик необходимо только извлечь из стека, но выполнять его не следует. Мы рассмотрим методы назначения и выполнения обработчиков завершения потока на простом примере (программа exittest):

Главная функция программы не содержит ничего такого, что не было бы нам уже знакомо. Мы создаем новый поток и тут же посылаем запрос на его завершение. Все новые элементы программы exittest сосредоточены в функции потока thread_func(). Поток начинает работу с того, что запрещает свое досрочное завершение. Этот запрет необходим на время выполнения важных действий, которые нельзя прерывать. Если запрос на досрочное завершение поступит во время действия запрета, он не пропадет. Как мы уже знаем, запрет досрочного завершения не отменяет выполнение соответствующего запроса, а только откладывает его. Далее поток выделяет блок памяти. Для того чтобы избежать утечек памяти, мы должны гарантировать высвобождение выделенного блока, для чего, как вы уже догадались, мы используем функцию-обработчик завершения потока exit_func(). Мы добавляем функцию exit_func() в стек обработчиков завершения потока с помощью макроса pthread_cleanup_push(). Обратите внимание на второй параметр макроса. Вторым параметром, как мы знаем, должен быть нетипизированный указатель. Этот указатель будет передан функции-обработчику в качестве аргумента. Поскольку задача функции exit_func() заключается в том, чтобы высвободить блок памяти mem, в качестве аргумента функции мы устанавливаем указатель на этот блок. Функция exit_func() высвобождает блок памяти с помощью функции free(3) и выводит диагностическое сообщение. После установки обработчика завершения потока наш поток разрешает досрочное завершение. Теперь вам должно быть понятно, зачем мы запретили досрочное завершение потока во время этих операций. Если бы поток завершился после выделения блока памяти, но до назначения функции-обработчика, выделенный блок не был бы удален. Далее поток выводит четыре диагностических сообщения с интервалом в одну секунду и завершает работу.

Читайте также:  Знакомство с linux ubuntu

Перед выходом из функции потока мы вызываем макрос pthread_cleanup_pop(). Этот макрос извлекает функцию-обработчик из стека. Аргумент макроса pthread_cleanup_pop() позволяет указать, следует ли выполнять функцию- обработчик, или требуется только удалить ее из стека. Мы передаем макросу ненулевое значение, что указывает на необходимость выполнить обработчик. Если вы забудете поставить вызов pthread_cleanup_pop() в конце функции потока, компилятор выдаст сообщение о синтаксической ошибке. Объясняется это, конечно, тем, что pthread_cleanup_push() и pthread_cleanup_pop() – макросы. Первый макрос, кроме прочего, открывает фигурные скобки, которые второй макрос должен закрыть, так что число обращений к pthread_cleanup_push() в функции потока всегда должно быть равно числу обращений к pthread_cleanup_pop(), иначе программу не удастся скомпилировать.

То, что макрос pthread_cleanup_pop() должен быть вызван столько же раз, сколько и макрос pthread_cleanup_push(), очень удобно в том случае, если обработчик завершения потока вызывается явным образом, но что происходит, если обработчики завершения потока вызываются неявно? Если неявный вызов обработчиков происходит вследствие досрочного завершения потока, механизм досрочного завершения вызовет обработчики сам, а код, добавленный макросами pthread_cleanup_pop(), выполнен не будет. Однако обработчики завершения потока могут быть выполнены и в результате вызова функции pthread_exit(). Наличие вызова pthread_exit() не избавит вас от необходимости добавлять макросы pthread_cleanup_pop(), ведь они необходимы для охранения правильной синтаксической структуры программы. Как же функция pthread_exit() взаимодействует с кодом, добавленным макросами pthread_cleanup_pop()? Если вызов pthread_exit() расположен до вызовов pthread_cleanup_pop(), поток завершится до обращения к коду макросов, при этом все обработчики завершения потока будут вызваны функцией pthread_exit(). Если мы расположим вызов pthread_exit() после вызовов pthread_cleanup_pop(), обработчики завершения будут выполнены до вызова pthread_exit(), и этой функции останется только завершить работу потока, не вызывая никаких обработчиков. А нужно ли вообще вызывать pthread_exit() в конце функции потока, если вызовы макросов pthread_cleanup_pop() все равно необходимы? Ответ на этот вопрос зависит от обстоятельств. Помимо вызова обработчиков завершения потока, функция pthread_exit() может выполнять в вашем потоке и другие важные действия, и в этом случае ее вызов необходим.

Еще один тонкий момент связан с выходом из функции потока с помощью оператора return. Сам по себе такой выход из функции потока не приводит к вызову обработчиков завершения. В нашем примере мы вызвали обработчики явно с помощью pthread_cleanup_pop() непосредственно перед выполнением return, но рассмотрим другой вариант функции thread_func():

Пусть этот вариант выглядит несколько неестественно, суть его в том, что теперь в функции потока определено несколько точек выхода. При выполнении условия i == 2 функция потока завершится в результате выполнения оператора return и обработчик завершения потока при этом вызван не будет. Эту проблему нельзя решить добавлением еще одного макроса pthread_cleanup_pop(). Вариант функции

вообще не скомпилируется, поскольку лишний макрос pthread_cleanup_pop() нарушит синтаксис программы. Правильное решение заключается в использовании функции pthread_exit() вместо return:

Вполне возможно, что вам, уважаемый читатель, как и мне, уже несколько раз хотелось досрочно завершить обсуждение досрочного завершения потоков. Потерпите немного, мы уже приближаемся к финишу. Осталось ответить на вопрос, зачем нам нужна возможность устанавливать несколько обработчиков завершения потока? Ответов на этот вопрос может быть много, но я дам только один. Представьте себе, что вы программируете сложную функцию потока, которая интенсивно работает с динамической памятью. Как только в вашей функции выделяется новый блок памяти, вы устанавливаете обработчик завершения потока, который высвободит этот блок в случае неожиданного завершения. Тут стоит отвлечься на секунду и заметить, что установка обработчика, высвобождающего память во время завершения потока, не мешает вам самостоятельно высвободить эту память, когда она перестанет быть нужна. Придется только немного поиграть с указателями (на диске вы найдете программу exittest2.c, которая демонстрирует явное высвобождение памяти в потоке совместно c использованием обработчика завершения). Если затем в вашей функции понадобится выделить новый блок памяти, потребуется еще один обработчик для его высвобождения. Даже если вы заранее знаете, сколько раз ваша программа будет выделать блоки памяти, назначать обработчик для высвобождения каждого блока можно только после того, как блок выделен.

Читайте также:  Как сделать исключения для защитника windows 10

Средства синхронизации потоков

Коротко говоря, — проблема заключалась в том, что мы не могли знать, когда именно новый поток начнет выполняться. С помощью средств синхронизации потоков мы можем решить эту проблему и использовать одну переменную для передачи значений обоим потокам. Рассмотрим модифицированный вариант программы threads, программу threads2 (вы найдете ее в исходниках программы в файле threads2.c).

В новом варианте программы мы используем одну переменную id для передачи значения обоим потокам. Если вы скомпилируете и запустите программу threads2, то увидите, что она работает корректно. Секрет нашего успеха заключается в использовании средств синхронизации. Для синхронизации потоков мы задействовали семафоры. Читатели этой серии статей уже знакомы с семафорами System V, предназначенными для синхронизации процессов. В данном случае мы применяем семафоры другого типа – семафоры POSIX, которые специально предназначены для работы с потоками. Все объявления функций и типов, относящиеся к этим семафорам, можно найти в файле /usr/include/nptl/semaphore.h. Семафоры POSIX создаются (инициализируются) с помощью функции sem_init(3). Первый параметр функции sem_init() – указатель на переменную типа sem_t, которая служит идентификатором семафора. Второй параметр — pshared — в настоящее время не используется, и мы оставим его равным нулю. В третьем параметре функции sem_init() передается значение, которым инициализируется семафор. Дальнейшая работа с семафором осуществляется с помощью функций sem_wait(3) и sem_post(3). Единственным аргументом функции sem_wait() служит указатель на идентификатор семафора. Функция sem_wait() приостанавливает выполнение вызвавшего ее потока до тех пор, пока значение семафора не станет большим нуля, после чего функция уменьшает значение семафора на единицу и возвращает управление. Функция sem_post() увеличивает значение семафора, идентификатор которого был передан ей в качестве параметра, на единицу. Присвоив семафору значение 0, наша программа создает первый поток и вызывает функцию sem_wait(). Эта функция приостановит выполнение функции main() до тех пор, пока функция потока не вызовет функцию sem_post(), а это случится только после того как функция потока обработает значение переменной id. Таким образом, мы можем быть уверены, что в момент создания второго потока первый поток уже закончит работу с переменной id, и мы сможем использовать эту переменную для передачи данных второму потоку. После завершения обоих потоков мы вызываем функцию sem_destroy(3) для удаления семафора и высвобождения его ресурсов.

Семафоры – не единственное средство синхронизации потоков. Для разграничения доступа к глобальным объектам потоки могут использовать мьютексы. Все функции и типы данных, имеющие отношение к мьютексам, определены в файле pthread.h. Мьютекс создается вызовом функции pthread_mutex_init(3). В качестве первого аргумента этой функции передается указатель на переменную pthread_mutex_t, которая играет роль идентификатора нового мьютекса. Вторым аргументом функции pthread_mutex_init() должен быть указатель на переменную типа pthread_mutexattr_t. Эта переменная позволяет установить дополнительные атрибуты мьютекса. Если нам нужен обычный мьютекс, мы можем передать во втором параметре значение NULL. Для того чтобы получить исключительный доступ к некоему глобальному ресурсу, поток вызывает функцию pthread_mutex_lock(3), (в этом случае говорят, что «поток захватывает мьютекс»). Единственным параметром функции pthread_mutex_lock() должен быть идентификатор мьютекса. Закончив работу с глобальным ресурсом, поток высвобождает мьютекс с помощью функции pthread_mutex_unlock(3), которой также передается идентификатор мьютекса. Если поток вызовет функцию pthread_mutex_lock() для мьютекса, уже захваченного другим потоком, эта функция не вернет управление до тех пор, пока другой поток не высвободит мьютекс с помощью вызова pthread_mutex_unlock() (после этого мьютекс, естественно, перейдет во владение нового потока). Удаление мьютекса выполняется с помощью функции pthread_mutex_destroy(3). Стоит отметить, что в отличие от многих других функций, приостанавливающих работу потока, вызов pthread_mutex_lock() не является точкой останова. Иначе говоря, поток, находящийся в режиме отложенного досрочного завершения, не может быть завершен в тот момент, когда он ожидает выхода из pthread_mutex_lock().

Атрибуты потоков

Вы можете превратить присоединяемый поток в отделенный с помощью вызова функции pthread_detach(3), однако придать потоку свойство «отделенности» можно и на этапе его создания, с помощью дополнительного атрибута DETACHED. Для того чтобы назначить потоку дополнительные атрибуты, нужно сначала создать объект, содержащий набор атрибутов. Этот объект создается функцией pthread_attr_init(3). Единственный аргумент этой функции – указатель на переменную типа pthread_attr_t, которая служит идентификатором набора атрибутов. Функция pthread_attr_init() инициализирует набор атрибутов потока значениями, заданными по умолчанию, так что мы можем модифицировать только те атрибуты, которые нас интересуют, и не беспокоиться об остальных. Для добавления атрибутов в набор используются специальные функции с именами pthread_attr_set . Например, для того, чтобы добавить атрибут «отделенности», мы вызываем функцию pthread_attr_setdetachstate(3). Первым аргументом этой функции должен быть адрес объекта набора атрибутов, а вторым аргументом – константа, определяющая значение атрибута. Константа PTHREAD_CREATE_DETACHED указывает, что создаваемый поток должен быть отделенным, тогда как константа PTHREAD_CREATE_JOINABLE определяет создание присоединяемого (joinable) потока, который может быть синхронизирован функций pthread_join(3). После того, как мы добавили необходимые значения в набор атрибутов потока, мы вызываем функцию создания потока pthread_create(). Набор атрибутов потока передается в качестве второго аргумента этой функции.

На этом мы закончим ликбез, посвященный потокам. Если вы любите потоки также сильно, как люблю их я, к вашим услугам неисчерпаемое море специальной литературы (например, книга Ричарда Стивенса) и страницы man, в которых вы найдете все то, чему не хватило места на страницах журнала. Ну а перед тем, как приступать к чтению следующей статьи этой серии, запаситесь серой, ибо мы познакомимся с демонами.

Источник

Оцените статью