- Мониторинг основных показателей приложений. Часть 1
- Общие положения
- Базовый мониторинг
- Процессор
- Операции подкачки
- Память
- Мониторинг
- Windows page faults sec
- Вопрос
- Все ответы
- 5 способов устранения ошибки системы Windows 10 – Page Fault In Nonpaged Area
- Причины возникновения ошибки
- Что делать при «PAGE_FAULT_IN_NONPAGED_AREA»
- Перезагрузка файла подкачки
- Проверка диска ChkDsk
- Проверка памяти Windows
- Запуск утилиты SFC
- Другие способы решения проблемы
Мониторинг основных показателей приложений. Часть 1
Цель этой статьи — структурировать информацию и внести ясность в понятие мониторинга, а также описать методы мониторинга различных компонентов. Речь идет не о всеобъемлющем мониторинге, а о наблюдении за базовыми показателями различных продуктов, чтобы вовремя реагировать на возникающие проблемы
Общие положения
Общее понятие мониторинга можно условно разделить на мониторинг производительности и мониторинг состояния. К мониторингу производительности относятся в основном счетчики производительности со всеми их возможностями, в том числе функцией генерации оповещений. Что касается мониторинга состояния, или «здоровья» систем, то здесь в процессе наблюдения за объектом может применяться некая логика, а используемые методы сложнее, нежели простой опрос счетчиков. Сюда относится наблюдение за разного рода журнальными файлами, как системными, так и собственными файлами приложений, их обработка и выдача соответствующих сообщений или оповещений. Различного рода проверки состояния сервисов, открытости портов, доступности рабочих станций и серверов. В этом случае данные прежде всего попадают в базу данных, а затем, исходя из заданных граничных условий, генерируются оповещения. Наиболее целесообразным методом такого мониторинга я считаю использование скриптов powershell. При этом выход скрипта должен быть стандартизован, чтобы не усложнять внутреннее устройство системы хранения данных.
Базовый мониторинг
Эти счетчики можно использовать для базового мониторинга всех рабочих станций и серверов. Рассмотрим их более подробно.
Процессор
Прежде всего — \Processor\% Processor Time. Это основной показатель активности. Однако если наблюдать за ним, то делать это надо часто, допустим, раз в секунду. Сам по себе он ничего не показывает, однако, если параллельно изменяются % Privileged Time или Processor Queue Length, есть смысл обратить внимание и понаблюдать при помощи специальных утилит. Следующий важный счетчик — \Processor\% Privileged Time. Он показывает процентное время работы процессора в режиме ядра. В нормальном режиме это значение не должно быть высоким. Счетчик \Processor (_Total)\% User Time учитывает время работы процессора в режиме пользователя. Это не означает, что именно такое время процессор выделяет для пользовательских задач, поскольку пользовательские функции в конечном итоге могут обрабатываться в ядре. Но если основная часть времени уходит на работу в режиме ядра, то, вероятно, есть проблемы с драйверами или аппаратным обеспечением. Еще один важный счетчик, на который обязательно нужно обращать внимание, — \Processor\% DPC Time. Он показывает время, потраченное на обработку отложенных вызовов. При возникновении прерывания система передает управление обработчику прерываний, который, в свою очередь, должен максимально быстро выполнить необходимые действия, а основную, более тяжелую обработку отложить. При этом создается специальный объект ядра. Время работы этих объектов и учитывается данным счетчиком. Большое значение счетчика говорит о проблемах с драйверами или оборудованием. Обычно его показатель не превышает 5%. Если такое значение или выше сохраняется длительное время — это индикатор проблемы. \Processor (*)\% Interrupt Time совместно с предыдущим счетчиком позволяет выявлять неполадки в подсистеме обработки прерываний. Само прерывание должно обрабатываться очень быстро. Во время обработки прерывания процессор не переключается на другие прерывания и задачи, а значит, если он надолго застрянет в обработчике прерывания, возникнет впечатление, что система «подвисла». Таким образом, высокие значения этого счетчика — плохой признак.
Основным объектом исполнения кода являются потоки. Они же являются основными потребителями ресурсов процессора. Очередь процессора — это потоки, ожидающие, пока процессор освободится. После выполнения потока система передает процессор следующему в очереди. Таким образом, очередь постоянной длиной в два и более потока сигнализирует о повышенной нагрузке на процессор. Однако при анализе нужно учитывать и счетчик Processor\% Processor Time. Если его значения невысоки при наличии очередей, то это говорит о проблеме в логике самих потоков. К примеру, они много времени проводят на объектах ожидания. Это справедливо также и для многопроцессорных систем. Количество ожидающих потоков можно увидеть в счетчике \System\Processor Queue Length. Переключение контекста происходит, когда ядро переводит процессор с одного потока на другой. В частности, это бывает, если поток с более высоким приоритетом переходит в состояние готовности или рабочий поток переходит в режим ожидания операций ввода/вывода. Обычно большие значения говорят о том, что в системе существует слишком много потоков. Счетчик \System\Context Switches/sec позволяет заметить это. Увеличение количества переключений говорит об увеличении количества потоков. А нормально это или нет — судить вам в каждом конкретном случае. К примеру, если количество потоков растет, а загрузка процессора — нет, то можно предположить, что эти потоки простаивают и имеет место либо утечка, либо неверная логика приложения.
Операции подкачки
Следующая важная группа — счетчики, связанные с памятью и подкачкой. \Memory\Pages/sec — очень примечательный счетчик. Он показывает, сколько страниц в секунду было прочитано или записано в рамках обработки страничного прерывания. Это прерывание возникает, когда искомая страница памяти оказывается выгруженной на диск в данный момент. Однако в этот счетчик попадают и рабочие ситуации, связанные с кэшем и отображенными в память (memory-mapped) файлами. Поэтому по нему нельзя однозначно судить о недостатке памяти. Счетчик \Memory\Page Reads/sec можно использовать в дополнение к предыдущему. Он показывает, сколько операций чтения в единицу времени, безотносительно к страницам, было сделано при обработке страничных прерываний. Счетчики Memory\Pages Input/sec и \Memory\Page Reads/sec нужно рассматривать совместно. Первый из них содержит количество страниц, прочитанных с диска, а второй — количество операций чтения, совершенных при подкачке. Эти счетчики учитывают Hard Page Faults — операции обращения к памяти, при которых искомая страница данных не находится в физической памяти. Счетчик\Memory\Cache Faults учитывает промахи подсистемы кэширования. Таким образом, если \Memory\Pages/sec,\Memory\Page Reads/sec, Memory\Pages Input/sec постоянно находятся на высоком уровне, а \Memory\Cache Faults на низком, то можно предположить, что операционная система активно работает с файлом подкачки, что, в свою очередь, говорит о недостатке памяти. Однако если \Memory\Cache Faults тоже высок, то, скорее всего, ситуация вызвана активной работой с большими файлами, отображаемыми в память. Но это не должно длиться долго. Memory\Transition Faults/sec — значение данного счетчика показывает скорость, с которой обрабатываются так называемые soft faults — ошибки страниц, для разрешения которых не нужны обращения к диску. Количество Transition Faults равно количеству таких страниц.
Память
\Memory\Available MBytes — количество доступной процессам физической памяти. Уменьшение значений этого счетчика, сопровождаемое ростом \Memory\Pages/sec и \Memory\Page Reads/sec, может свидетельствовать о недостатке памяти. Постоянное и равномерное уменьшение счетчика указывает на утечку памяти в одном из приложений.
Счетчик \LogicalDisk (*)\% Free Space показывает процент свободного места на логических дисках. Это важно для тех дисков, на которых расположены постоянно растущие файлы данных, такие как базы данных MS SQL Server или журналы Exchange. LogicalDisk|PhysicalDisk\Avg и Disk Queue Length следят за количеством запросов, стоящих в очереди к диску. Считается, что если очередь к диску длительное время включает более двух запросов, это может быть индикатором проблемы.
Кроме того, следует иметь в виду, что нельзя дать каких-то однозначных рекомендаций по поводу граничных значений определенных счетчиков. Состояние системы в каждый момент зависит от используемого аппаратного обеспечения, питания, запущенных приложений и многого другого. Поэтому для вашей системы эти значения могут быть нормальными, а для другой системы, с другими нагрузками — нет. Но все же в некоторых случаях, для определенных счетчиков, можно ориентироваться на цифры (таблица 1).
Таблица 1. Некоторые рекомендуемые граничные значения счетчиков |
Мониторинг
В данном контексте следует различать службу как предоставляемую услугу и как компонент операционной системы.
Со стороны клиентов можно выделить такие службы:
- файловые службы, файловые службы подразделений;
- службы печати;
- службы почты;
- связь с подразделениями;
- внутренние и внешние сайты;
- бухгалтерские системы;
- приложения третьих фирм;
- терминальные службы;
- сервер удаленного доступа.
Кроме того, необходимо осуществлять базовый мониторинг безопасности.
Стандартная сетевая инфраструктура на основе MS Windows обычно включает в себя:
- Контроллеры домена
- Серверы разрешения имен (DNS, WINS)
- DHCP
- File server
- Print server
- Mail server Exchange
- Серверы приложений
- Веб-сервер внутреннего сайта
- Веб-сервер внешнего сайта
В средних и крупных сетях дополнительно могут использоваться:
- Терминальные серверы
- RRAS
- RADIUS
- MS SQL Server
- Sharepoint
- ISA/TMG
- Fax server
Кроме программных комплексов, могут применяться и аппаратные устройства, поддерживающие удаленный мониторинг посредством различных протоколов, таких как SNMP или WS-Management.
В Windows 2003 появилось понятие ролей, которые должен исполнять данный сервер. В Windows 2008 этот принцип расширен. Теперь роли стали очень важной частью конфигурации сервера. Эти роли приведены в таблице 2.
Таблица 2. Роли сервера |
Таким образом, для базового мониторинга имеет смысл объединять наблюдаемые объекты в «наборы», чтобы в дальнейшем можно было назначить один или несколько таких наборов какому-либо серверу, в зависимости от ролей, которые он исполняет.
Во второй части статьи мы рассмотрим сервисы, которые может предоставлять операционная система сама по себе, в базовой комплектации. А затем — дополнительные функции, такие как exchange и sql server.
Андрей Вернигора (eosfor@gmail.com) — системный администратор, ведет блог http://eosfor.blogspot.com. Имеет сертификаты MCSA, MCDBA, MCSE, MCT
Поделитесь материалом с коллегами и друзьями
Windows page faults sec
Вопрос
We use win2008R2 on vmare.
The average of Page Faults/sec was 4225.716451.
I looked threshould of that and it was 20.
Все ответы
Page faults are divided into two types, soft and hard. Most systems can handle soft page faults with no issues. However, if there are lots of hard page faults you may experience delays. Although high page faults on a system is a fairly straightforward issue, it requires some extensive data gathering and analysis in Performance Monitor, such as Memory \ Pages /sec, Memory \ Page Reads /sec and Memory \ Available Bytes.
Detailed information you may reference An Overview of Troubleshooting Memory Issues — Part Two:
http://blogs.technet.com/b/askperf/archive/2008/01/29/an-overview-of-troubleshooting-memory-issues-part-two.aspx
Best Regards,
Eve Wang
Please remember to mark the replies as answers if they help and unmark them if they provide no help. If you have feedback for TechNet Support, contact tnmff@microsoft.com.
I recorded Page Faults/sec by Performance Monitor.
The average was 4225.716451.
Is it far from normal ?
or Do I need to calculate with Logical Disk Bytes / sec ??
> If the Pages / sec multiplied by 4,000 (the 4k page size) is greater than 70% of the total number of >Logical Disk Bytes / sec to the disk(s) where the page file is located on a consistent basis then you >should investigate.
>Translation: If paging to disk is > 70% of your total disk activity on a consistent basis then there may be >an issue
5 способов устранения ошибки системы Windows 10 – Page Fault In Nonpaged Area
Ошибка Page Fault In Nonpaged Area встречается в любых версиях операционной системы, в том числе в «десятке». Проблема чаще связана с неправильной работой драйверов, ОЗУ, жесткого диска. Неполадка отображается в виде синего экрана BSOD с соответствующим кодом, обозначающим, что устройству не удалось запросить страницу памяти. Рассмотрим основные причины появления ошибки Page Fault In Nonpaged Area и способы ее ликвидации в Windows 10.
Причины возникновения ошибки
Пользователь сталкивается с описываемой проблемой по причине аппаратного или программного сбоя на ПК.
Появление БСОД с этим кодом могут спровоцировать:
- неисправные, устаревшие драйверы;
- повреждение разделов реестра, возникших при установке или деинсталляции ПО, связанного с системой;
- вирусные программы, повредившие файлы Винды;
- конфликт встроенного или скачанного антивирусного ПО;
- конфликт драйверов при подключении нового оборудования;
- поврежденные файлы системы;
- неполадки, связанные с HDD;
- неполадки в ОЗУ;
- неисправность компонента материнской платы.
Перед устранением рассматриваемой ошибки юзеру необходимо изучить окно с уведомлением, в котором сообщается об источнике неполадки. В первую очередь система постарается самостоятельно решить проблему с синим «экраном смерти». Для этого ОС проводит сканирование и перезапуск. Если эти действия не помогли ликвидировать ошибку, пользователю предстоит устранить ее самому.
Что делать при «PAGE_FAULT_IN_NONPAGED_AREA»
Прежде чем приступать к устранению ошибки, рекомендуется отключить на компьютере антивирусные программы, так как они могут быть источником сбоя. Существует несколько вариантов решения проблемы, которые рассмотрим подробнее.
Перезагрузка файла подкачки
Файлом подкачки называется область на жестком диске, которая применяется при нехватке объема памяти ОЗУ. Пространство необходимо системе для быстрого доступа к часто используемым утилитам.
При повреждении компонентов Виндовс не может извлечь из них необходимые данные, и ПК завершает работу в аварийном режиме. В результате юзер видит на экране описываемую ошибку. Для решения задачи требуется создание нового файла подкачки. Операция выполняется по следующей схеме:
- Нажать: «Win + R».
- В окне «Выполнить» ввести: «SystemPropertiesAdvanced.exe».
- Нажать «Ok».
- Перейти в раздел «Быстродействие».
- Войти во вкладку «Дополнительно».
- Нажать на «Параметры».
- В «Виртуальной памяти» тапнуть по кнопке «Изменить».
- Убрать маркер возле строки «Автоматически выбирать объем файла подкачки».
- Отметить строку «Без файла подкачки».
- Сохранить настройки.
Пользователю понадобится перезагрузить гаджет. Затем снова вернуться во вкладку «Виртуальная память» и выполнить следующее:
- Пометить маркером строку «Размер по выбору системы».
- Кликнуть по кнопке «Задать».
- Вернуть отметку рядом со строкой «Автоматически выбирать объем подкачки».
- Нажать «Ok».
- Перезагрузить систему.
Если все действия выполнены правильно, поврежденный файл будет деинсталлирован. При повторном появлении синего «экрана смерти» БСОД, перейти к следующему варианту.
Проверка диска ChkDsk
Появление Page Fault In Nonpaged Area может быть спровоцировано скоплением поврежденных файлов в результате прерывания каких-либо процессов, происходящих на устройстве. Это может быть аварийное завершение работы системы, принудительная остановка загрузки приложения и другие действия. Устранить проблему поможет софт ChkDsk:
- Открыть «Пуск».
- Набрать в поисковой строке: «cmd».
- Выбрать КС с расширенными правами.
- Ввести в строке: «chkdsk /f /r». Нажать «Ok».
При появлении сообщения о том, что команда не может быть выполнена, юзеру потребуется перезапустить систему, так как в данный момент том используется другим процессором. При загрузке подтвердить действие нажатием «Yes».
Проверка памяти Windows
Данный метод не решает проблему, а помогает выяснить – присутствуют ли неполадки в ОЗУ. Для обнаружения сбоев в работе потребуется выполнить следующее:
- Вызвать окно «Выполнить» нажатием клавиш: «Win + R».
- Ввести в строку: «mdsched». Нажать «Ok».
Начнется процесс сканирования, пользователю нужно дождаться его завершения. При обнаружении проблем нужно выключить ПК, извлечь планки оперативной памяти. Далее аккуратно протереть ластиком контакты и снова установить элементы в устройство. Необходимо проверить, плотно ли встали планки в разъем. После останется проверить, исчезла ли проблема. Если исправить ситуацию так и не удалось, придется заменить комплектующие на новые.
Запуск утилиты SFC
Повреждение файлов системы может спровоцировать появление БСОД с описываемой ошибкой. Для выявления и устранения неполадки нужно следовать инструкции:
- Открыть «Пуск».
- В строке поиска набрать: «cmd».
- Открыть КС с правами Администратора.
Запустится процесс сканирования, юзеру остается дождаться, когда он завершится. Напоследок перезапустить систему.
Другие способы решения проблемы
Если ошибка возникла после установки последних обновлений ОС или изменения настроек конфигураций, пользователь может откатить операционку до точки восстановления. Владельцам устройств с Виндовс 10 нужно следовать инструкции:
- Выключить ПК.
- Нажать на кнопку питания одновременно с клавишей «F11».
- Откроется среда восстановления Windows.
- Перейти в раздел «Поиск и устранение неполадок».
- Выбрать «Дополнительные параметры».
- Нажать на «Параметры загрузки».
- Выполнить перезагрузку ПК.
- После включения выбрать «Включить безопасный режим».
Причинами сбоев также выступают устаревшие, поврежденные драйверы. Для выяснения причины потребуется проверить ПО на наличие последних обновлений, при необходимости установить их. Облегчить задачу помогут сторонние утилиты, которые автоматически отыщут и инсталлируют необходимые программные обеспечения.
Ошибку Page Fault In Nonpaged Area легко устранить самостоятельно, используя выше перечисленные методы. Главное – найти источник проблемы. Возможно, разобраться со сбоем пользователю поможет банальная перезагрузка ПК или сканирование системы на вирусы. В крайнем случае, устранить неполадку, связанную с синим «экраном смерти», поможет откат системы до точки восстановления.