Приложение B. Маленький учебник по Sed и Awk
В этом приложении содержится очень краткое описание приемов работы с утилитами обработки текста sed и awk. Здесь будут рассмотрены лишь несколько базовых команд, которых, в принципе, будет достаточно, чтобы научиться понимать простейшие конструкции sed и awk внутри сценариев на языке командной оболочки.
sed: неинтерактивный редактор текстовых файлов
awk: язык обработки шаблонов с C-подобным синтаксисом
При всех своих различиях, эти две утилиты обладают похожим синтаксисом, они обе умеют работать с регулярными выражениями, обе, по-умолчанию, читают данные с устройства stdin и обе выводят результат обработки на устройство stdout. Обе являются утилитами UNIX-систем, и прекрасно могут взаимодействовать между собой. Вывод от одной может быть перенаправлен, по конвейеру, на вход другой. Их комбинирование придает сценариям, на языке командной оболочки, мощь и гибкость языка Perl.
Операция | Название | Описание |
---|---|---|
[диапазон строк]/p | Печать [указанного диапазона строк] | |
[диапазон строк]/d | delete | Удалить [указанный диапазон строк] |
s/pattern1/pattern2/ | substitute | Заменить первое встреченное соответствие шаблону pattern1, в строке, на pattern2 |
[диапазон строк]/s/pattern1/pattern2/ | substitute | Заменить первое встреченное соответствие шаблону pattern1, на pattern2, в указанном диапазоне строк |
[диапазон строк]/y/pattern1/pattern2/ | transform | заменить любые символы из шаблона pattern1 на соответствующие символы из pattern2, в указанном диапазоне строк (эквивалент команды tr) |
g | global | Операция выполняется над всеми найденными соответствиями внутри каждой из заданных строк |
Операция | Описание |
---|---|
8d | Удалить 8-ю строку. |
/^$/d | Удалить все пустые строки. |
1,/^$/d | Удалить все строки до первой пустой строки, включительно. |
/Jones/p | Вывести строки, содержащие «Jones» (с ключом -n ). |
s/Windows/Linux/ | В каждой строке, заменить первое встретившееся слово «Windows» на слово «Linux» . |
s/BSOD/stability/g | В каждой строке, заменить все встретившиеся слова «BSOD» на «stability» . |
s/ *$// | Удалить все пробелы в конце каждой строки. |
s/00*/0/g | Заменить все последовательности ведущих нулей одним символом «0». |
/GUI/d | Удалить все строки, содержащие «GUI» . |
s/GUI//g | Удалить все найденные «GUI» , оставляя остальную часть строки без изменений. |
Замена строки пустой строкой, эквивалентна удалению части строки, совпадающей с шаблоном. Остальная часть строки остается без изменений. Например, s/GUI//, изменит следующую строку
Символ обратного слэша представляет символ перевода строки, как символ замены. В этом случае, замещающее выражение продолжается на следующей строке.
Эта инструкция заменит начальные пробелы в строке на символ перевода строки. Ожидаемый результат — замена отступов в начале параграфа пустыми строками.
Указание диапазона строк, предшествующее одной, или более, инструкции может потребовать заключения инструкций в фигурные скобки, с соответствующими символами перевода строки.
В этом случае будут удалены только первые из нескольких, идущих подряд, пустых строк. Это может использоваться для установки однострочных интервалов в файле, оставляя, при этом, пустые строки между параграфами.