В программе awk могут использоваться аргументы командной строки: массив ARGV содержит элементы ARGV[0], ... ARGV[ARGC-1], где ARGC - счетчик, ARGV[0] - имя программы (в общем случае - awk), остальное - любые поддерживаемые аргументы, исключая программы и необязательные аргументы).
Следующая командная строка содержит программу awk, отражающую аргументы, которые появляются после имени программы:
awk '
BEGIN {
for ( i = 1; i < ARGC; i++ )
printf "%s ", ARGV[i]
printf "\n"
}' $*
Аргументы могут быть модифицированы или добавлены. ARGC может изменяться. После окончания вводного файла awk обращается к следующему ненулевому элементу ARGV (увеличив текущее значение ARGC-1) как к имени следующего вводного файла.
Исключением из правила является то, что аргумент считается именем файла, если он имеет форму:
var-value
Переменная var принимает значение value, как при операции присвоения. Если value является строкой, то кавычки не нужны.
Наибольшего эффекта awk достигает при использовании с другими программами. В этом подразделе обсуждаются некоторые способы взаимодействия программ awk с другими командами.
Встроенная функция system (command_line) выполняет команду "command_line", которая может быть строкой, вычисляющей, например, sprintf. Функция system возвращает состояние выполненной команды.
вызывает команду cat для печати файла, названного во втором поле каждой вводной записи, у которой первое поле #include, после разборки каждого <, > или ", которые должны присутствовать.
Во всех приводимых примерах программа awk находилась в файле и из него осуществлялся вызов с помощью ключа -f, либо она представлялась в командной строке, заключенная в одиночные кавычки. Например:
awk '{ print $1 }' ...
Так как awk использует те же символы, что и shell (такие как $ и ", окружающие программу awk), одиночные кавычки обеспечат прохождение программы неизменной через shell к интерпретатору awk.
Пример. Команда addr осуществляет выборку файла addresslist для получения имени, адреса и телефона. Предположим, что addresslist содержит имена и адреса, в котором типичным входом является многострочная запись, такая как:
G. R. Emlin 600 Mountain Avenue Murray Hill, NJ 07974 201-555-1234
Записи разделяются одной пустой строкой. Вы можете выбрать список адресов с помощью командной строки, подобной:
addr Emlin
Это легко выполнить с помощью следующей программы:
awk ' BEGIN { RS = "" } /Emlin/ ' addresslist
Проблема состоит в том, чтобы получить различные шаблоны выборок при каждом запуске программ.
Существует несколько способов сделать это. Один из способов - это создать файл, названный addr, который содержит:
awk ' BEGIN { RS = "" } /'$1'/ ' addresslist
В программе awk один аргумент, хотя установлено два набора кавычек, но они не являются вложенными. $1 заключено в одиночные кавычки и видимо для shell; затем будет заменено на шаблон Emlin при вызове команды addr Emlin.
Второй способ реализации addr полагается на тот факт, что shell заменяет параметры $ в двойных кавычках:
awk " BEGIN { RS = \"\" } /$1/ " addresslist
Кроме того, вы должны защитить кавычки, определяющие RS символами \, так что shell направит их awk без интерпретации. $1 распознается как параметр и shell заменяет его на шаблон, когда команда addr вызывается с шаблоном.
Третий способ реализации addr - использовать ARGV для передачи регулярного выражения программе awk, которая читает список адресов с помощью getline:
awk ' BEGIN { RS = "" while ( getline < "addresslist" ) if ($0 ~ ARGV[1] print $0 } ' $*
Вся обработка выполняется в "действии" оператора BEGIN.
Обратите внимание, что регулярное выражение может быть передано addr. В частности, возможно отыскать отдельно адрес, или номер телефона, или имя.