LXF133:Grep
(викификация, оформление, иллюстрация) |
2sash-kan (обсуждение | вклад) |
||
(не показана 1 промежуточная версия 1 участника) | |||
Строка 41: | Строка 41: | ||
===Настраиваем вывод=== | ===Настраиваем вывод=== | ||
− | Давайте упростим восприятие того, что мы делаем, включив опцию | + | Давайте упростим восприятие того, что мы делаем, включив опцию подсветки в ''grep''. На сей раз поищем '''‘war’'''. |
grep -ri --color=auto war /usr/share/calendar/ | grep -ri --color=auto war /usr/share/calendar/ | ||
Строка 92: | Строка 92: | ||
# Найти все строки, содержащие слово '''‘first’''' и '''‘1954’''', в этом порядке: ''grep -ri first.*1954 /usr/share/calendar'' | # Найти все строки, содержащие слово '''‘first’''' и '''‘1954’''', в этом порядке: ''grep -ri first.*1954 /usr/share/calendar'' | ||
− | # Найти IP-адрес. Здесь надо много вводить, и точность будет не 100%, поскольку результат включит, скажем, 9.9.9.9999, а это, конечно, адрес неверный. Можно написать более строгий запрос, но снижение количества ложных срабатываний не стоит увеличения сложности выражения. ''grep -r ‘\([[:digit:]]\+\.\)\{3\}[[:digit:]]\+’ /etc/sysconfig/networkscripts'' | + | # Найти IP-адрес. Здесь надо много вводить, и точность будет не 100%, поскольку результат включит, скажем, 9.9.9.9999, а это, конечно, адрес неверный. Можно написать более строгий запрос, но снижение количества ложных срабатываний не стоит увеличения сложности выражения. ''grep -r ‘\([[<nowiki />:digit:]]\+\.\)\{3\}[[<nowiki />:digit:]]\+’ /etc/sysconfig/networkscripts'' |
# Найти URL (вместо '''\.com''' подставьте '''\.ru''', и т. д.). Мы указали обычный домен длиной от 3 до 50 символов. ''grep -r ‘www\..\{3,50\}\.com’ /home/faye/.mozilla/'' | # Найти URL (вместо '''\.com''' подставьте '''\.ru''', и т. д.). Мы указали обычный домен длиной от 3 до 50 символов. ''grep -r ‘www\..\{3,50\}\.com’ /home/faye/.mozilla/'' | ||
# Наконец, вот две команды ''grep'', связанные вместе через перенаправление вывода. В результате выводится общее число совпадений во всех файлах сразу, а не в каждом по отдельности: ''grep -riwh first /usr/share/calendar | grep -ic first'' | # Наконец, вот две команды ''grep'', связанные вместе через перенаправление вывода. В результате выводится общее число совпадений во всех файлах сразу, а не в каждом по отдельности: ''grep -riwh first /usr/share/calendar | grep -ic first'' |
Текущая версия на 19:49, 3 июля 2014
|
|
|
Содержание |
[править] grep Супер-поиск по команде
- Любите командную строку и хотите достичь большего? Исследуйте grep с Фэй ‘Шерлок’ Уильямс – и отныне ничего уже не потеряете.
Команда grep – мощнейшее средство поиска в файлах. Как и со многими утилитами командной строки, освоившись в ней, вы обнаружите, что она удивительно быстра и точна. Однако многие пользователи Linux снисходят до изучения не более одной-двух опций grep, после чего применяют их как способ поиска «за все». А ведь чуток времени, потраченного на изучение возможностей grep, окупится сторицей – и нет ничего приятнее, чем точное знание, как по команде мгновенно получить нужный результат. Мы начнем с основ и наработаем багаж вариантов использования grep, а завершим все кое-какими уловками – чтобы проверить, алчете ли вы еще.
- Метамодернизм в позднем творчестве В.Г. Сорокина
- ЛитРПГ - последняя отрыжка постмодерна
- "Ричард III и семиотика"
- 3D-визуализация обложки Ridero создаем обложку книги при работе над самиздатом.
- Архитектура метамодерна - говоря о современном искусстве, невозможно не поговорить об архитектуре. В данной статье будет отмечено несколько интересных принципов, характерных для построек "новой волны", столь притягательных и скандальных.
- Литература
- Метамодерн
- Рокер-Прометей против изначального зла в «Песне про советскую милицию» Вени Дркина, Автор: Нина Ищенко, к.ф.н, член Союза Писателей ЛНР - перепубликация из журнала "Топос".
- Как избавиться от комаров? Лучшие типы ловушек.
- Что делать если роблокс вылетает на windows
- Что делать, если ребенок смотрит порно?
- Почему собака прыгает на людей при встрече?
- Какое масло лить в Задний дифференциал (мост) Visco diff 38434AA050
- О чем может рассказать хвост вашей кошки?
- Верветки
- Отчетность бюджетных учреждений при закупках по Закону № 223-ФЗ
- Срок исковой давности как правильно рассчитать
- Дмитрий Патрушев минсельхоз будет ли преемником Путина
- Кто такой Владислав Поздняков? Что такое "Мужское Государство" и почему его признали экстремистским в России?
- Как правильно выбрать машинное масло в Димитровграде?
- Как стать богатым и знаменитым в России?
- Почему фильм "Пипец" (Kick-Ass) стал популярен по всему миру?
- Как стать мудрецом?
- Как правильно установить FreeBSD
- Как стать таким как Путин?
- Где лучше жить - в Димитровграде или в Ульяновске?
- Почему город Димитровград так называется?
- Что такое метамодерн?
- ВАЖНО! Временное ограничение движения автотранспортных средств в Димитровграде
- Тарифы на электроэнергию для майнеров предложено повысить
На рисунке приведен пример поиска в файле календаря OpenBSD. Такие установлены по умолчанию в Ubuntu, Mint и многих других дистрибутивах, и даже на Mac. А если у вас (как и у меня) Fedora, и вы не желаете оставаться в стороне, добавьте их вручную, выбрав в своем рабочем столе опцию Система > Администрирование > Добавить/Удалить приложение. Найдите calendar, установите флажок рядом с Утилитой напоминания и нажмите Применить. Или просто выполните yum install calendar в командной строке. А теперь о главном.
[править] Простой поиск
Команда grep распознает следующее:
- Любые опции фильтрации результатов поиска.
- Строку (или шаблон) искомого.
- Место осуществления поиска – файл или каталог.
Для примера тут же опробуйте:
grep first /usr/share/calendar/calendar.history
Обсудим полученное. Мы попросили grep найти все вхождения строки ‘first’ в файле calendar.history. Помните, что grep чувствительна к регистру – попробуйте выполнить grep First /usr/share/calendar/calendar.history и сравните то, что получится в результате.
Если вы хотите осуществить поиск без учета заглавных и строчных букв, добавьте опцию -i для игнорирования регистра.
grep -i first /usr/share/calendar/calendar.history
Пока все хорошо. А вдруг необходимо выполнить поиск в нескольких файлах? Календарей, которые вы захотите просмотреть, немало, так что смените путь к файлу на каталог и добавьте опцию -r, чтобы поиск grep осуществлялся рекурсивно по всем файлам и подкаталогам, находящимся в указанном каталоге:
grep -ir first /usr/share/calendar
Каждая строка вывода теперь предваряется именем файла. Заметим, что порядок добавления опций после символа ‘-’ роли не играет.
Иногда примеры, приведенные выше, вас спасают; если вы ищете письмо, которое написали некому Дону Дженкинсу, и знаете, что оно где-то в домашнем каталоге, вы, вероятно, найдете файл при помощи:
grep -r Jenkins /home/faye
Но что если вы запустили команду grep и не получили ожидаемого результата, или получили столько совпадений, что не можете отличить одну строку от другой?
[править] Настраиваем вывод
Давайте упростим восприятие того, что мы делаем, включив опцию подсветки в grep. На сей раз поищем ‘war’.
grep -ri --color=auto war /usr/share/calendar/
- Метамодернизм в позднем творчестве В.Г. Сорокина
- ЛитРПГ - последняя отрыжка постмодерна
- "Ричард III и семиотика"
- 3D-визуализация обложки Ridero создаем обложку книги при работе над самиздатом.
- Архитектура метамодерна - говоря о современном искусстве, невозможно не поговорить об архитектуре. В данной статье будет отмечено несколько интересных принципов, характерных для построек "новой волны", столь притягательных и скандальных.
- Литература
- Метамодерн
- Рокер-Прометей против изначального зла в «Песне про советскую милицию» Вени Дркина, Автор: Нина Ищенко, к.ф.н, член Союза Писателей ЛНР - перепубликация из журнала "Топос".
- Как избавиться от комаров? Лучшие типы ловушек.
- Что делать если роблокс вылетает на windows
- Что делать, если ребенок смотрит порно?
- Почему собака прыгает на людей при встрече?
- Какое масло лить в Задний дифференциал (мост) Visco diff 38434AA050
- О чем может рассказать хвост вашей кошки?
- Верветки
- Отчетность бюджетных учреждений при закупках по Закону № 223-ФЗ
- Срок исковой давности как правильно рассчитать
- Дмитрий Патрушев минсельхоз будет ли преемником Путина
- Кто такой Владислав Поздняков? Что такое "Мужское Государство" и почему его признали экстремистским в России?
- Как правильно выбрать машинное масло в Димитровграде?
- Как стать богатым и знаменитым в России?
- Почему фильм "Пипец" (Kick-Ass) стал популярен по всему миру?
- Как стать мудрецом?
- Как правильно установить FreeBSD
- Как стать таким как Путин?
- Где лучше жить - в Димитровграде или в Ульяновске?
- Почему город Димитровград так называется?
- Что такое метамодерн?
- ВАЖНО! Временное ограничение движения автотранспортных средств в Димитровграде
- Тарифы на электроэнергию для майнеров предложено повысить
Уже лучше! И теперь можно увидеть искомую строку (если у вас Linux Mint, подцветка включена по умолчанию). Далее, избавимся от всех подстрок, поскольку grep выводит все совпадения, даже если они являются частью других слов. Например, наш поиск war также прихватит строку с "Rod Stewart". Этого можно избежать, запросив поиск только полных слов при помощи опции -w – количество совпадений уменьшится на две трети. Об этом мы узнали, заставив grep подсчитать количество вхождений, вместо их прямого вывода, по опции -c:
grep -riwc war /usr/share/calendar
Видно, что grep выводит количество совпадений для всех файлов, в которых осуществлялся поиск. Если вы искали в единственном файле, вернется одно число.
Прежде чем двинуться дальше, еще кое-что. Отыскивая более одного слова, следует пользоваться одиночными кавычками для учета пробелов:
grep -ri ‘civil war’ /usr/share/calendar
Все это хорошо, но вот поиск чего-то вроде “$20” дает нечто ужасно неверное. Что случилось?
- Метамодернизм в позднем творчестве В.Г. Сорокина
- ЛитРПГ - последняя отрыжка постмодерна
- "Ричард III и семиотика"
- 3D-визуализация обложки Ridero создаем обложку книги при работе над самиздатом.
- Архитектура метамодерна - говоря о современном искусстве, невозможно не поговорить об архитектуре. В данной статье будет отмечено несколько интересных принципов, характерных для построек "новой волны", столь притягательных и скандальных.
- Литература
- Метамодерн
- Рокер-Прометей против изначального зла в «Песне про советскую милицию» Вени Дркина, Автор: Нина Ищенко, к.ф.н, член Союза Писателей ЛНР - перепубликация из журнала "Топос".
- Как избавиться от комаров? Лучшие типы ловушек.
- Что делать если роблокс вылетает на windows
- Что делать, если ребенок смотрит порно?
- Почему собака прыгает на людей при встрече?
- Какое масло лить в Задний дифференциал (мост) Visco diff 38434AA050
- О чем может рассказать хвост вашей кошки?
- Верветки
- Отчетность бюджетных учреждений при закупках по Закону № 223-ФЗ
- Срок исковой давности как правильно рассчитать
- Дмитрий Патрушев минсельхоз будет ли преемником Путина
- Кто такой Владислав Поздняков? Что такое "Мужское Государство" и почему его признали экстремистским в России?
- Как правильно выбрать машинное масло в Димитровграде?
- Как стать богатым и знаменитым в России?
- Почему фильм "Пипец" (Kick-Ass) стал популярен по всему миру?
- Как стать мудрецом?
- Как правильно установить FreeBSD
- Как стать таким как Путин?
- Где лучше жить - в Димитровграде или в Ульяновске?
- Почему город Димитровград так называется?
- Что такое метамодерн?
- ВАЖНО! Временное ограничение движения автотранспортных средств в Димитровграде
- Тарифы на электроэнергию для майнеров предложено повысить
ОК, вам следует знать о grep еще кое-что, и это тот факт, что он разрабатывался для работы с шаблонами или регулярными выражениями. Это обширная тема, но вот вам ее вершки (см. примеры внизу или же загляните в LXF80, если хотите узнать больше). Символы вроде $*.?+ имеют свои особые значения и позволяют искать в файлах сложные и точные шаблоны. Если вы ищете строку, содержащую эти спецсимволы, предварите их обратным слэшем:
grep -ri ‘\$20’ /home/faye/statement.txt
Иначе grep интерпретирует символ не просто как литерал, и результат может содержать то, что вы хотели получить, а может, и нет.
Наконец, при желании сохранить результаты поиска можно перенаправить вывод grep в файл, следующим образом:
grep -riw first /usr/share/calendar > /home/faye/search.txt
Будьте осторожны, поскольку, сохранив файл в том же каталоге (или подкаталоге), где осуществлялся рекурсивный поиск, вы можете угодить в бесконечный цикл: grep примется выдавать вывод о создаваемых самим же файлах. Если вы случайно это сделали, просто нажмите Ctrl+C для выхода из цикла и удалите файл результата, поскольку он явно будет массивным.
Став завзятым линуксоидом, вы обнаружите, что grep незаменим, но если вы действительно желаете освоить эту команду, следует предпринять несколько дополнительных шагов. Во-первых, попользуйтесь man-страницей (по завершении чтения нажмите Q):
man grep
Так вы получите детальное описание опций grep. Стоит также попробовать команду help:
grep --help
Она превосходна для быстрого напоминания. Она сообщит, как вставить в вывод номера строк (великолепно для файлов с исходными кодами), отобразить только имена файлов, вывести контекст над и под найденными строками или даже все, что не соответствует искомому.
Во-вторых, если вы сумеете отвести немного времени на изучение использования регулярных выражений, то результат окупится вдесятеро – тогда-то мир grep действительно перед вами раскроется.
[править] Почему grep?
Слово ‘grep’ – сокращение по первым буквам стандартной серии команд, используемых в ed, одном из однострочных текстовых редакторов Unix. Команды global/regular expression/print велят ed помечать каждую входную строку, соответствующую регулярному выражению (или шаблону поиска), и выводить ее на экран. Это применялось так часто, что grep в Unix вынесли в отдельную утилиту. Ее история насчитывает три десятилетия и несколько различных версий и алгоритмов, и она все так же популярна, как и при рождении.
[править] Четыре ценных шаблона
- Найти все строки, содержащие слово ‘first’ и ‘1954’, в этом порядке: grep -ri first.*1954 /usr/share/calendar
- Найти IP-адрес. Здесь надо много вводить, и точность будет не 100%, поскольку результат включит, скажем, 9.9.9.9999, а это, конечно, адрес неверный. Можно написать более строгий запрос, но снижение количества ложных срабатываний не стоит увеличения сложности выражения. grep -r ‘\([[:digit:]]\+\.\)\{3\}[[:digit:]]\+’ /etc/sysconfig/networkscripts
- Найти URL (вместо \.com подставьте \.ru, и т. д.). Мы указали обычный домен длиной от 3 до 50 символов. grep -r ‘www\..\{3,50\}\.com’ /home/faye/.mozilla/
- Наконец, вот две команды grep, связанные вместе через перенаправление вывода. В результате выводится общее число совпадений во всех файлах сразу, а не в каждом по отдельности: grep -riwh first /usr/share/calendar | grep -ic first