Текстовое приложение Linux под названием Uniq ищет повторяющиеся строки в файле. Проще говоря, uniq — это инструмент, который помогает как идентифицировать, так и удалять все повторяющиеся строки из файла. Команда uniq дает нам доступ к нескольким различным флагам, включая «-c», «-u», «-d», «-D» и «-i», среди прочих, для выполнения различных операций. Используя эти параметры команды uniq, мы можем отображать количество слов в любой строке, печатать только повторяющиеся строки или отображать уникальное содержимое файла. В этой статье мы поговорим о некоторых флагах команды uniq.
Пример: использование команды Linux Uniq
В этом примере мы используем команду «uniq» из операционной системы Linux. Эта команда используется для сжатия или обобщения информации. Команда «Uniq» используется для поиска повторяющихся строк, следующих друг за другом. Давайте просто начнем выполнение команды uniq. Однако, прежде чем делать это на терминале, мы должны сначала создать текстовый файл. Поскольку текстовый файл уже существует на нашем рабочем столе, мы будем использовать его. «Текстовый файл.txt» — это имя файла, который уже находится на нашем рабочем столе. Расширение текстового файла должно быть «.txt».
Команда cat, часто используемая в Linux, используется для открытия этого текстового файла на терминале, который содержит некоторые данные. Данные файла извлекаются, и его содержимое выводится. Это упрощает слияние, чтение и создание файлов. Поэтому мы сначала вводим «cat», а затем имя файла, которое является «textfile.txt».
andreyex@destroyer-VirtualBox:~/Desktop$ cat textfile.txt
Теперь, как видите, когда мы запускаем эту команду, в окне терминала отображаются данные из существующего на данный момент файла в текстовом файле с именем «textfile.txt». В этом файле девять строк. Первые два из них идентичны и несут информацию «Алекс любит программировать с использованием различных технологий». Следующая строка пуста, а четвертая и пятая строки содержат ту же информацию, включая «Меня интересует работа со скриптовыми языками». Последние две строки имеют две отдельные строки: «Некоторые из языков программирования: «java», «oop», «php», «c++», «python» и т. д. и «Язык, используемый для создания компьютерных программ, называется язык программирования». Теперь очевидно, что первые две строки идентичны и повторяются, как и следующие две. Хотя последние две строки имеют разное содержание,
Алекс любит программировать с использованием различных технологий. Алекс любит программировать с использованием различных технологий. Меня интересует работа со скриптовыми языками. Меня интересует работа со скриптовыми языками. Некоторые из языков программирования: java , oop, php, c++ , python и т. д. Язык, используемый для создания компьютерных программ, называется языком программирования.
Теперь давайте просто используем команду uniq, чтобы удалить повторяющуюся строку из файла. Для этого выполните следующую команду на терминале. Затем введите ключевое слово «uniq», а затем имя файла «textfile.txt».
andreyex@destroyer-VirtualBox:~/Desktop$ uniq textfile.txt
Как видно из следующего, когда мы запускаем эту команду, она не отображает повторяющиеся строки на выходе в окне терминала. В исходном файле девять строк. Но после применения команды uniq их всего шесть. Это связано с тем, что первая строка «Алекс любит программировать с использованием различных технологий» появляется дважды в исходном файле, но только один раз после применения команды uniq. Вторая строка появляется дважды в исходном файле, но только один раз после применения команды uniq. Последние две строки представлены точно так, как они есть, потому что они не повторяются в файле.
Алекс любит программировать с использованием различных технологий. Меня интересует работа со скриптовыми языками. Некоторые из языков программирования: java , oop, php, c++ , python и т.д. Язык, используемый для создания компьютерных программ, называется языком программирования.
Использование параметров команды Uniq
Команда uniq дает нам несколько различных опций, таких как «-c», «-d», «-u» и т. д., для выполнения различных задач. Мы можем подсчитать количество повторяющихся строк, содержащихся в файлах, используя параметры команды uniq. Мы можем отображать только повторяющиеся строки файлов в выводе и т. д. Давайте используем некоторые из следующих флагов команды uniq:
Подсчет количества строк с флагом «-C»
Количество строк в файле подсчитывается с помощью флага «-c» функции uniq. Он подсчитывает повторяющиеся строки, а также отдельные строки и отображает появление каждой строки, отображая число в качестве префикса со строкой. Для этого мы используем команду, в которой сначала вводим слово «uniq», затем параметр «-c», а затем имя файла «textfile.txt».
andreyex@destroyer-VirtualBox:~/Desktop$ uniq -c textfile.txt
Вывод этой команды показывает повторение строк, показывая число в качестве их префикса. Например, строка «Алекс любит программировать с использованием различных технологий» встречается в файле дважды. Итак, перед ним изображена цифра «2». Точно так же в файле дважды появляется строка «Меня интересует работа с языками сценариев». Остальные строки используются только один раз, и в качестве префикса отображается «1».
2 Алекс любит программировать с использованием различных технологий. 1 2 Меня интересует работа со скриптовыми языками. 1 1 Некоторые из языков программирования: java , oop, php, c++ , python и т. д. 1 1 Язык, используемый для создания компьютерных программ, называется языком программирования.
Использование флага «-D» для печати повторяющихся строк
В этой части повторяющиеся строки в файле отображаются с помощью опции «-d» команды uniq. Для этого мы используем команду, в которой сначала вводим слово «uniq», затем опцию «-d», а затем имя файла «textfile.txt».
andreyex@destroyer-VirtualBox:~/Desktop$ uniq -d textfile.txt
Только строки, которые повторяются, представлены в выводе, который следует за выполнением этой команды. Другие строки, которые используются только один раз, не показаны.
Алекс любит программировать с использованием различных технологий. Алекс любит программировать с использованием различных технологий. Меня интересует работа со скриптовыми языками. Меня интересует работа со скриптовыми языками.
Использование флага -U команды Uniq
Опция «-u» команды uniq теперь используется для вывода уникального содержимого файла непосредственно с помощью этой опции. Он отображает строки или содержимое файла в выводе, который используется только один раз. Повторяющийся текст в файле не отображается в выводе; он удален. Вместо следующей опции используется только флаг «-u». В противном случае используется та же команда, что и в предыдущем примере.
andreyex@destroyer-VirtualBox:~/Desktop$ uniq –u textfile.txt
Когда мы выполняем эту команду, вывод выглядит следующим образом. Повторяющиеся строки файлов удаляются, и раскрывается уникальное содержимое файла. Этот вывод включает две строки, показанные в следующей демонстрации; обе эти строки используются в файле только один раз, поэтому они появляются.
Некоторые из языков программирования: java , oop, php, c++ , python и т . д. Язык, используемый для создания компьютерных программ, называется языком программирования.
Заключение
В этой статье рассматривается команда Uniq в Linux, которая используется для удаления дублированного содержимого из файлов и отображает его только один раз на выходе с использованием ключевого слова «uniq» с заданным текстовым файлом. В приведенных примерах мы использовали уникальные командные флаги «-c», «-u» и «-d». Эти флаги позволяли нам выполнять различные операции с помощью команды uniq. В этой статье мы неоднократно демонстрировали, что строка повторяется, если перед строкой ставится число. Кроме того, мы рассмотрели, как использовать эти маркеры для печати только повторяющихся строк и уникального контента.