Использование tar в сочетании с find предоставляет отличный способ инкрементного резервного копирования дерева каталогов или всей системы. Применяя find для поиска файлов, более новых, чем эталонный файл, определяющий отметку времени, можно создать архив, содержащий только более новые файлы, чем файлы предыдущего архива, при этом предполагается, что время последнего изменения эталонного файла будет изменяться сразу после создания архива.
Программа tar способна также использовать стандартный ввод и стандартный вывод. Например:
[[email protected] foo]$ cd
[[email protected] ~]$ find playground -name 'file-A' | tar cf - --files-from=- | gzip > playground.tgz
Здесь программа find создает список файлов и передает его по конвейеру программе tar. Когда программе tar передается имя файла - (дефис), под ним подразумевается стандартный ввод или стандартный вывод, в зависимости от контекста. (Кстати, соглашение об использовании дефиса (-) для представления стандартного ввода/вывода используется также многими другими программами.) Параметр --files-from (который можно заменить эквивалентным параметром -T) заставляет tar читать список путей из файла, а не из командной строки. Наконец, архив, произведенный программой tar, передается по конвейеру программе gzip, чтобы в результате получить сжатый архив playground.tgz. Расширение .tgz по общепринятому соглашению используется для tar-архивов, сжатых программой gzip. В некоторых случаях используется расширение .tar.gz.
В примере, приведенном выше, для сжатия архива использовалась внешняя программа gzip, однако современные GNU-версии tar поддерживают возможность gzip- и bzip2-сжатия своими встроенными средствами, для чего служат параметры z и j соответственно. Взяв за основу предыдущий пример, его можно упростить, как показано ниже:
[[email protected] ~]$ find playground -name 'file-A' | tar czf playground.tgz -T -
Если, напротив, понадобится создать архив, сжатый в формате bzip2, это можно сделать так:
[[email protected] ~]$ find playground -name 'file-A' | tar cjf playground.tbz -T -
Произведя простую замену параметра сжатия z на j (и изменив расширение выходного файла на .tbz, указывающее, что для сжатия использовался алгоритм bzip2), мы задействовали bzip2-сжатие.
Другой интересный пример использования поддержки стандартного ввода и вывода командой tar связан с передачей файлов между системами по сети. Представьте, что имеется две машины, действующие под управлением Unix-подобных систем и имеющие программы tar и ssh. В этом случае можно организовать передачу каталога из удаленной системы (с именем remote-sys в этом примере) в локальную:
[[email protected] ~]$ mkdir remote-stuff
[[email protected] ~]$ cd remote-stuff
[[email protected] remote-stuff]$ ssh remote-sys 'tar cf - Documents' | tar xf -
[email protected]'s password:
[[email protected] remote-stuff]$ ls
Documents
Здесь мы скопировали каталог Documents из удаленной системы remote-sys в каталог с именем remote-stuff в локальной системе. Как это получилось? Во-первых, мы запустили программу tar в удаленной системе с помощью команды ssh. Как вы наверняка помните, ssh позволяет выполнить программу на удаленном компьютере в сети и «увидеть» результат в локальной системе — стандартный вывод, полученный в удаленной системе, пересылается в локальную систему для обзора. Мы воспользовались этой особенностью и заставили tar создать архив (режим c) и вывести его не в файл, а в стандартный вывод (параметр f с дефисом в качестве аргумента), вследствие чего архив передается через шифрованный туннель, созданный программой ssh, локальной системе. В локальной системе мы вызвали tar с целью распаковать архив (режим x), полученный со стандартного ввода (все тот же параметр f с дефисом в качестве аргумента).
zip — упаковывание и сжатие файлов
Программа zip одновременно является и инструментом сжатия, и архиватором. Формат файлов, используемый программой, знаком пользователям Windows — программа читает и создает файлы с расширением .zip. Однако в Linux чаще других используется программа сжатия gzip, а второе место занимает bzip2. Пользователи Linux используют zip в основном для обмена файлами с системами Windows, а не как основной инструмент сжатия и архивирования.
В простейшем случае программа zip имеет следующий синтаксис:
zip параметры сжатый_файл файл...
Например, ниже показано, как создать zip-архив нашей песочницы:
[[email protected] ~]$ zip -r playground.zip playground
Без параметра -r (отвечает за рекурсивный обход каталогов) в архив будет включен только каталог playground (без своего содержимого). Расширение .zip добавляется к имени выходного файла автоматически, а мы включили его в пример для наглядности.
В процессе создания zip-архива программа zip обычно выводит последовательность сообщений, как показано ниже:
adding: playground/dir-020/file-Z (stored 0%)
adding: playground/dir-020/file-Y (stored 0%)
adding: playground/dir-020/file-X (stored 0%)
adding: playground/dir-087/ (stored 0%)
adding: playground/dir-087/file-S (stored 0%)
Эти сообщения показывают состояние каждого файла, добавленного в архив. zip добавляет файлы в архив, используя один из двух методов: либо «store» (простое сохранение) — без сжатия, как в примере, приведенном выше, либо «deflate» — со сжатием. Числовое значение, следующее за названием метода добавления, указывает достигнутую степень сжатия. Поскольку в нашей песочнице хранятся только пустые файлы, сжатие их содержимого не производится.
Извлечение содержимого из zip-архива выполняется просто — с помощью программы unzip:
[[email protected] ~]$ cd foo
[[email protected] foo]$ unzip ../playground.zip
Одно важное отличие zip (от tar) состоит в том, что если указанный архив существует, он дополняется, а не замещается. То есть существующий архив сохраняется, новые файлы добавляются в него, а существующие — замещаются.
Программа unzip позволяет выводить информацию о файлах и выборочно извлекать их, достаточно только передать ей имя интересующего нас файла:
[[email protected] ~]$ unzip -l playground.zip playground/dir-087/file-Z
Archive: ./playground.zip
Length Date Time Name
-------- ---- ---- ----
0 10-05-12 09:25 playground/dir-087/file-Z
-------- -------
0 1 file
[[email protected] ~]$ cd foo
[[email protected] foo]$ unzip ../playground.zip playground/dir-087/file-Z
Archive: ../playground.zip
replace playground/dir-087/file-Z? [y]es, [n]o, [A]ll, [N]one, [r]ename: y
extracting: playground/dir-087/file-Z
При наличии параметра -l программа unzip просто выведет информацию о содержимом архива, не извлекая файл. Если имя файла (или файлов) не указано, unzip выведет список всех файлов в архиве. Для получения более подробной информации следует добавить параметр -v. Обратите внимание, что когда при извлечении из архива обнаруживается конфликт с существующим файлом, перед его заменой у пользователя запрашивается разрешение.
Подобно программе tar zip может использовать стандартный ввод и вывод, хотя реализация этой возможности имеет меньшую практическую ценность. С помощью параметра [email protected] программе zip по конвейеру передается список имен файлов:
[[email protected] foo]$ cd
[[email protected] ~]$ find playground -name "file-A" | zip [email protected] file-A.zip
Здесь команда find генерирует список файлов, соответствующих проверке -name "file-A", и передает его по конвейеру команде zip, которая затем создает архив file-A.zip с выбранными файлами.
zip также поддерживает запись результатов своей работы в стандартный вывод, но эта особенность имеет ограниченное применение, потому что очень немногие программы способны работать с форматом zip. К сожалению, программа unzip не принимает входные данные со стандартного ввода. Это препятствует совместному использованию zip и unzip для копирования файлов по сети, как это возможно с программой tar.
zip, в свою очередь, способна принимать данные со стандартного ввода, поэтому ее можно использовать для сжатия вывода других программ:
[[email protected] ~]$ ls -l /etc/ | zip ls-etc.zip -
adding: - (deflated 80%)
В этом примере вывод команды ls передается по конвейеру программе zip. Так же как tar, zip интерпретирует завершающий дефис как требование «использовать стандартный ввод вместо файла».
Программа unzip позволяет направить ее результаты в стандартный вывод, для чего следует передать параметр -p (pipe — конвейер):
[[email protected] ~]$ unzip -p ls-etc.zip | less
Мы затронули лишь самые основные возможности программ zip и unzip. Обе они имеют множество параметров, придающих им большую гибкость, хотя некоторые из них допустимы только для определенных платформ. Для обеих программ, zip и unzip, имеются подробные страницы справочного руководства (man) с множеством полезных примеров.
Синхронизация файлов и каталогов
В задачах резервного копирования систем широко используется стратегия синхронизации одного или нескольких каталогов с другими каталогами, находящимися в локальной системе (обычно на некотором извлекаемом устройстве) или в удаленной. Можно, к примеру, создать локальную копию веб-сайта, находящегося в разработке, и синхронизировать ее время от времени с «рабочей» копией на удаленном веб-сервере.
rsync — синхронизация файлов и каталогов с удаленной системой
В мире Unix-подобных систем для решения этой задачи широко используется инструмент rsync. Эта программа синхронизует локальные и удаленные каталоги, используя протокол rsync remote-update (протокол удаленного обновления rsync), который позволяет rsync быстро обнаруживать различия между двумя каталогами и копировать минимальный объем данных, необходимый для синхронизации. Это делает программу rsync быстрой и экономичной по сравнению с другими программами копирования.