[Linux]使用rsync实现上传文件自动断点续传

引言

rsync是一款十分优秀的文件数据同步工具,本文通过rsync实现本地到服务器的数据自动上传断点续传。

文章目录

0×1.安装rsync和expect

Arch安装:

					 qing@qingsword.com:~$ sudo pacman -S rsync expect
					

Ubuntu安装:

					 qing@qingsword.com:~$ sudo apt install rsync expect
					

红帽、CentOS系列安装:

					 qing@qingsword.com:~$ sudo yum install rsync expect
					

0×2.使用rsync实现上传文件自动断点续传

虽然rsync本身具备断点续传的功能,但是当传输的文件很大(例如200G)又不能人工盯着时,每次传输过程因为网络原因中断,就需要人工再次执行命令,而大部分网盘软件,在上传文件中断之后,都不能自动重传,这种大文件上传自动续传的需求可以用下面的方法来实现:

					#第一个文件upload.sh
					 qing@qingsword.com:~$ vim upload.sh
					 #内容如下
					#--------author:QingSword---------
					#!/bin/bash
					#这个upload文件夹和upload.sh放在同一个目录下,需要自己创建,将所有要上传的文件,都放在upload文件夹中
					upload_dir="./upload"
					#遍历upload文件夹中的文件
					for files in $(ls $upload_dir) ; do
						#exp.sh这是等会要创建的第二个文件
					    if [ -f ./exp.sh ] ; then 
					        while true
					        do
					        	#使用expect启动exp.sh,并将执行结果写入result.tmp文件
					            expect exp.sh $upload_dir/$files | tee result.tmp
					            #读取result.tmp文件最后一行的第一个单词
					            res=`tail -n 1 result.tmp | cut -d' ' -f1`
					            #如果单词为total,表示传输完成
					            if [ "$res" = "total" ] ; then
					                break
					            else
					            	#因为其他原因中断,三秒后启动续传
					                sleep 3
					                continue
					            fi
					        done
					    else
					        echo "exp.sh not exsit!"
					    fi
					done
					#-----------------

					#第二个文件exp.sh
					 qing@qingsword.com:~$ vim exp.sh
					#内容如下
					#--------author:QingSword---------
					#!/usr/bin/expect

					#接收传入的第一个参数,储存到uploadfile变量中
					set uploadfile [lindex $argv 0]
					#远程服务器上保存上传文件的文件夹,请根据自己情况修改
					set remotedir "/root/test/"
					#服务器地址
					set remoteip "192.168.1.1"
					#服务器用户
					set remoteuser "root"

					send_user "Start to Upload...\n\r"
					#启动上传进程(远程服务器ssh开启的端口号本例为12345,如果你没改默认端口,替换成22)
					spawn rsync -arvPz -e "ssh -p 12345" $uploadfile $remoteuser@$remoteip:$remotedir
					expect {
					    "*yes/no" { send "yes\r" ; exp_continue }
					    #password更改成远程服务器对应$remoteuser的密码
					    "*ssword*" { send "password\r" } }
					expect eof
					#-----------------
					

确保upload.sh、exp.sh、upload文件夹在同一个目录,将需要上传的文件放置在upload文件夹中,在终端中执行bash upload.sh即可开启上传。

0×3.rsync参数参考

下面是rsync部分参数参考,详细请参考man rsync:

					-v:显示rsync过程中详细信息。可以使用"-vvvv"获取更详细信息。
					-P:显示文件传输的进度信息。(实际上"-P"="--partial --progress",其中的"--progress"才是显示进度信息的)。
					-n --dry-run  :仅测试传输,而不实际传输。常和"-vvvv"配合使用来查看rsync是如何工作的。
					-a --archive  :归档模式,表示递归传输并保持文件属性。等同于"-rtopgDl"。
					-r --recursive:递归到目录中去。
					-t --times:保持mtime属性。强烈建议任何时候都加上"-t",否则目标文件mtime会设置为系统时间,导致下次更新,检查出mtime不同从而导致增量传输无效。
					-o --owner:保持owner属性(属主)。
					-g --group:保持group属性(属组)。
					-p --perms:保持perms属性(权限,不包括特殊权限)。
					-D        :是"--device --specials"选项的组合,即也拷贝设备文件和特殊文件。
					-l --links:如果文件是软链接文件,则拷贝软链接本身而非软链接所指向的对象。
					-z        :传输时进行压缩提高效率。
					-R --relative:使用相对路径。意味着将命令行中指定的全路径而非路径最尾部的文件名发送给服务端,包括它们的属性。用法见下文示例。
					--size-only :默认算法是检查文件大小和mtime不同的文件,使用此选项将只检查文件大小。
					-u --update :仅在源mtime比目标已存在文件的mtime新时才拷贝。注意,该选项是接收端判断的,不会影响删除行为。
					-d --dirs   :以不递归的方式拷贝目录本身。默认递归时,如果源为"dir1/file1",则不会拷贝dir1目录,使用该选项将拷贝dir1但不拷贝file1。
					--max-size  :限制rsync传输的最大文件大小。可以使用单位后缀,还可以是一个小数值(例如:"--max-size=1.5m")
					--min-size  :限制rsync传输的最小文件大小。这可以用于禁止传输小文件或那些垃圾文件。
					--exclude   :指定排除规则来排除不需要传输的文件。
					--delete    :以SRC为主,对DEST进行同步。多则删之,少则补之。注意"--delete"是在接收端执行的,所以它是在exclude/include规则生效之后才执行的。
					-b --backup :对目标上已存在的文件做一个备份,备份的文件名后默认使用"~"做后缀。
					--backup-dir:指定备份文件的保存路径。不指定时默认和待备份文件保存在同一目录下。
					-e          :指定所要使用的远程shell程序,默认为ssh。
					--port      :连接daemon时使用的端口号,默认为873端口。
					--password-file:daemon模式时的密码文件,可以从中读取密码实现非交互式。注意,这不是远程shell认证的密码,而是rsync模块认证的密码。
					-W --whole-file:rsync将不再使用增量传输,而是全量传输。在网络带宽高于磁盘带宽时,该选项比增量传输更高效。
					--existing  :要求只更新目标端已存在的文件,目标端还不存在的文件不传输。注意,使用相对路径时如果上层目录不存在也不会传输。
					--ignore-existing:要求只更新目标端不存在的文件。和"--existing"结合使用有特殊功能。
					--remove-source-files:要求删除源端已经成功传输的文件。