让开发
成为一种享受!

wget命令详细介绍

wget是什么?

wget是一款非交互式的网络文件下载工具。

用法及选项详细介绍

wget [选项]… [URL]…

长选项(例如:–output-file=FILE)所必须的参数在使用短选项(例如:-o File)时也是必须的。

并不是所有的长选项都有对应的短选项

基本:

短选项长选项说明示例
-V–version显示 Wget 的版本信息并退出wget -V
-h–help打印帮助wget -h
-b–background启动后转入后台wget -b http://leisure.wang
-e–execute=COMMAND运行一个“.wgetrc”风格的命令

日志和输入文件:

短选项长选项说明示例
-o–output-file=FILE将日志信息写入 FILE(日志覆盖)wget -o logs http://leisure.wang
-a–append-output=FILE将日志信息添加至 FILE(日志追加)wget -a logs http://leisure.wang
-d–debug打印大量调试信息。wget -d http://leisure.wang
-q–quiet安静模式 (无信息输出)。wget -q http://leisure.wang
-v–verbose详尽的输出 (此为默认值)。wget http://leisure.wang
-nv–no-verbose关闭详尽输出,但不进入安静模式。wget -nv http://leisure.wang
-i–input-file=FILE下载本地或外部 FILE 中的 URLs。(文件中地址需包含地址协议类型,http等)wget -i urls.txt
-F–force-html把输入文件当成 HTML 文件(配合 -i 使用)wget -F -i urls.html
-B–base=URL解析与 URL 相关的HTML 输入文件 (由 -F -i 选项指定)。
–config=FILESpecify config file to use.

示例文件

urls.txt

http://leisure.wang
http://www.baidu.com

urls.html

<html>
   <a href="http://leisure.wang">学而时习之</a>
   <a href="http://baidu.com">百度</a>
</html>

下载:

短选项长选项说明示例
-t–tries=NUMBER设置重试次数为 NUMBER (0 代表无限制)。
–retry-connrefused即使拒绝连接也是重试。
-O–output-document=FILE将文档写入 FIwget -O leisure.html http://leisure.wang
-nc–no-clobber文件已存在则跳过,不下载wget -nc http://leisure.wang
-c–continue断点续传下载文件。
–progress=TYPE选择进度条类型。
-N–timestamping只获取比本地文件新的文件。
–no-use-server-timestamps不用服务器上的时间戳来设置本地文件。
-S–server-response打印服务器响应。
–spider不下载任何文件。
-T–timeout=SECONDS将所有超时设为 SECONDS 秒。
–dns-timeout=SECS设置 DNS 查寻超时为 SECS 秒。
–connect-timeout=SECS设置连接超时为 SECS 秒。
–read-timeout=SECS设置读取超时为 SECS 秒。
-w–wait=SECONDS等待间隔为 SECONDS 秒。
–waitretry=SECONDS在获取文件的重试期间等待 1..SECONDS 秒。
–random-wait获取多个文件时,每次随机等待间隔0.5WAIT…1.5WAIT 秒。
–no-proxy禁止使用代理。
-Q–quota=NUMBER设置获取配额为 NUMBER 字节。
–bind-address=ADDRESS绑定至本地主机上的 ADDRESS (主机名或是 IP)。
–limit-rate=RATE限制下载速率为 RATE。
–no-dns-cache关闭 DNS 查寻缓存。
–restrict-file-names=OS限定文件名中的字符为 OS 允许的字符。
–ignore-case匹配文件/目录时忽略大小写。
-4–inet4-only仅连接至 IPv4 地址。
-6–inet6-only仅连接至 IPv6 地址。
–prefer-family=FAMILY首先连接至指定协议的地址FAMILY 为 IPv6,IPv4 或是 none。
–user=USER将 ftp 和 http 的用户名均设置为 USER。
–password=PASS将 ftp 和 http 的密码均设置为 PASS。
–ask-password提示输入密码。
–no-iri关闭 IRI 支持。
–local-encoding=ENCIRI (国际化资源标识符) 使用 ENC 作为本地编码。
–remote-encoding=ENC使用 ENC 作为默认远程编码。
–unlinkremove file before clobber.

目录:

短选项长选项说明示例
-nd–no-directories不创建目录。
-x–force-directories强制创建目录。wget -x http://leisure.wang
-nH–no-host-directories不要创建主目录。
–protocol-directories在目录中使用协议名称。
-P–directory-prefix=PREFIX以目录PREFIX保存文件wget -P Java http://leisure.wang
–cut-dirs=NUMBER忽略远程目录中 NUMBER 个目录层。

HTTP 选项:

短选项长选项说明示例
–http-user=USER设置 http 用户名为 USER。
–http-password=PASS设置 http 密码为 PASS。
–no-cache不在服务器上缓存数据。
–default-page=NAME改变默认页 (默认页通常是“index.html”)。
-E–adjust-extension以合适的扩展名保存 HTML/CSS 文档。
–ignore-length忽略头部的‘Content-Length’区域。
–header=STRING在头部插入 STRING。
–max-redirect每页所允许的最大重定向。
–proxy-user=USER使用 USER 作为代理用户名。
–proxy-password=PASS使用 PASS 作为代理密码。
–referer=URL在 HTTP 请求头包含‘Referer: URL’。
–save-headers将 HTTP 头保存至文件。
-U–user-agent=AGENT标识为 AGENT 而不是 Wget/VERSION。
–no-http-keep-alive禁用 HTTP keep-alive (永久连接)。
–no-cookies不使用 cookies。
–load-cookies=FILE会话开始前从 FILE 中载入 cookies。
–save-cookies=FILE会话结束后保存 cookies 至 FILE。
–keep-session-cookies载入并保存会话 (非永久) cookies。
–post-data=STRING使用 POST 方式;把 STRING 作为数据发送。
–post-file=FILE使用 POST 方式;发送 FILE 内容。
–content-disposition当选中本地文件名时允许 Content-Disposition 头部 (尚在实验)。
–content-on-erroroutput the received content on server errors.
–auth-no-challenge发送不含服务器询问的首次等待的基本 HTTP 验证信息。

HTTPS (SSL/TLS) 选项:

短选项长选项说明示例
–secure-protocol=PRchoose secure protocol, one of auto, SSLv2,SSLv3, TLSv1, TLSv1_1 and TLSv1_2.
–no-check-certificate不要验证服务器的证书。
–certificate=FILE客户端证书文件。
–certificate-type=TYPE客户端证书类型,PEM 或 DER。
–private-key=FILE私钥文件。
–private-key-type=TYPE私钥文件类型,PEM 或 DER。
–ca-certificate=FILE带有一组 CA 认证的文件。
–ca-directory=DIR保存 CA 认证的哈希列表的目录。
–random-file=FILE带有生成 SSL PRNG 的随机数据的文件。
–egd-file=FILE用于命名带有随机数据的 EGD 套接字的文件。

FTP 选项:

短选项长选项说明示例
–ftp-user=USER设置 ftp 用户名为 USER。
–ftp-password=PASS设置 ftp 密码为 PASS。
–no-remove-listing不要删除‘.listing’文件。
–no-glob不在 FTP 文件名中使用通配符展开。
–no-passive-ftp禁用“passive”传输模式。
–preserve-permissions保留远程文件的权限。
–retr-symlinks递归目录时,获取链接的文件 (而非目录)。

WARC选项:

短选项长选项说明示例
–warc-file=FILENAMEsave request/response data to a .warc.gz file.
–warc-header=STRINGinsert STRING into the warcinfo record.
–warc-max-size=NUMBERset maximum size of WARC files to NUMBER.
–warc-cdxwrite CDX index files.
–warc-dedup=FILENAMEdo not store records listed in this CDX file.
–no-warc-compressiondo not compress WARC files with GZIP.
–no-warc-digestsdo not calculate SHA1 digests.
–no-warc-keep-logdo not store the log file in a WARC record.
–warc-tempdir=DIRECTORYlocation for temporary files created by the WARC writer.

递归下载:

短选项长选项说明示例
-r–recursive指定递归下载。
-l–level=NUMBER最大递归深度 (inf 或 0 代表无限制,即全部下载)。
–delete-after下载完成后删除本地文件。
-k–convert-links让下载得到的 HTML 或 CSS 中的链接指向本地文件。
–backups=Nbefore writing file X, rotate up to N backup files.
-K–backup-converted在转换文件 X 前先将它备份为 X.orig。
-m–mirror-N -r -l inf –no-remove-listing 的缩写形式。
-p–page-requisites下载所有用于显示 HTML 页面的图片之类的元素。
–strict-comments用严格方式 (SGML) 处理 HTML 注释。

递归接受/拒绝:

短选项长选项说明示例
-A–accept=LIST逗号分隔的可接受的扩展名列表。
-R–reject=LIST逗号分隔的要拒绝的扩展名列表。
–accept-regex=REGEXregex matching accepted URLs.
–reject-regex=REGEXregex matching rejected URLs.
–regex-type=TYPEregex type (posixpcre).
-D–domains=LIST逗号分隔的可接受的域列表。
–exclude-domains=LIST逗号分隔的要拒绝的域列表。
–follow-ftp跟踪 HTML 文档中的 FTP 链接。
–follow-tags=LIST逗号分隔的跟踪的 HTML 标识列表。
–ignore-tags=LIST逗号分隔的忽略的 HTML 标识列表。
-H–span-hosts递归时转向外部主机。
-L–relative只跟踪有关系的链接。
-I–include-directories=LIST允许目录的列表。
–trust-server-namesuse the name specified by the redirection url last component.
-X–exclude-directories=LIST排除目录的列表。
-np–no-parent不追溯至父目录。

扫码关注公众号:Java开发乐园

在聊天窗口回复:vip

输入验证码,即可永久解锁本站全部文章

扫码关注【Java开发乐园】

Java开发乐园

扫码关注【东方】

微信:东方

验证码:
赞(0) 打赏
转载请注明出处:Java开发乐园 » wget命令详细介绍

来评论一下嘛~ 抢沙发

评论前必须登录!

 

我愿终生等候,换你刹那凝眸

留点🐾印

打赏即是一种肯定,谢谢您的肯定

支付宝扫一扫打赏

微信扫一扫打赏