curl

利用URL规则在命令行下工作的文件传输工具

补充说明

curl命令 是一个利用URL规则在命令行下工作的文件传输工具。它支持文件的上传和下载,所以是综合传输工具,但按传统,习惯称curl为下载工具。作为一款强力工具,curl支持包括HTTP、HTTPS、ftp等众多协议,还支持POST、cookies、认证、从指定偏移处下载部分文件、用户代理字符串、限速、文件大小、进度条等特征。做网页处理流程和数据检索自动化,curl可以助一臂之力。

语法

1curl(选项)(参数)

选项

 1-a   --append                                   # 上传文件时,附加到目标文件 
 2-A   --user-agent                               # 设置用户代理发送给服务器 
 3-anyauth                                        # 可以使用“任何”身份验证方法 
 4-b   --cookie                                   # cookie字符串或文件读取位置 
 5     --basic                                    # 使用HTTP基本验证 
 6-B   --use-ascii                                # 使用ASCII /文本传输 
 7-c   --cookie-jar                               # 操作结束后把cookie写入到这个文件中 
 8-C   --continue-at                              # 断点续传 
 9-d   --data                                     # HTTP POST方式传送数据 
10     --data-ascii                               # 以ascii的方式post数据 
11     --data-binary                              # 以二进制的方式post数据 
12     --negotiate                                # 使用HTTP身份验证 
13     --digest                                   # 使用数字身份验证 
14     --disable-eprt                             # 禁止使用EPRT或LPRT 
15     --disable-epsv                             # 禁止使用EPSV 
16-D   --dump-header                              # 把header信息写入到该文件中 
17     --egd-file                                 # 为随机数据(SSL)设置EGD socket路径 
18     --tcp-nodelay                              # 使用TCP\_NODELAY选项 
19-e   --referer                                  # 来源网址 
20-E   --cert                                     # 客户端证书文件和密码 (SSL)
21     --cert-type                                # 证书文件类型 (DER/PEM/ENG) (SSL)
22     --key                                      # 私钥文件名 (SSL)
23     --key-type                                 # 私钥文件类型 (DER/PEM/ENG) (SSL)
24     --pass                                     # 私钥密码 (SSL)
25     --engine                                   # 加密引擎使用 (SSL). "--engine list" for list 
26     --cacert                                   # CA证书 (SSL)
27     --capath                                   # CA目录 (made using c\_rehash) to verify peer against (SSL)
28     --ciphers                                  # SSL密码 
29     --compressed                               # 要求返回是压缩的形势 (using deflate or gzip)
30     --connect-timeout                          # 设置最大请求时间 
31     --create-dirs                              # 建立本地目录的目录层次结构 
32     --crlf                                     # 上传是把LF转变成CRLF 
33-f   --fail                                     # 连接失败时不显示http错误 
34     --ftp-create-dirs                          # 如果远程目录不存在,创建远程目录 
35     --ftp-method \[multicwd/nocwd/singlecwd]   # 控制CWD的使用 
36     --ftp-pasv                                 # 使用 PASV/EPSV 代替端口 
37     --ftp-skip-pasv-ip                         # 使用PASV的时候,忽略该IP地址 
38     --ftp-ssl                                  # 尝试用 SSL/TLS 来进行ftp数据传输 
39     --ftp-ssl-reqd                             # 要求用 SSL/TLS 来进行ftp数据传输 
40-F   --form                                     # 模拟http表单提交数据 
41     --form-string                              # 模拟http表单提交数据 
42-g   --globoff                                  # 禁用网址序列和范围使用{}和\[] 
43-G   --get                                      # 以get的方式来发送数据 
44-H   --header                                   # 自定义头信息传递给服务器 
45     --ignore-content-length                    # 忽略的HTTP头信息的长度 
46-i   --include                                  # 输出时包括protocol头信息 
47-I   --head                                     # 只显示请求头信息 
48-j   --junk-session-cookies                     # 读取文件进忽略session cookie 
49     --interface                                # 使用指定网络接口/地址 
50     --krb4                                     # 使用指定安全级别的krb4 
51-k   --insecure                                 # 允许不使用证书到SSL站点 
52-K   --config                                   # 指定的配置文件读取 
53-l   --list-only                                # 列出ftp目录下的文件名称 
54     --limit-rate                               # 设置传输速度 
55     --local-port                               # 强制使用本地端口号 
56-m   --max-time                                 # 设置最大传输时间 
57     --max-redirs                               # 设置最大读取的目录数 
58     --max-filesize                             # 设置最大下载的文件总量 
59-M   --manual                                   # 显示全手动 
60-n   --netrc                                    # 从netrc文件中读取用户名和密码 
61     --netrc-optional                           # 使用 .netrc 或者 URL来覆盖-n 
62     --ntlm                                     # 使用 HTTP NTLM 身份验证 
63-N   --no-buffer                                # 禁用缓冲输出 
64-o   --output                                   # 把输出写到该文件中 
65-O   --remote-name                              # 把输出写到该文件中,保留远程文件的文件名 
66-p   --proxytunnel                              # 使用HTTP代理 
67     --proxy-anyauth                            # 选择任一代理身份验证方法 
68     --proxy-basic                              # 在代理上使用基本身份验证 
69     --proxy-digest                             # 在代理上使用数字身份验证 
70     --proxy-ntlm                               # 在代理上使用ntlm身份验证 
71-P   --ftp-port                                 # 使用端口地址,而不是使用PASV 
72-q                                              # 作为第一个参数,关闭 .curlrc 
73-Q   --quote                                    # 文件传输前,发送命令到服务器 
74-r   --range                                    # 检索来自HTTP/1.1或FTP服务器字节范围 
75--range-file                                    # 读取(SSL)的随机文件 
76-R   --remote-time                              # 在本地生成文件时,保留远程文件时间 
77     --retry                                    # 传输出现问题时,重试的次数 
78     --retry-delay                              # 传输出现问题时,设置重试间隔时间 
79     --retry-max-time                           # 传输出现问题时,设置最大重试时间 
80-s   --silent                                   # 静默模式。不输出任何东西 
81-S   --show-error                               # 显示错误 
82     --socks4                                   # 用socks4代理给定主机和端口 
83     --socks5                                   # 用socks5代理给定主机和端口 
84     --stderr                                   #   
85-t   --telnet-option                            # Telnet选项设置 
86     --trace                                    # 对指定文件进行debug 
87     --trace-ascii                              # Like --跟踪但没有hex输出 
88     --trace-time                               # 跟踪/详细输出时,添加时间戳 
89-T   --upload-file                              # 上传文件 
90     --url <url>                                # 要使用的 URL
91-u   --user                                     # 设置服务器的用户和密码 
92-U   --proxy-user                               # 设置代理用户名和密码 
93-w   --write-out \[format]                      # 什么输出完成后 
94-x   --proxy                                    # 在给定的端口上使用HTTP代理 
95-X   --request                                  # 指定什么命令 
96-y   --speed-time                               # 放弃限速所要的时间,默认为30 
97-Y   --speed-limit                              # 停止传输速度的限制,速度时间 

实例

文件下载

curl命令可以用来执行下载、发送各种HTTP请求,指定HTTP头部等操作。如果系统没有curl可以使用yum install curl安装,也可以下载安装。curl是将下载文件输出到stdout,将进度信息输出到stderr,不显示进度信息使用--silent选项。

1curl URL --silent

这条命令是将下载文件输出到终端,所有下载的数据都被写入到stdout。

使用选项-O将下载的数据写入到文件,必须使用文件的绝对地址:

1curl http://example.com/text.iso --silent -O

选项-o将下载数据写入到指定名称的文件中,并使用--progress显示进度条:

1curl http://example.com/test.iso -o filename.iso --progress
2######################################### 100.0%

不输出错误和进度信息

-s 参数将不输出错误和进度信息。

1curl -s https://www.example.com
2# 上面命令一旦发生错误,不会显示错误信息。不发生错误的话,会正常显示运行结果。

如果想让 curl 不产生任何输出,可以使用下面的命令。

1curl -s -o /dev/null https://example.com

断点续传

curl能够从特定的文件偏移处继续下载,它可以通过指定一个偏移量来下载部分文件:

1curl URL/File -C 偏移量
2
3#偏移量是以字节为单位的整数,如果让curl自动推断出正确的续传位置使用-C -:
4curl -C -URL

使用curl设置参照页字符串

参照页是位于HTTP头部中的一个字符串,用来表示用户是从哪个页面到达当前页面的,如果用户点击网页A中的某个连接,那么用户就会跳转到B网页,网页B头部的参照页字符串就包含网页A的URL。

使用 --referer 选项指定参照页字符串:

1curl --referer http://www.example.com http://example.com

用curl设置用户代理字符串

有些网站访问会提示只能使用IE浏览器来访问,这是因为这些网站设置了检查用户代理,可以使用curl把用户代理设置为IE,这样就可以访问了。使用 --user-agent 或者 -A 选项:

1curl URL --user-agent "Mozilla/5.0"
2curl URL -A "Mozilla/5.0"

其他HTTP头部信息也可以使用curl来发送,使用-H"头部信息" 传递多个头部信息,例如:

1curl -H "Host:example.com" -H "accept-language:zh-cn" URL

curl的带宽控制和下载配额

使用--limit-rate限制curl的下载速度:

1curl URL --limit-rate 50k

命令中用k(千字节)和m(兆字节)指定下载速度限制。

使用--max-filesize指定可下载的最大文件大小:

1curl URL --max-filesize bytes

如果文件大小超出限制,命令则返回一个非0退出码,如果命令正常则返回0。

1curl --limit-rate 200k https://example.com
2# 上面命令将带宽限制在每秒 200K 字节。

用curl进行认证

使用curl选项 -u 可以完成HTTP或者FTP的认证,可以指定密码,也可以不指定密码在后续操作中输入密码:

1curl -u user:pwd http://example.com
2curl -u user http://example.com

只打印响应头部信息

通过-I或者-head可以只打印出HTTP头部信息:

 1[root@localhost text]# curl -I http://example.com
 2HTTP/1.1 200 OK
 3Content-Encoding: gzip
 4Accept-Ranges: bytes
 5Age: 275552
 6Cache-Control: max-age=604800
 7Content-Type: text/html; charset=UTF-8
 8Date: Mon, 24 Apr 2023 14:39:36 GMT
 9Etag: "3147526947+gzip"
10Expires: Mon, 01 May 2023 14:39:36 GMT
11Last-Modified: Thu, 17 Oct 2019 07:18:26 GMT
12Server: ECS (sec/96EE)
13X-Cache: HIT
14Content-Length: 648

GET 请求

1curl "http://www.example.com"    # 如果这里的URL指向的是一个文件或者一幅图都可以直接下载到本地
2curl -i "http://www.example.com" # 显示全部信息
3curl -l "http://www.example.com" # 显示页面内容
4curl -v "http://www.example.com" # 显示get请求全过程解析

POST 请求

1$ curl -d "param1=value1&param2=value2" "http://www.example.com/login"
2
3$ curl -d'login=emma&password=123' -X POST https://example.com/login
4# 或者
5$ curl -d 'login=emma' -d 'password=123' -X POST  https://example.com/login

--data-urlencode 参数等同于 -d,发送 POST 请求的数据体,区别在于会自动将发送的数据进行 URL 编码。

1curl --data-urlencode 'comment=hello world' https://example.com/login
2# 上面代码中,发送的数据hello world之间有一个空格,需要进行 URL 编码。

发送本地文件中的文字

1curl -d '@data.txt' https://example.com/upload
2# 读取data.txt文件的内容,作为数据体向服务器发送。

JSON 格式的 POST 请求

1curl -l -H "Content-type: application/json" -X POST -d '{"phone":"13888888888","password":"test"}' http://example.com/apis/users.json

使用--cookie "COKKIES"选项来指定cookie,多个cookie使用分号分隔:

1curl http://example.com --cookie "user=root;pass=123456"

将cookie另存为一个文件,使用--cookie-jar选项:

1curl URL --cookie-jar cookie_file

-b 参数用来向服务器发送 Cookie。

1curl -b 'foo=bar' https://example.com
2# 上面命令会生成一个标头Cookie: foo=bar,向服务器发送一个名为foo、值为bar的 Cookie。
1curl -b 'foo1=bar' -b 'foo2=baz' https://example.com
2# 上面命令发送两个 Cookie。
3
4```shell
5curl -b cookies.txt https://www.example.com
6# 上面命令读取本地文件 cookies.txt,里面是服务器设置的 Cookie(参见-c参数),将其发送到服务器。
1curl -c cookies.txt https://www.example.com
2# 上面命令将服务器的 HTTP 回应所设置 Cookie 写入文本文件cookies.txt。

请求的来源

-e 参数用来设置 HTTP 的标头 Referer,表示请求的来源。

1curl -e 'https://example.com?q=example' https://www.example.com
2# 上面命令将Referer标头设为 https://example.com?q=example。

-H 参数可以通过直接添加标头 Referer,达到同样效果。

1curl -H 'Referer: https://example.com?q=example' https://www.example.com

上传二进制文件

-F 参数用来向服务器上传二进制文件。

1curl -F '[email protected]' https://example.com/profile
2# 上面命令会给 HTTP 请求加上标头 Content-Type: multipart/form-data ,然后将文件photo.png作为file字段上传。

-F 参数可以指定 MIME 类型。

1curl -F '[email protected];type=image/png' https://example.com/profile
2# 上面命令指定 MIME 类型为image/png,否则 curl 会把 MIME 类型设为 application/octet-stream。

-F 参数也可以指定文件名。

1curl -F '[email protected];filename=me.png' https://example.com/profile
2# 上面命令中,原始文件名为photo.png,但是服务器接收到的文件名为me.png。

设置请求头

-H 参数添加 HTTP 请求的标头。

1curl -H 'Accept-Language: en-US' https://example.com
2# 上面命令添加 HTTP 标头 Accept-Language: en-US。
1curl -H 'Accept-Language: en-US' -H 'Secret-Message: xyzzy' https://example.com
2# 上面命令添加两个 HTTP 标头。
1curl -d '{"login": "emma", "pass": "123"}' -H 'Content-Type: application/json' https://example.com/login
2# 上面命令添加 HTTP 请求的标头是 Content-Type: application/json,然后用 -d 参数发送 JSON 数据。

跳过 SSL 检测

1curl -k https://www.example.com
2# 上面命令不会检查服务器的 SSL 证书是否正确。

请求跟随服务器的重定向

-L 参数会让 HTTP 请求跟随服务器的重定向。curl 默认不跟随重定向。

1curl -L -d 'tweet=hi' https://api.example.com/tweet

值得注意的是,这种重定向方式不适用于在返回的 HTML 中的重定向,比如这种是不被 curl 识别的重定向(这部分内容由 curl -v -L <url> 生成)

 1* Connected to example.com (*.*.*.*) port 80 (#0)
 2> GET / HTTP/1.1
 3> Host: example.com
 4> User-Agent: curl/8.0.1
 5> Accept: */*
 6>
 7< HTTP/1.1 200 OK
 8....
 9< Content-Type: text/html
10<
11<html>
12<meta http-equiv="refresh" content="0;url=http://www.example.com/">
13</html>

调试参数

-v 参数输出通信的整个过程,用于调试。

1curl -v https://www.example.com
2# --trace参数也可以用于调试,还会输出原始的二进制数据。
1curl --trace - https://www.example.com

获取本机外网 IP

1curl ipecho.net/plain

使用 curl 测试网站加载速度

命令有一个鲜为人知的选项,-w,该选项在请求结束之后打印本次请求的统计数据到标准输出。

首先,我们定义控制打印行为的格式化字符串。新建文本文件 fmt.txt,并填入下面的内容:

1\n
2Response Time for: %{url_effective}\n\n
3DNS Lookup Time:\t\t%{time_namelookup}s\n
4Redirection Time:\t\t%{time_redirect}s\n
5Connection Time:\t\t%{time_connect}s\n
6App Connection Time:\t\t%{time_appconnect}s\n
7Pre-transfer Time:\t\t%{time_pretransfer}s\n
8Start-transfer Time:\t\t%{time_starttransfer}s\n\n
9Total Time:\t\t\t%{time_total}s\n

curl 提供了很多置换变量,可以在格式化字符串中通过 %{var} 的形式使用。完整的变量列表可以在 curlmanpage 中查看。简单介绍一下我们使用的这几个变量:

  • url_effective: 执行完地址重定向之后的最终 URL;
  • time_namelookup: 从请求开始至完成名称解析所花的时间,单位为秒,下同;
  • time_redirect: 执行所有重定向所花的时间;
  • time_connect: 从请求开始至建立 TCP 连接所花的时间;
  • time_appconnect: 从请求开始至完成 SSL/SSH 握手所花的时间;
  • time_pretransfer: 从请求开始至服务器准备传送文件所花的时间,包含了传送协商时间;
  • time_starttransfer: 从请求开始至服务器准备传送第一个字节所花的时间;
  • time_total: 完整耗时。

然后执行请求,通过 @filename 指定保存了格式化字符串的文件:

1curl -L -s -w @fmt.txt -o /dev/null http://www.example.com

输出:

 1Response Time for: http://www.google.co.jp/?gfe_rd=cr&dcr=0&ei=cjIaWpTkHeiQ8QfnxYzoBA
 2
 3DNS Lookup Time:        0.000038s
 4Redirection Time:       0.207271s
 5Connection Time:        0.000039s
 6App Connection Time:    0.000039s
 7Pre-transfer Time:      0.000067s
 8Start-transfer Time:    0.260115s
 9
10Total Time:             0.467691s

要求返回是压缩的状态

 1$ curl --compressed -o- -L https://yarnpkg.com/install.sh | bash
 2  % Total    % Received % Xferd  Average Speed   Time    Time     Time  Current
 3                                 Dload  Upload   Total   Spent    Left  Speed
 4100    54  100    54    0     0     42      0  0:00:01  0:00:01 --:--:--    42
 5100  2341  100  2341    0     0   1202      0  0:00:01  0:00:01 --:--:--  9289
 6Installing Yarn!
 7> Downloading tarball...
 8
 9[1/2]: https://yarnpkg.com/latest.tar.gz --> /var/folders/j7/3xly5sk567s65ny5dnr__3b80000gn/T/yarn.tar.gz.XXXXXXXXXX.9hJsBsrA
10  % Total    % Received % Xferd  Average Speed   Time    Time     Time  Current
11                                 Dload  Upload   Total   Spent    Left  Speed
12100    57  100    57    0     0     72      0 --:--:-- --:--:-- --:--:--    72
13100    93  100    93    0     0     63      0  0:00:01  0:00:01 --:--:--    63
14100   643  100   643    0     0    248      0  0:00:02  0:00:02 --:--:--   707
15100 1215k  100 1215k    0     0   153k      0  0:00:07  0:00:07 --:--:--  305k
16
17[2/2]: https://yarnpkg.com/latest.tar.gz.asc --> /var/folders/j7/3xly5sk567s65ny5dnr__3b80000gn/T/yarn.tar.gz.XXXXXXXXXX.9hJsBsrA.asc
18100    61  100    61    0     0    356      0 --:--:-- --:--:-- --:--:--   356
19100    97  100    97    0     0    325      0 --:--:-- --:--:-- --:--:--   325
20100   647  100   647    0     0   1283      0 --:--:-- --:--:-- --:--:--  1283
21100   832  100   832    0     0   1107      0 --:--:-- --:--:-- --:--:--  812k

来源:https://github.com/jaywcjlove/linux-command

最后修改于: Wednesday, January 31, 2024
欢迎关注微信公众号,留言交流。

相关文章:

翻译: