代理认证是爬虫的利器,现在稍微有一点规模的网站,反爬虫程序多少都会有一个点,只要程序请求的速度稍微快了一点,本地ip 就会被干掉,httpclient 作为下载网页资源的中干力量,多数爬虫都是使用httpclient 来下载,本章我们就来看一下httpclient的代理机制。
HTTP 认证
任何用户认证的过程,都需要一系列的凭证来确定用户的身份。最简单的用户凭证可以是用户名和密码这种形式。UsernamePasswordCredentials这个类可以用来表示这种情况,这种凭据包含明文的用户名和密码。这个类对于HTTP标准规范中定义的认证模式来说已经足够了。