代理ip前嗅教你大数据——什么是代理IP?

日期: 2021-02-04 09:45

前嗅教你大数据——什么是代理IP?

作者 | 前嗅 来源 | 前嗅大数据(www.forenose.com)

在数据采集过程中我们经常需要用到代理IP。

最近很多爬虫初学者问我:什么是代理IP?

前嗅教你大数据——什么是代理IP?

大家都知道:IP是上网需要唯一的身份地址,身份凭证。


代理IP就是我们上网过程中的一个中间平台,是由本机电脑先访问代理IP,之后再由代理IP访问目标网站页面,所以在这个页面的访问记录里留下的是就是代理IP的地址,而不是本机IP。


今天,前嗅将为大家介绍一下代理IP的分类、动态代理IP和静态代理IP。



-01-

代理IP的分类?

代理IP根据协议可分为http协议代理、https协议代理和socket5代理。


1. http协议代理

http协议代理仅仅用于转发,其原理是由本机联系代理服务器,服务器请求,访问目标网站服务器解析数据,最后返回数据到本机。


2. https协议代理

https协议代理是加密协议代理,先由本机发送请求到代理服务器,代理服务器核实请求中的用户名密码,确认无误后,连接目标网站的服务器,返回传输回来的加密数据到本机。


3. Socket5代理

Socket5代理也是一种代理协议,与https类似。
其相同点在于:访问https协议网站时返回的也是加密后的数据,访问http协议网站时返回的是不加密数据。
其区别在于socket发送的是标明请求类型及含义的二进制代码。Socket5代理更底层,即可访问http协议网站,又可访问https协议网站。


什么是VPN?

VPN一般指虚拟专用网络。

虚拟专用网络功能是:在公用网络上建立专用网络,进行加密通讯。在企业网络中有广泛应用。


VPN网关通过对数据包的加密和数据包目标地址的转换实现远程访问。VPN有多种分类方式,主要是按协议进行分类。VPN可通过服务器、硬件、软件等多种方式实现。


VPN与代理IP有什么区别?

VPN主要用于从外网访问企业、公司的内部网络,原理是先登录到VPN防火墙、服务器,得到权限,在进入内网。这个过程,用户一直是以自己的身份进行的。


代理IP是一种代理,也就是先所有的交互数据都先经过另一台服务器(代理IP服务商),这个过程中用户访问其他网络是都是使用的代理服务提供者的身份。



-02-

什么是动态代理?


动态代理是指:访问目标服务器的代理IP是不断变化的,或短时间内更换访问的代理IP。


市场上的动态代理IP一般可分为两种:短效代理和隧道代理。


1.短效代理

代理IP服务商一般会有一个IP库,每个代理IP存活期1-2分钟、3分钟、5分钟、10分钟等。适用于需要代理IP数量大但时效短的业务场景。从衡量方式来分类,一般可分为按量购买和按时间购买两种。有些服务商只按量售卖,有些商家既按量售卖,也按时间售卖。


PS:有些商家称为动态代理IP,动态短效代理IP、短效IP、动态IP、共享IP、静态短效代理、HTTP代理、HTTPS代理等。


2.隧道代理

隧道代理IP主要有动态短效和动态转发两种。


①隧道代理-动态短效,隧道代理(动态短效)每个IP代理的使用时长一般为1分钟到5分钟(不同服务商定义短效时长不同),到期后隧道将自动切换到另一个IP。


②隧道代理-动态转发,隧道代理(动态转发)无须切换 代理IP,每一个请求一个随机IP。隧道代理有并发请求限制,一般默认每秒允许 5 个请求。



-03-

什么是静态代理?

静态代理是指:访问目标服务器的代理IP在一天及以上的,一段时间内IP不变且持续有效的代理IP。


静态代理IP是基于高性能主机构建的高品质代理服务器,可用率超过99%,具有极快的速度和极高的稳定性。


代理IP使用时长自由控制,灵活多变,可长期使用,亦可最低1小时切换一次,适用于切换IP频率低时效长的业务场景。


PS:有些商家称为长效代理IP、长效静态代理IP、静态IP、静态代理、静态长效代理、静态短效代理、长效IP等。


到这里,相信大家对代理IP有了一个初步的了解,前嗅将在下一期为大家全面分析一市场上的代理IP。请大家敬请期待!



前嗅教你大数据——什么是代理IP?

欢迎添加前嗅

作者简介

前嗅,企业级大数据供应商,多年来致力于大数据技术研究与开发,自主研发了一套数据采集、挖掘、清洗、分析及可视化的数据处理系统,拥有上万家企业用户。热衷于为大家解决各种数据问题,服务号“前嗅”,微博“@前嗅大数据”,欢迎

相关新闻