推广 热搜: 公司  快速  中国  上海    未来  企业  政策  教师  系统 

squid代理与缓存(上)

   日期:2025-01-02     作者:caijiyuan    caijiyuan   评论:0    移动:http://fabua.ksxb.net/mobile/news/4894.html
核心提示:1.1 缓存服务器介绍 缓存服务器(英文意思cache server),即用来存储(介质为内存及硬盘)用户访问的网页,图片,文件等

1.1 缓存服务器介绍

  • 缓存服务器(英文意思cache server),即用来存储(介质为内存及硬盘)用户访问的网页,图片,文件等等信息的专用服务器。这种服务器不仅可以使用户可以最快的得到他们想要的信息,而且可以大大减少服务端网络传输的数据量。缓存服务器往往也是代理服务器。对于网站的用户来说,缓存服务器和代理是不可见的,即在用户看来所有的网站信息都来自其正在访问的网站,而实际上可能是缓存服务器在提供访问数据。
  • 目前国内互联网公司常用的缓存服务器有:squid,varnish(几乎绝迹),nginx,ats。
  • squid作为缓存和代理服务器的历史十分的悠久,如果有时间,可以测试下varnish,nginx,squid三者之间的性能对比.
  • 国内基本上90%以上的商业CDN公司,像国内的CDN基本都在用squid,像蓝汛,网宿,帝联,sina在用ats。
  • Squid官方:http://www.squid-cache.org/

1.2 Web缓存相关概念

1.2.1 cache命中

cache命中是在cache server 每次从它的缓存里满足客户端HTTP请求时发生。cache命中率,是所有客户端HTTP请求中命中的比例。Web缓存典型的cache命中率在30%到60%之间。另一个相似的度量单位叫做字节命中率,描绘了cache提供服务的数据容量(字节数),如何提升cache命中率

squid代理与缓存(上)

  • apache nginx 可以expries,cache-control缓存头
  • 动静分离,静态化,对静态走CDN
  • mysql cache让缓存靠前
  • 4XX,5XX之类错误页面,死链不缓存。
1.2.2 cache丢失

cache丢失在cache server不能从它的缓存里满足客户端HTTP请求时发生。cache丢失的原因有很多种


(1)当cache server第一次接收到对第一个新资源的请求时,就会产生一个cache丢失。如何解决第一次命中

预热或者预取。

  • 内部先请求访问。可以通过脚本实现(这是个思路但不靠谱)。
  • 后端生成数据之后,统一推到前端cache server。即预取,预热。

(2)存储空间满或者对象自身过期,cache server会清除这些缓存对象以释放空间给新对象。

  • 加大内存或者磁盘。
  • 过期时间设置的长一些。
  • 参数设置,缓存的参数设置大一些。最大缓存对象2M(热点缓存)。
  • 分资源缓存,1M,10M,100M(分拆服务器,acl 正则匹配抛给不同的pools)

(3)还有可能是客户访问的资源不可到达。原始服务器会指示cache server 怎样处理用户响应。例如,它会提示数据不能被缓存,或在有限的时间内才被重复使用等等

1.2.3 cache确认
  • 对于缓存来讲,数据的一致性是一个特别头疼的问题,特别是memcached。
  • cache确认保证cache server不对访问的用户返回过期的数据。在重复使用缓存对象时,cache server需要经常从原始服务器确认它。假如服务器指示squid的拷贝仍然有效,数据就发送出去。否则,squid更新它的缓存拷贝,并且转发给客户。
  • 当用户更新了数据到数据库或者存储服务器的时候,可以从业务角度主动调用接口清除该对象缓存的指令。CDN 5-15分钟。
  • 图片放到CDN了需要更新吗?不需要更新。图片修改算更新,这样的业务就要推送。
  • 网站改版:再CDN上推送JS,css(改名)

1.3 squid服务介绍

  • Squid是一个高性能的代理缓存服务器,Squid支持FTP,gopher和HTTP协议。和一般的代理缓存软件不同,Squid用一个单独的,非模块化的,I/O驱动的进程来处理所有的客户端请求。
  • Squid将数据元缓存在内存和硬盘中,同时也缓存DNS查询的结果。Squid支持SSL,支持访问控制。由于使用了ICP(轻量Internet缓存协议),Squid能够实现层叠的代理阵列,从而最大限度的节约带宽。

Squid Cache(简称Squid)是一个流行的代理服务武器和Web缓存服务器软件。Squid服务有相当多的用途

  • 用于放置在Web服务器的前面,缓存网站Web服务器的相关数据,这样用户请求缓存服务器就可以直接返回数据给用户了,从而提升了用户的访问网站体验,从另一方面也减轻了Web服务器,数据库服务器,图片文件存储服务器等业务服务器的压力。这种应用被称之为反向代理服务。
  • 用于放置在企业内部关键出网位置或者某些共享网络的前端,缓存内部上网用户的数据,域名系统和其他网络搜索数据等,这样用户上网请求的数据,就可以由缓存服务器返回给内部用户,而不需要上网了,从而使得内部用户上网更快,更安全,也会大大节约公司的带宽。这种应用被称之为正向代理服务(普通代理或者透明代理)。
  • 通过放在网络的关键位置过滤网络流量和访问数据,提升整个网络安全。例如:可以监控及限制内部企业员工的上网行为,可以和iptables配合作为办公网的网关。
  • 用作局域网通过代理上网,只要是一台可以上网的机器就可以,位置随便,让所有的用户的浏览器设置这个服务器代理上网即可。

Squid代理服务器主要用于类Unix系统中运行,其发展历史相当悠久,功能也相当完善。除了对HTTP支持的很好外,对于FTP与HTTPS的支持也相当好,在3.0测试版中也支持了IPv6,Squid的主页在http://www.squid-cache.org。目前业界主流CDN都是基于Squid进行二次开发作为cache缓存服务器的。

1.3.1 传统代理服务原理

传统的代理服务器就是前面我们所说的通过浏览器设置代理的方法

windows如何设置代理

1.3.2 透明代理服务原理
  • 所谓透明代理,是相对于代理服务器而言,客户端不需要做任何和代理服务器相关的设置和操作,对用户而言,感觉不到代理服务器的存在,所以称之为透明代理。即把代理服务器部署在核心的上网出口,当用户上网浏览页面时,会交给代理服务器向外请求,如果结合iptables可以实现代理+网关+内容过滤+流量安全控制等完整的上网解决方案。
  • 透明代理流程说明:用户A发送一个访问请求到防火墙,由防火墙将该用户的访问请求转发到SQUID,SQUID在先检查自身缓存中有无该用户请求的访问内容,如果没有,则请求远端目的服务器,获取该用户的访问内容,在返回给用户的同时,在自身缓存保留一份记录以备下次调用;当用户B发送一个和用户A相同的访问请求时,由防火墙将转发该用户请求到SQUID,SQUID检查自身缓存发现有同样内容后,直接将该内容返回给用户。
1.3.3 反向代理服务原理
  • 普通代理方式是代理内部网络用户访问internet上服务器的连接请求,客户端必须指定代理服务器,并将本来要直接发送到internet上服务器的连接请求发送给代理服务器处理。反向代理(Reverse Proxy)方式是指以代理服务器来接受internet上的连接请求,然后将请求转发给内部网络上的服务器,并将从内部服务器上得到的结果返回给internet上请求连接的客户端,此时代理服务器对外就表现为一个服务器。
  • 反向代理流程说明:SQUID作为反向代理服务器,通常工作在一个服务器集群的前端,在用户端看来,SQUID服务器就是他说要访问的服务器,而实际意义上SQUID只是接受用户的请求,同时将用过户请求转发给内网真正的WEB服务器,如果SQUID本身有用户要访问的内容,则SQUID直接将数据返回给用户,起到了缓存数据的作用,减少了后端服务的压力。
1.3.4 三种代理服务器对比

:网站什么时候就需要用squid(CDN)了

静态抗不住了,想节省带宽,节省成本,想提高访问速度

  • 节省带宽及服务器成本。
  • 提升用户体验。
  • 源站抗不住了。
1.3.5 如何选择squid服务的版本

目前主流使用的Squid缓存服务,大公司,2.7是最多的,基本上90%以上的商业CDN公司,例如国内的CDN,蓝汛,网宿,帝联都在用squid2.7,squid3.0使用C++重写后,性能上和Squid 2.6和2.7还是有些距离的。使用的人并不是很多,性能稳定性等还有必要在等等看。

2.1 操作系统环境

Squid可以运行在几乎所有的常见Unix及Linux系统上,也可以在Microsoft Windows上运行。尽管squid的Windows支持在不断改进,但在Unix及Linux系统上运行Squid依然是更简单,安全,更有效率,本章我们就使用Centos6.4 x86_64来运行Squid。

2.2 服务器硬件环境

2.2.1 第一重要资源:内存

squid对硬件的要求最主要的是内存资源。内存短缺会严重影响性能。因为所有的对象都会尽可能的被缓存到内存中,这样才能更快的提升用户的响应及返回数据。

2.2.2 第二重要资源:磁盘

磁盘空间也是另一个squid能够高效运行的重要因素。更多的磁盘空间意味着更多的缓存目标和更高的命中率。快速的磁盘介质也是必要的。例如:用ssd,sas替代sata磁盘,除了使用过raid外,可以指定多个磁盘路径缓存。

2.2.3 其他:磁盘与内存的关联

因为squid对每个缓存响应使用少数内存,因此在磁盘空间和内存要求之间有一定联系。基本规则是,每G磁盘空间需要32M内存。这样,512M内存的系统,能支持16G的磁盘缓存。你的情况当然会不同。内存需求依赖于如下事实:缓存目标大小,CPU体系(32位或64位),同时在线的用户数量,和你使用的特殊功能。

2.3 虚拟服务器硬件环境

名称环境内存1G硬盘20GVM1-2个,其中一个部署缓存服务器,一个部署web服务器做测试用系统Centos7.6 x86_64

2.4 虚拟服务器实施部署前主机规划列表

| 名称 | IP | 用途 |
| :--: | :--: |
| Squid-Server | 192.168.200.13 | Squid |

3.1 squid下载与解压

3.1.1 下载squid软件
3.1.2 解开源代码包

3.2 squid编译前关键内核参数调整

3.2.1 调整文件描述符

Squid在高负载下,需要大量的内核资源。特别的,你需要给你的系统配置比正常情况更高的文件描述符和缓存,最好在开始编译squid之前来增加文件描述符的大小(在系统安装时我们已经讲解过)。squid和内核通过数据结构来交换信息,数据结构的大小不能超过设置的文件描述符的限制。squid在运行时检查这些设置,并且使用最安全的(最小的)值。

1)文件描述符

  • 文件描述符是一个简单的整数,用以标明每一个被进程所打开的文件和socket。第一个打开的文件是0,第二个是1,依此类推。Unix操作系统通常给每个进程能打开的文件数量强加一个限制。更甚的是,unix通常有一个系统级的限制(1024).因为squid的工作方式,文件描述符的限制可能会极大的影响性能。当squid用完所有的文件描述符后,它不能接收用户新的连接。也就是说,用完文件描述符导致拒绝服务。直到一部分当前请求完成,相应的文件和socket被关闭,squid不能接收新请求。当squid发现文件描述符短缺时,它会发布警告。
  • 在运行https://blog.csdn.net/weixin_43279138/article/details/configure之前,检查你的系统的文件描述符限制是否合适,能给你避免一些麻烦。大多数情况下,1024个文件描述符足够了。非常忙的cache可能需要4096或更多。在配置文件描述符限制时,我推荐设置系统级限制的数量为每个进程限制的2倍。

2)设置打开的最大文件描述符的数目

3.2.2 调整临时端口范围
  • 临时端口是TCP/IP栈分配给出去连接的本地端口。换句话说,当squid发起一条连接到另一台服务器,内核给本地socket分配一个端口号。这些本地端口号有特定的范围限制。
  • 例如,Centos默认是32768-61000.
  • 临时端口号的短缺对非常慢的代理服务器(例如每秒数百个连接)来说,会较大的影响性能。这是因为一些TCP连接在他们被关闭时进入TIME_WAIT状态。当连接进入TIME_WAIT状态时,临时端口号不能被重用。

调整临时端口范围方法

3.3 squid编译前查看帮助

官方:http://www.squid-cache.org/Versions/v3/3.5/cfgman/

进入解压后的squid目录

3.4 squid编译安装

3.5 squid目录文件结构介绍

在安装完后,将在squid的安装目录里(/usr/local/squid/)会看到下列目录和文件

文件名/目录名功能描述sbinsquid主从程序的目录,正常只能被root启动sbin/squidSquid的主程序binbin目录包含对所有用户可用的程序bin/RunCacheRunCache是一个shell脚本,你能用它来启动squid。假如squid死掉,该脚本自动重启它,除非它检测到经常的重启bin/RunAccelRunAccel与RunCache几乎一致,唯一不同是它增加了一个命令行参数,告诉squid在哪里侦听HTTP请求bin/squidclientsquidclient是个简单的HTTP客户端程序,你能用它来测试squid。它也有一些特殊功能,用以对运行的squid进程发起管理请求。libexeclibexec目录包含了辅助程序。有一些命令你不能正常的启动。然而,这些程序通常被其他程序启动libexec/unlinkdunlinkd是一个辅助程序,它从cache目录里删除文件libexec/cachemgr.cgicachemgr.cgi是Squid管理功能的CGI接口。为了使用它,你需要拷贝该程序到你的WEB服务器的cgi-bin目录libexec/diskd(optional)假如你指定了--enable-storeio=diskd,你才能看到它libexec/pinger(optional)假如你指定了--enable-icmp,你才能看到它etcetc目录包含squid的配置文件etc/squid.conf这是squid的主配置文件varvar目录包含了不是很重要的和经常变化的文件。这些文件不必正常的备份他们var/logsvar/logs目录是squid不同日志文件的默认位置。当你第一次安装squid时,它是空的。一旦squid开始运行,你能在这里看到名字为access.log,cache.log和store.log这样的文件var/cache假如你不在squid.conf文件里指定,这是默认的缓存目录(cache_dir)

参考:http://home.arcor.de/mailerstar/jeff/squid/chap03.html

4.1 squid.conf语法

  • Squid的配置文件相对规范。它与其他许多unix程序相似。每行以配置指令开始,后面跟着数字值或关键字。在读取配置文件时,squid忽略空行和注释掉的行(以#开始)。
  • 默认的squid.conf内容有相当多的内容,如下

4.2 squid服务的用户

  • 几乎所有的unix进程和文件拥有文件的组和属主的属性,你必须创建一个用户和组给squid服务,该用户和组的组合,必须对大部分squid相关的文件和目录有读和写的权限,所以需要创建“squid”的用户和组,这避免了某人利用squid来读取系统中的其他文件。
  • 运行squid必须以root身份运行,设置配置文件squid.conf中。cache_effective_user为squid来运行,这个用户和组的名称理论上可以任意起。
4.2.1 创建squid用户和组,禁止其登陆
4.2.2 编辑配置文件squid.conf

4.3 squid端口号

  • http_port指令告诉squid在哪个端口侦听HTTP请求。默认端口是3128
  • 假如你计划将squid作为web服务加速器运行,可以将该端口设置为80.
    可以使用附加的http_port行,来指示squid侦听在多个端口上,例如,来自某个部门的浏览器发送请求到3128,然而另一个部门使用80端口。简单的将两个端口号列举出来
http_port3128http_port8080

也可以使用http_port指令来使squid侦听在指定的接口地址上,当squid作为防火墙运行时,它有两个网络接口:一个内部的和一个外部的,为了避免来自外部的http请求,使squid仅仅侦听在内部接口上,简单的将IP地址放在端口号的前面

4.4 squid日志文件

  • squid默认的日志目录是squid安装位置下的logs目录。例如,假如你在https://blog.csdn.net/weixin_43279138/article/details/configure中没有使用--prefix=选项,那么默认的日志文件路径是/usr/local/squid/var/logs,必须确认日志文件所存放的磁盘位置空间足够。在squid写日志时如果接受到错误,它会退出和重启。该行为的主要理由应引起你的注意,squid想确认你不会丢失任何重要的日志信息,特别是你的系统被滥用或者被攻击时。
  • squid有三个主要的日志文件
4.4.1 cache.log日志文件

cache.log包含多种消息,例如Squid的配置信息,性能警告,以及严重错误。如下是cache.log的输出样本:。


刚开始运行squid时,需要密切关注该文件。假如squid拒绝运行,原因也许会出现在cache.log文件的结尾处。在正常条件下,该文件不会变得很大。假如你以-s选项来运行squid,重要的cache.log信息也可被送到你的rsyslog进程。通过使用cache_log指令,你以修改配置文件squid.conf来改变该日志文件的路径。

4.4.2 转发cache.log消息到系统日志

为了让squid发送cache.log消息的拷贝到系统日志,请使用-s命令行选项。仅仅在debug级别0和1的消息会被转发。

4.4.3 access.log日志文件
  • Squid把关于HTTP事务的关键信息存放在access.log里。该文件是基于行的,也就是说每行对应一个客户端请求。squid记录客户端IP(或主机名),请求URL,响应size等其他信息。
  • Squid在access.log里记录所有HTTP访问,除了那些在还没有发送数据前就断开的连接。Squid也记录所有的ICP(非HTCP)事务,除非你使用log_icp_queries指令关闭了这个功能。
  • 默认的access.log格式包含了10个域。如下是日志样本,长行分割并且缩进排版。
  • access.log文件记录了对squid发起的每个客户请求。每行平均约150个字节,也就是说,在接受一百万条客户请求后,它的体积约是150M。可以使用cache_access_log指令改变该日志文件的路径
  • 如果不想squid记录客户端请求日志,修改日志文件的路径为/dev/null即可。
4.4.4 store.log日志文件
  • store.log记录Squid关于存储或删除cache目标的决定。对每个存在cache里的目标每个不可cache的目标,以及每个被轮换策略删除的目标,Squid都会创建相应的日志条目。该日志文件内容既包含了内存cache,又包含了磁盘cache。
  • store.log文件对大多数cache管理员来说并非很有用,但是我们可以通过这个日志来解析客户端访问的数据是否被缓存,它包含了进入和离开缓存的每个目标的记录。使用cache_store_log指令来改变它的位置
  • 通过指定路径为none,你能轻易的完全禁止store.log日志
  • Squid的日志文件增加没有限制...为了保证日志文件大小合理,应创建计划任务来规律的重命名和打包日志。squid有内建的日志回滚功能,也可以避免单个日志过于庞大。

4.5 squid的访问控制

ACL元素是Squid的访问控制基础。这里会告诉你如何指定包括IP地址,端口号,主机名,和URL匹配等变量。每个ACL元素有个名字,在编写访问控制规则时需要引用他们。

基本的ACL元素语法如下

在多数情况下,你能对一个ACL元素列举多个值。你也可以有多个ACL行。例如,下列两行配置是等价的

上面一行与下面三行等价

4.5.1 IP地址的acl定义

使用对象:src,dst,myip

  • squid在ACL里指定IP地址时,拥有强有力的语法。你能以子网,地址范围形式编写地址。
  • squid支持标准IP地址写法(由“.”连接的4个小于256的数字)。
  • 另外,假如你忽略掩码,squid会自动计算相应的掩码。例如,下组是相等的

将ACl主机名转换到IP地址的过程会延缓squid的启动。除非绝对必要,请避免使用主机名。

4.5.2 域名的acl定义

使用对象:srcdomain,dstdomain和cache_host_domain指令

域名简单的就是DNS名字或区域。例如,下面是有效的域名

  • 域名ACL有点深奥,因为相对于匹配域名和子域有点微妙的差别。当ACL域名以“.”开头,squid将它作为通配符,它匹配在该域的任何主机名,甚至域名自身。相反的,如果ACL域名不以“.”开头,squid使用精确的字符串比较,主机名同样必须被严格检查。
  • 域名匹配可能让人迷惑,所以继续往下看,以便你可以真正理解它。如下是两个稍微不同的ACL。
  • 用户对http://www.foo.com/的请求匹配ACL B,但不匹配A。ACL A要求严格的字符串匹配,然而ACL B 里领头的点就像通配符。
  • 另外,用户对http://foo.com/的请求同时匹配A和B。尽管在URL主机名里的foo.com前面没有字符,但ACL B里领头的点仍然导致一个匹配。
4.5.3 正则表达式的acl定义

使用对象:srcdom_regex,dstdom_regex,url_regex,urlpath_regex,browser,referer_regex,ident_regex,proxy_auth_regex,req_mime_type,rep_mime_type

大量的ACL使用正则表达式来匹配字符串。对squid来说,最常使用的正则表达式功能用以匹配字符串的开头或结尾。例如,^字符是特殊元字符,它匹配行或字符串的开头


  • ^http://
    该正则表达式匹配任意以http://开头的URL。$也是特殊的元字符,因为它匹配行或字符串的结尾
  • :.jpg$
    实际上,该示例也有些错误,因为.字符也是特殊元字符。它是匹配任意单个字符的通配符。我们实际想要的应该是,见下行
  • .jpg-反斜杠对这个“.”进行转义。该正则表达式匹配以.jpg结尾的任意字符串。假如你使用或字符,正则表达式的行为就象标准子串搜索。他们匹配在字符串里任何位置出现的单词或词组.
    对所有的squid正则表达式类,你可以使用大小写敏感的选项。匹配是默认大小写敏感的。为了大小写不敏感,在ACL类型后面使用-i选项。例如
4.5.4 TCP端口号的acl定义

使用对象:port,myport

该类型是相对的。值是个别的端口号或端口范围。回想一下TCP端口号是16位值,这样它的值必须大于0或小于65536。如下是一些示例

参考:http://home.arcor.de/jeffpang/squid/chap06.html

4.5.5 method的acl定义

method ACL 指HTTP请求方法。GET是典型的最常用方法,接下来是POST,PUT,和其他。下例说明如何使用method ACL

注意:CONNECT方法非常特殊。它是用于通过HTTP代理来封装某种请求的方法。在处理CONNECT方法和远程服务器的端口号时应特别谨慎。就像前面章节讲过的一样,你不希望squid连接到某些远程服务。你该限制CONNECT方法仅仅能连接到HTTPS/SSL或NNTPS端口(443或563).默认的squid.conf这样做

PURGE 是另一个特殊的请求方法。它是Squid的专有方法,没有在任何RFC里定义。它让管理员能强制删除缓存对象。既然该方法有些危险,squid默认拒绝PURGE请求,除非你定义了ACL引用该方法。否则,任何能访问cache者也许能够删除任意缓存对象。在这里,我建议仅仅允许来自localhost的PURGE。

4.5.6 proto的acl定义

该类型指URI访问(或传输)协议。如下是有效值:http,https(same as HTTP/TLS),ftp,gopher,urn,whois和cache_object。也就是说,这些是被squid支持的URL机制名字。例如,假如你想拒绝所有的FTP请求,你可使用下列指令

cache_object机制是squid的特性。它用于访问squid的缓存管理接口,不幸的是,它并非好名字,可能会被改变。默认的squid.conf文件有许多行限制缓存管理访问

4.5.7 url_regex的acl定义

url_regex ACL用于匹配请求URL的任何部分,包括传输协议和原始服务器主机名。例如,如下ACL匹配从FTP服务器的MP3文件请求

4.5.8 urlpath_regex的acl定义

urlpath_regex与url_regex非常相似,不过传输协议和主机名不包含在匹配条件里。这让某些类型的检测非常容易。例如,假设你必须拒绝URL里的"sex",但仍允许在主机名里含有"sex"的请求,那么这样做

另一个例子,假如你想特殊处理cgi-bin请求,你能这样捕获它们

当然,CGI程序并非总在/cgi-bin/目录下,这样你应该编写其他的ACL来捕获它们。

4.5.9 更多acl定义见squid配置文件

(1)限制同一IP客户端的最大连接数

(2)防止天涯盗链,转嫁给百度

(3)防止被人利用为HTTP代理,设置允许访问的IP地址

(4)防止百度机器人爬死服务器

(5)允许本地管理

提示
更多acl定义及用法请见acl配置文件401行到603行

4.6 Squid如何匹配访问控制元素

理解squid如何搜索ACL元素去匹配是很重要的。当ACL元素有多个值时,任何单个值能导致匹配。也就是说,squid在检查ACL元素值时使用OR逻辑。当squid找到第一个值匹配时,它停止搜索。这意味着把最可能匹配的值放在列表开头处,能减少延时。


-重点强调

  • squid在搜索ACL元素时使用的"或"逻辑。在acl里的任何单值都可以导致匹配。
  • 而应用访问规则恰好相反。对http_access和其他规则设置,squid使用"与"逻辑。

squid默认的配置文件拒绝每一个客户请求。在任何人能使用代理之前,你必须在squid.conf文件里加入附加的访问控制规则。最简单的方法就是定义一个针对客户IP地址的ACL和一个访问规则,告诉squid允许来自这些地址的HTTP请求。squid有许多不同的ACL类型。src类型匹配客户IP地址,squid会针对客户HTTP请求检查http_access规则。这样,你就需要增加两行

这两行需要放在正确的位置。http_access的顺序非常重要,但是acl行的顺序不必介意。squid默认的配置文件包含了一些重要的访问控制,最好不要改变或删除它们,除非你完全理解他们的意义。在你第一次编辑squid.conf文件时,请看如下注释

在该注释之后,以及"http_access deny all"之前插入你自己的规则,即MyNetwork的定义,如下是

4.7 squid可见主机名

-如果不设置可见主机名,squid可能会报错无法运行。

  • 设置主机名有如下好处
    (1)主机名出现在squid的错误消息里,这帮助用户验证潜在问题的源头。
    (2)主机名出现在squid转发的cache单元的HTTP Via头里。当请求到达原始主机时,Via头包含了在传输过程中涉及的代理列表。squid也使用Via头来检测转发环路。
  • 通过修改squid配置文件squid.conf中visible_hostname字段,可修改可见主机名

4.8 squid管理联系信息

设置cache_mgr指令作为对用户的帮助,它是一个email地址,假如故障发生,用户能写信给管理员来通知管理员,cache_mgr地址默认出现在squid的错误消息里,修改配置文件squid.conf中cache_mgr字段。

4.9 squid最终的配置文件

根据以上的设置之后,squid.conf的内容如下

5.1 Squid主程序命令行选项

在运行squid前,需要了解squid主程序命令行选项。执行如下命令可以获得系统帮助

5.2 检查配置文件语法

5.3 初始化cache目录

在运行squid之前,或者增加了新的cache_dir,你必须初始化cache,命令为:squid -z

5.3.1 设置环境变量,或者做命令的软连接
5.3.2 初始化cache

5.4 光盘安装一些必须的工具

5.5 在终端窗口里测试启动squid

初始化cache目录后,就可以在终端窗口里运行squid,将日志记录到标准日子里,就可以轻易的定位任何错误或问题,并且确认squid是否成功启动.

一旦启动成功,就可用一些HTTP请求来测试squid;你的浏览器使用squid作为代理,然后打开某个web页面。假如squid工作正常,正常载入就像没用过squid一样。

5.6 进行squid代理测试

5.6.1 设置squid服务器为浏览器进行代理
5.6.2 重启浏览器,登陆一个网页,比如www.baidu.com
  • 到这里位置,我们就是想了squid的普通(传统)代理模式
  • 默认情况下,squid是普通代理模式

5.7 将squid作为服务进程运行

特别说明
-s 选项导致squid将重要的状态和警告信息写到syslogd,同样的消息被写进cache.log文件,忽略-s选项也是安全的。注意日志文件cache.log,无论squid以什么方式运行,cache.log总会记录squid的日志信息,有时候squid服务意外终止,通过这个文件也能查看到很重要的信息

5.8 开机自启动squid

通常squid在每次服务器重启后需要自动启动,有如下两种方法可以实现squid的自动启动

5.8.1 将启动命令追加入/etc/rc.local

最容易的方法是修改脚本,在每次系统启动时以root运行。使用该脚本来启动squid非常容易,增加如下行到里。

  • 当然你的安装位置可能不同,还有你可能要使用其他命令行选项。不要在这里使用-N选项(会打印很多调试日志,这在生产环境中检查日志是非常痛苦的)。
  • 如果没有使用cache_effective_user指令设置squid用户,你可以尝试使用su来让squid以非root用户运行
    /usr/bin/su -nobody -c '/usr/local/squid/sbin/squid -s' 这样也是可以的。
  • 但是设置cache_effective_user为root用户运行是绝对不允许的。
5.8.2 使用init.d和rc.d机制启动

(1) 编写squid启动脚本

(2) 添加squid开机自动启动服务

5.9 启动squid服务

启动squid服务方法有两种,一种是直接运行squid程序,另外一种是通过服务启动squid

5.10 停止squid

5.11 squid日志轮询

  • 加入squid的访问日志每天有上G,那么我们需要每天对squid的日志进行回滚,回滚的方法是如下
  • 一旦执行squid日志回滚,这个命令会把 都回滚
  • 日志回滚主要避免单个日志文件过大导致squid崩溃的问题,有些较老的系统版本文件大小有2GB限制,所以需要定期回滚一次,并且还可以节省磁盘空间。
  • 除非你在squid.conf里禁止,squid会写大量的日志文件。你必须周期性的滚动日志文件,以阻止他们变得太大。squid将大量的重要信息写入日志,假如写不进去了,squid会发生错误并退出。为了合理控制磁盘空间消耗,在cron里使用如下命令

  • 该命令做两件事。首先,它关闭当前打开的日志文件。然后,通过在文件名后加数字扩展名,它重命名cache.log,store.log和access.log。例如,cache.log变成cache.log.0,cache.log.0变成cache.log.1,如此继续,滚动到logfile_rotate选项指定的值。
  • squid仅仅保存每个日志文件的最后logfile_rotate版本。更老的版本在重命名过程中被删除。假如你想保存更多的拷贝,你需要增加logfile_rotate限制,或者编写脚本用于将日志文件移动到其他位置上。

5.12 利用Web界面来管理squid

squid有一个cachemgr.cgi的程序,可以Web来显示内容,这个对于调整squid的参数很是方便。可以平时我们安装完squid后其实就有这个程序了。我们只要在Apache中配置以下即可。

5.12.1 安装apache服务
5.12.2 查找cachemgr.cgi的存放位置
5.12.3 将文件拷贝到apache服务器下的cgi-bin目录下
5.12.4 为了避免和后边的squid反向代理冲突,http修改端口为8080
5.12.5 启动apache服务
5.12.6 浏览器访问http://192.168.200.13:8080/cgi-bin/cachemgr.cgi
5.12.7 登陆squid管理Web界面
本文地址:http://fabua.ksxb.net/news/4894.html    海之东岸资讯 http://fabua.ksxb.net/ , 查看更多

特别提示:本信息由相关用户自行提供,真实性未证实,仅供参考。请谨慎采用,风险自负。

 
 
更多>同类最新资讯
0相关评论

文章列表
相关文章
最新动态
推荐图文
最新资讯
点击排行
网站首页  |  关于我们  |  联系方式  |  使用协议  |  版权隐私  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  网站留言  |  RSS订阅  |  违规举报  |  粤ICP备2023022329号