http://www.baidu.com/s?lm=0(搜 索结果时间限制) &si=&rn=10(每页显示的数目) &ie=gb2312&(语言) ct=0 &wd=%CA%6%BB%FA& (关键词) pn=10 (在第pn比上10后加上1页) &ver=0 &cl=3 &uim=6 &usm=0
tn 搜索框所属网站。比如 tn=sitehao123,就是 http://www.hao123.com/ 左上那个搜索框ie Input Encoding - 输入编码。百度似乎不支持其它编码。 默认值是“gb2312” word 搜索的关键词。 kw 搜索的关键词。 bs Before Search - 上一次搜索输入的关键词. sr 不建议使用该参数.结合bs使用。一般查询sr=0或者为空值,但sr=1时,查询将结合bs的值一起作为查询的关键字.默认值为0,除0,1外其它值无效。 ct 语言限制。0-所有语言,1-简体中文网页,2-繁体中文网页;其它不确定或者无效或。默认值为0. rn 每页包含的搜索结果数目。默认值为10 pn 搜索结果的页码,从零开始计数。即pn = ${结果页码-1}*rn。 lm 搜索结果的时间限制。以天为单位,例如搜索最近一个月的网页,lm=30.默认值为0,表示没有时间限制。 q5 搜索内容位置限制.0-所有内容;1-网页标题(相当于使用'title:'查询前缀);2-url(相当于使用'inurl:'查询前缀);其它值等效于0.默认值为0 q6 搜索内容网站限制.例如q6=sohu.com,表示只搜索sohu.com的网页;相当于使用了'site:前缀'.默认值为空 dq 不建议使用该参数.查询内容来原的地区限制. 具体值有百度确定.默认值为空.试了一下,使用这个参数的效果很差.myselectvaluesubmit=tb=on 贴吧?f 未知。 默认值为空 cl 未知。 默认值为空 rs2 未知。 sc 未知。
===============================================================================
构造半自动化搜索引擎查询,需要了解一下,百度url构成方式和参数的作用。虽然是转载,但是还是有很大的学习意义了。
http://www.baidu.com/baidu?cl=3&tn=baidutop10&wd=%B6%B9%B0%EA
这是一个从百度风云榜里面截取的url链接了。cl=3 表示网页搜索,tn表示来源站点,wd是关键词%B6%B9%B0%EA 是utf编码之后的结果了。
百度搜索命令中的参数
必备参数:
wd——查询的关键词(Keyword)
pn——显示结果的页数(Page Number)
cl——搜索类型(Class),cl=3为网页搜索
可选参数:
rn——搜索结果显示条数(Record Number),取值范围在10--100条之间,缺省设置rn=10
ie——查询输入文字的编码(Input Encoding),缺省设置ie=gb2312,即为简体中文
tn——提交搜索请求的来源站点
几个有用的tn
tn=baidulocal 表示百度站内搜索,返回的结果很干净,无广告干扰。
比如,在百度站内搜索“快乐”,看看返回结果是不是很清爽。
tn=baiducnnic 想把百度放在框架中吗?试试这个参数就可以了,是百度为Cnnic定制的
si——在限定的域名中搜索,比如想在新浪的站内搜索可使用参数si=sina.com.cn,要使这个参数有效必须结合ct参数一起使用。
ct——此参数的值一般是一串数字,估计应该是搜索请求的验证码
si 和ct参数结合使用,比如在sina.com.cn中搜索“理想”,可用:http://www.baidu.com/s?q=& ct=2097152&si=sina.com.cn&ie=gb2312&cl=3&wd=理想