枫叶交流论坛



 
标题: ASP采集教程
admin
管理员
Rank: 9Rank: 9Rank: 9



UID 1
精华 0
积分 4707
帖子 3656
阅读权限 200
注册 2006-12-23
状态 离线
发表于 2007-2-23 17:40  资料 文集 短消息 
ASP采集教程

ASP采集教程_基础篇1发布日期: 2006-12-16 11:22:54 作者: kittenchen 出处:CRXB  人气:0 字体

ASP采集教程_基础篇
    做一个好的教程就是要让人看懂,我早先买教程书看到第一章千篇一律都是计算机发展史再加历史回顾和前景展望,烦死。
所以本教程就不讲一些没用的东西了,直接转入正题(我的风格),大家有什么问题可以联系
我的QQ:15057835.
也可以到我的小站:
软  件  站:http://www.cf008.com/
    ASP采集其它就是利用微软自带的XMLHTTP组件取得远程页面的源代码,再经过程序的过滤替换处理转换成我们想要的数据。我们也不管用什么,反正我教你的就是用一段代码取得目标代码,  再把目标代码加工一下。然后直接显示啊还是写入数据库。就这么简单!
引用组件CreateObject("Microsoft.XMLHTTP")  --->取得目标代码(get) ---> 数据处理(截取,过滤,替换) --->  直接显示(小偷)或 写入数据库(采集)
说了这么多是要开始实战了.
     二话不说,先写个刚刚讲到的引用组件和取得代码的函数
    ' 获取远程HTML
    Function GetURL(url)
            Set Retrieval = CreateObject("Microsoft.XMLHTTP")
            With Retrieval
                .Open "GET", url, False
               .Send
               GetURL = .responsebody
            if len(.responsebody)<100 then
                response.write "获取远程文件 <a href="&url&" target=_blank>"&url&"</a> 失败。"
                response.end
            end if
            End With
            Set Retrieval = Nothing
        End Function
上面这段函数的URL值就是我们的目标网页,也就是要偷的页面了。
当然我们得到的代码是以二进制返回给我们的,那我们得把他转换成我们要的字符,怎么办?
怕什么?我自己不会写难道还不会上网找啊。找到了,怎么实现的我们当然不管它了,只要能用就行了,函数代码如下:
' 二进制转字符串
function bytes2bstr(vin)
       strreturn = ""
       for i = 1 to lenb(vin)
       thischarcode = ascb(midb(vin,i,1))
       if thischarcode < &h80 then
              strreturn = strreturn & chr(thischarcode)
       else
              nextcharcode = ascb(midb(vin,i+1,1))
              strreturn = strreturn & chr(clng(thischarcode) * &h100 + cint(nextcharcode))
              i = i + 1
       end if
       next
       bytes2bstr = strreturn
end function
OK!
有了这两个函数基本上可以实现简单的小偷了。
我今天就找天空的软件资讯开刀,地址是: http://www.skycn.com/article/index_article.html
开工:
1,建立一个ASP文件,我建的是index.asp
<%
%>
先写好啊,要养成这样的习惯哦。
定义一下地址和调用函数
dim url,html
    url="http://www.skycn.com/article/index_article.html"
    Html=GetURL(url) '把地址url传递到GetURL这个函数
       Html=Bytes2BStr(Html) '二进制转换成字符一下
再把刚刚两个函数写进去
最后看一下是否偷到了,我们response一下
Response.write html
整个文件内容就是:
<%
On Error Resume Next
Server.ScriptTimeOut=9999999
dim url,html
    url="http://www.skycn.com/article/index_article.html"
    Html=GetURL(url) '把地址url传递到GetURL这个函数
       Html=Bytes2BStr(Html) '二进制转换成字符一下
' 获取远程HTML
Function GetURL(url)
    Set Retrieval = CreateObject("Microsoft.XMLHTTP")
    With Retrieval
        .Open "GET", url, False
        .Send
        GetURL = .responsebody
       if len(.responsebody)<100 then
              response.write "获取远程文件 <a href="&url&" target=_blank>"&url&"</a> 失败。"
              response.end
       end if
    End With
    Set Retrieval = Nothing
End Function
' 二进制转字符串
function bytes2bstr(vin)
       strreturn = ""
       for i = 1 to lenb(vin)
       thischarcode = ascb(midb(vin,i,1))
       if thischarcode < &h80 then
              strreturn = strreturn & chr(thischarcode)
       else
              nextcharcode = ascb(midb(vin,i+1,1))
              strreturn = strreturn & chr(clng(thischarcode) * &h100 + cint(nextcharcode))
              i = i + 1
       end if
       next
       bytes2bstr = strreturn
end function
Response.write html
%>
试了一下,果真取到了。有图为证:

为什么我们得到的内容图片啊链接啊什么的都不会对呢?
那是因为我们只是仅仅得到目标的源码代并在我们的文件上显示而已。
怎么才能显示正确的图片和正确的链接呢,那就是我们下一篇要讲的数据处理部分了
如何?学到了吗?换其它地址试试!!
顶部
[广告] 全新不用K线图的傻瓜股票分析软件财富股市侦探准确性高www.cf008.com
admin
管理员
Rank: 9Rank: 9Rank: 9



UID 1
精华 0
积分 4707
帖子 3656
阅读权限 200
注册 2006-12-23
状态 离线
发表于 2007-2-23 17:42  资料 文集 短消息 
ASP采集教程_基础篇2-最基本的数据处理ASP采集教程_基础篇2-最基本的数据处理
    上次说到哪了?好像只说到如何得到目标地址并得到代码和显示出来。这样得到的当然是不能用的了。我们现在
就来学一下把得到的数据做一个最基本的数据处理吧.
    OK!开始!   
    那天刚好在站长站里看到有个人想要一个杀毒软件的小偷页面,说是要丁香鱼的瑞星更新小偷(怎么不来找我呢,有时间给你写一个嘛
不过你只要看了我的教程,以后不要说丁香鱼了,其它的鱼一样偷),那我们就把丁香鱼拿来开刀。
    丁香鱼网址:http://www.luckfish.net/rising.htm
记不记得我上次的代码啊,里面有几个函数,现在我把它们都放入一个文件function.asp,目的是为了以后方便改啊,添加功能什么的
我也不懂啦,个人认为就是好看,不会乱。
--------------------------------
function.asp:
<%
' 获取远程HTML
Function GetURL(url)
    Set Retrieval = CreateObject("Microsoft.XMLHTTP")
    With Retrieval
        .Open "GET", url, False
        .Send
        GetURL = .responsebody
if len(.responsebody)<100 then
  response.write "获取远程文件 <a href="&url&" target=_blank>"&url&"</a> 失败。"
  response.end
end if

    End With
    Set Retrieval = Nothing
End Function
' 二进制转字符串
function bytes2bstr(vin)
strreturn = ""
for i = 1 to lenb(vin)
thischarcode = ascb(midb(vin,i,1))
if thischarcode < &h80 then
  strreturn = strreturn & chr(thischarcode)
else
  nextcharcode = ascb(midb(vin,i+1,1))
  strreturn = strreturn & chr(clng(thischarcode) * &h100 + cint(nextcharcode))
  i = i + 1
end if
next
bytes2bstr = strreturn
end function

Function getcontent(HTML,starcode,endcode)
   dim StartPos,EndPos,Length
StartPos=Instr(1,HTML,starcode)
EndPos=Instr(StartPos,HTML,endcode)
Length=EndPos-StartPos
getcontent=Mid(HTML,StartPos,Length)
End Function
%>

    前面两个函数我就不讲了,讲一下getcontent,这个函数的作用就是截取我们想要的代码,就叫截取吧。
    解释一下里面用到的VB函数
    Instr:
    返回某字符串在另一字符串中第一次出现的位置(vb script没学好的要抓紧补啊同志们) 。
    Mid:
    从字符串中返回指定数目的字符。
    这样大家就比较好理解了吧,html是我们得到的网页整个源码,starcode是我们要截取的代码开始,endcode自然就是我们要截取的结束了
    我们先通过starcode和endcode来指定我们要截取的位置,再用mid取出来。上面讲的都是理论的
    等下通过实际的应用我们会更好理解的。
    ---------------
    建一个ASP文件rising.asp作为小偷的主文件。记不记得上次得到源码的几个代码,现在可以用上了。
    rising.asp:

<!-- #include file="function.asp" -->
<%

On Error Resume Next
Server.ScriptTimeOut=9999999
dim url,html,starcode,endcode
    url="http://www.luckfish.net/rising.htm" '我们要偷的页面地址
    Html=GetURL(url) '把地址url传递到GetURL这个函数
Html=Bytes2BStr(HTML) '二进制转换成字符一下
starcode="<td><div align=""center""></div></td>" '我们并不是偷网页的全部,因为前面的东西我们不要嘛,所以从这里开始,代码不能重复哦
endcode="<td colspan=""2""><div align=""center"">"'和上面一样,我们尾部也不要,这里是结束的部分,代码要唯一,我们要的就是上面和这里的中间部分
content=getcontent(HTML,starcode,endcode) '赋值完毕了我们就调用一下这个函数,等于是参数传递一下
content=replace(content,"images/","http://www.luckfish.net/images/")'这里是另外一个替换操作,下面给你们讲
Response.write content '输出内容
%>
主要说一下
    replace:
    返回字符串,其中指定数目的某子字符串被替换为另一个子字符串。
这个就是把代码中我们不想要的换成我们想要的,或直接换成空,下面是一个例子
Dim MyString

MyString = Replace("XXpXXPXXp", "p", "Y") '二进制比较从字符串左端开始。返回 "XXYXXPXXY"。
上面XXpXXPXXp的p就被换成了Y吧,如果换成空:
MyString = Replace("XXpXXPXXp", "p", "") '二进制比较从字符串左端开始。返回 "XXXXPXX"。
那上面XXpXXPXXp的p就不见了。简单吧。
我们例子里因为有图片,路径如果不处理一下,图片就无法正常显示,所以我们把"images/"换成了"http://www.luckfish.net/images/"绝对路径
还有哦,他们里面有一个引用javescript,我们在rising.asp的最前面也引用一下,是关于版本的
<script language=javascript src="http://www.rising.com.cn/service/javascript/RsProVer.js"></script>
OK!我看一下效果哦。



好了,成功了。第二课也讲完了,你们可以去试试其它页面啊,或可以用这几个函数取不同的值来练练手。
好了,等第三课吧
顶部
[广告] 全新不用K线图的傻瓜股票分析软件财富股市侦探准确性高www.cf008.com
defg028
新手上路
Rank: 1



UID 409
精华 0
积分 0
帖子 732
阅读权限 10
注册 2008-5-10
状态 离线
发表于 2008-6-2 15:56  资料 主页 短消息  QQ
制氧机

支持!!呵呵














专业提供呼吸机制氧机等设备




顶部
[广告] 全新不用K线图的傻瓜股票分析软件财富股市侦探准确性高www.cf008.com
defg028
新手上路
Rank: 1



UID 409
精华 0
积分 0
帖子 732
阅读权限 10
注册 2008-5-10
状态 离线
发表于 2008-6-3 17:25  资料 主页 短消息  QQ
流水线

新人报道,前辈多多关照!!!支持!!呵呵
   

















温岭市恒弛机械输送设备厂是一家设计和制造各类非标设备和装配流水线的企业,聘请从事高科技产品研究、开发的工程技术人才,务求替用户实现生产现代化提高效率的质量。




顶部
[广告] 全新不用K线图的傻瓜股票分析软件财富股市侦探准确性高www.cf008.com
qrst673
新手上路
Rank: 1



UID 422
精华 0
积分 0
帖子 25
阅读权限 10
注册 2008-7-5
状态 离线
发表于 2008-7-7 11:04  资料 主页 短消息  QQ
保险箱

新人报道,前辈多多关照!!!支持!!呵呵
















QNN全能牌保险柜,保险箱 和保险柜造商 ,十年全球著名保险柜品牌,有酒店客房保险柜,前台保管箱,家用电子保险柜,商用电子保险柜,机械保险柜等上百个品种,是保险柜领域专业的制造商和供应商




顶部
[广告] 全新不用K线图的傻瓜股票分析软件财富股市侦探准确性高www.cf008.com
语莛璧
新手上路
Rank: 1



UID 435
精华 0
积分 0
帖子 1700
阅读权限 10
注册 2008-7-24
状态 离线
发表于 2008-7-28 09:10  资料 主页 短消息 
当今IT网络财富是如何积累的

作为一个网站策划,学习一点搜索引擎优化知识可以让你在策划天龙八部私服乃至到网站推广的时候又有的放矢。无论如何,笔者认为不能到了推广的时候才关注SEO知识,有些知识在网站策划的时候就应该考虑到的,那么网站策划就应该把相关的优化建议作为网站开发规范文档的一部分交由程序和设计执行,所以,我们应该对搜索引擎优化知识有个初步的了解,一下内容有笔者翻译自外国代写论文网站,我打算分几部分发出来,毕竟我们IT人的闲暇时间太少了,我会尽快把所有的都发出来的。

知道了以上的这些最主要的问题那么你随便做个网站,比如窃听器销售。那么你的个人财富也就很快的积累起来了
顶部
[广告] 全新不用K线图的傻瓜股票分析软件财富股市侦探准确性高www.cf008.com
hijk723
新手上路
Rank: 1



UID 512
精华 0
积分 0
帖子 15
阅读权限 10
注册 2008-8-13
状态 离线
发表于 2008-8-17 22:06  资料 主页 短消息  QQ
五行外挂

在远古时代,人类就对“五行”产生了一些懵懂的认识。他们认为树木就是木的代表;在劳动过程中使用到的工具,如石器、青铜器等,便是金的表现;而火焰则是火的象征等等。在他们的意识里,五行就是万物之宗、万物之源的表现。然而.随着人类文明的不断进步,人们通过
长期的研究发现,五行所体现的不仅仅是实物,更多的是各种事、物、现象所共有的一种抽象的性能。在现代,随着科学技术的进一步发展,
五行更是渗透到了人们生活的各个领域,如医学、饮食、哲学等。由此可见,多年来人类对五行的研究仍在继续,而五行中的更多奥义还等待
着人们不断的去发掘与应用。
  传说,至QQ华夏外挂|QQ华夏下载开天地以来,感孕其精魄的强力生灵就合力建成了“天界”,他们居于其中,吸收日月之精华,被下界尊称为“神”,而五
行主神便是其中的五位,即土神神农、水神共工、金神蓐收、火神祝融及木神句芒。他们相互克制,相互制约,与其他神仙一起维持着天界的
平衡,并被下界的万物生灵所敬仰。

在《蜀山Online》当中,角色装备根据属性的不同,在对抗拥有其他不同属性的装备时,所发挥的效力可以的到不同程度的增强或是削弱。
  
在装备中,若其具有的QQ三国外挂属性是相生的,则被生者可获得50%的能力提升,即可发挥150%的能力;反之若相克,则被克者只能发挥50%的能力
;若既是被生者,也是被克者,则发挥100%的能力。

 一、金属性
   金生水,克木,其性刚强威猛,可增加角色的攻击力。五行相生相克之道里。
      

金属性装备效果

 二、木属性
   木生火,克土,代表大自然中生生不息的生命,可增加角色的生命上限。
 
        

木属性装备效果
三、水属性
   水生木、克火,可柔可刚的水,诡谲难辨,其形亦变化万千,可提高角色的法术防御力。

         

水属性装备效果
四、火属性
   火生土,克金,性猛而烈,爆发力强,可使角色的唤神持续时间延长。
           
火属性装备效果
五、土属性
   土生金,克水,厚重严实的土,为万物之根基,可提升角色的物理防御力。
            
土属性装备效果

《蜀山OL》中五行原理的应用,给游戏本身带来了许多的乐趣,也让玩家在游戏的同时感受到了博大精神的中华文化。了解五行的原理,明确
自己的职业、装备及物品炼化需求,选择适合自己五行装备升级或PK,你会发现,原来五行也会如此富有乐趣。
游戏外挂下载地址:天龙八部私服
天龙八部外挂
武林外传外挂
顶部
[广告] 全新不用K线图的傻瓜股票分析软件财富股市侦探准确性高www.cf008.com
opqr716
新手上路
Rank: 1



UID 489
精华 0
积分 0
帖子 155
阅读权限 10
注册 2008-8-8
状态 离线
发表于 2008-8-18 03:20  资料 主页 短消息  QQ
嘿咻

不错








                                                                          




  

SIGNATURE____________________________________________________________________

活着的时候请尽量快乐,因为你将死的很久
神墓  盘龙  恶魔法则  琴帝
顶部
[广告] 全新不用K线图的傻瓜股票分析软件财富股市侦探准确性高www.cf008.com
opqr716
新手上路
Rank: 1



UID 489
精华 0
积分 0
帖子 155
阅读权限 10
注册 2008-8-8
状态 离线
发表于 2008-8-24 03:33  资料 主页 短消息  QQ
啊哦。。。

不错







                                                                                                   







SIGNATURE____________________________________________________________________

活着的时候请尽量快乐,因为你将死的很久

神墓 盘龙 龙蛇演义 星辰变后传
顶部
[广告] 全新不用K线图的傻瓜股票分析软件财富股市侦探准确性高www.cf008.com
defg028
新手上路
Rank: 1



UID 409
精华 0
积分 0
帖子 732
阅读权限 10
注册 2008-5-10
状态 离线
发表于 2008-9-6 18:10  资料 主页 短消息  QQ
代写论文

股骨头坏死
新手报道请大家多多包含!!呵呵   希望;论坛越办越好!!!!!





















代写论文网硕博士专业团队提供代写论文代写论文硕士论文,代写代发职称论文,职称论文等服务,多年经验,真诚服务,专业品质,各种代写论文,文案报告代写尽在代写论文网.




顶部
[广告] 全新不用K线图的傻瓜股票分析软件财富股市侦探准确性高www.cf008.com
 


当前时区 GMT+8, 现在时间是 2008-9-7 15:36

    本论坛支付平台由支付宝提供
携手打造安全诚信的交易社区 Powered by Discuz! 5.0.0  © 2001-2006 Comsenz Inc.
Processed in 0.196688 second(s), 6 queries

清除 Cookies - 联系我们 - 枫叶技术支持. - Archiver - WAP