动态网站制作指南 [  QQ表情  ]
[ 投票调查 ]
[ 企业邮箱 ]
[ 网站空间 ]
网络编程 | 站长之家 | 网页制作 | 图形图象 | 操作系统 | 冲浪宝典 | 软件教学 | 网络办公 | 邮件系统 | 网络安全 | 认证考试 | 系统进程
ASP源码 | .Net源码 | PHP源码 | JSP源码 | JAVA源码 | CGI源码 | VB源码 | C++源码 | Delphi源码 | PB源码 | VF源码 | 汇编 | 服务器
Firefox | IE | Maxthon | 迅雷 | 电驴 | BitComet | FlashGet | QQ | QQ空间 | Vista | 输入法 | Ghost | Word | Excel | wps | Powerpoint
asp | .net | php | jsp | Sql | c# | Ajax | xml | Dreamweaver | FrontPages | Javascript | css | photoshop | fireworks | Flash | Cad | Discuz!
当前位置 > 网站建设学院 > 网络编程 > ASP实例
Tag:注入,存储过程,分页,安全,优化,xmlhttp,fso,jmail,application,session,防盗链,stream,无组件,组件,md5,乱码,缓存,加密,验证码,算法,cookies,ubb,正则表达式,水印,索引,日志,压缩,base64,url重写,上传,控件,Web.config,JDBC,函数,内存,PDF,迁移,结构,破解,编译,配置,进程,分词,IIS,Apache,Tomcat,phpmyadmin,Gzip,触发器,socket
网络编程:ASP教程,ASP.NET教程,PHP教程,JSP教程,C#教程,数据库,XML教程,Ajax,Java,Perl,Shell,VB教程,Delphi,C/C++教程,软件工程,J2EE/J2ME,移动开发
文章搜索服务
邮件订阅
输入你的邮件地址,
你将不会错过任何关于:
[ ASP实例 ]的信息

本月文章推荐
.构建你的网站新闻自动发布系统之.
.一个统计当前在线用户的解决方案.
.用ASP开发一个在线考试程序(四).
.用ASP制作在线测试.
.Flash+ASP实现电子互动地图在线标.
.编写数据库脚本.
.用ASP实现论坛的UBB功能(二).
.无组件上传图片至SQLSERVER数据库.
.ASP环境下邮件列表功能的实现 (.
.仿照CHINAASP论坛中TOP10写的部分.
.asp生日自动提醒小程式.
.FrontPage 2000+DB2实现数据库信.
.Delphi编写组件封装asp代码的基本.
.在线用表单建立文件夹.
.构建你的网站新闻自动发布系统之.
.完整的访问统计程序(二 &n.
.用ASPMail组件实现E_mail自动反馈.
.ASP进阶之文章在线管理更新(8).
.DW+ASP 玩转动态二级菜单.
.完整的访问统计系统(一:数据库.

利用ASP实现三个强大功能之三

发表日期:2000-9-11 |


3、如何隐藏页面以防被搜索

  在网络上为我们导航的搜索引擎使用一些小程序 --- 例如我们所知道
的'robots'、'bots'、 'crawlers'和'spiders' --- 来对页面进行索引。然而,当开发一个站点,尤其是使用ASP进行开
发时,做到防止页面被索引却是非常有用的。当这些搜索引擎正在回顾它们对所创建的web 页面进行动态索引的方案时,
例如ASP页面,本文将帮助你学习一些重要的技巧来避免robots 跟踪那些你不情愿被它们索引的页面。

这为什么与你有关?

  比方说现在你访问了XYZ公司的Web 站点,用你所熟悉的搜索引擎对'XYZ Corp.' 进行搜索。如果你发现你的管理页面
也在相关的链接表中的话就会有点担心了。如果你有一个电子商务站点,你会不愿意在用户结束前面的页面之前,得到这
个站点的定单部分最后一页的url 。不仅仅是网管人员不希望发生的。对于用户来说,有些页面不能正常运行也是烦恼的
事,或者是因为他们没有适当的权限,或者因为他们没有按照设定的顺序访问页面。这样也不利于你的站点的声誉。这与
那些商业搜索引擎的经营者自身也有关系。因为他们想要提供准确的链接来改善服务。

  那么,如何防止这些程序对你的站点的某些页面进行索引呢?有两种方法可供选择,一是在根目录下包含一个名为
robots.txt 的文件,或者是使用< META > 标记。

包含一个robots.txt 文件

  早在1994年,一个自动邮件发送列表就联合提出了一个防止robots 拖拽站点的协定。但是这并不是一个正式的标准,
它不能提供执行的保证,但是却为许多robot 作者所使用。

  创建一个robots.txt 文件非常简单,它表明网管人员所希望的robot 行为标准。注意文件名必须用小写字母,而且必
须放在站点的根文件夹中,例如http://xyzcorp/robots.txt ,这样一个文件就能带出整个站点的全部细节。

一个robots.txt 文件中有什么?

  每个robots.txt 文件包含一条或多条记录。一条记录由robot 的用户代理字符串组成,即你愿意遵循的指示和应用于
它的指示。不用担心你需要知道在web中漫游的所有robot的用户代理字符串,因为你可以用通配符* 来应用所有的
robots。以下是一个记录的例子:

User-agent: *
Disallow: /XYZfinances.asp
Disallow: /admin
Disallow: /news/update.asp

  除了用户代理字符串/通配符,只需要包含一个disallow 命令。这一个简单的例子就显示了你将会需要的全部可能
性。它表明没有用户代理字符串能够进入 XYZfinances.asp ,用这一行表示:

Disallow: /XYZfinances.asp

  或者说用户代理字符串不能进入管理文件夹及其下面的所有文件夹:

Disallow: /admin

  或者是新闻文件夹中的update.asp文件,如果新闻文件夹中所有其它内容都可以被索引的话。

  在一条记录中你愿意包含多少用户代理字符串的名字都可以。同样在任何一个robots.txt 文件中,你愿意包含多少条
记录都可以(只要用一个或多个空行分隔开这些记录就可以)。

  每一条单独的记录都可以为一个或多个robots提供不同的指示。但是为那些没有用用户代理字符串所命名的引擎增加
一个通配符规则是明智的。最流行的选择是维护用一条记录和一个代表用户代理字符串的通配符所表示一个方案。一个有
196个用户代理的清单可参考

http://info.webcrawler.com/mak/projects/robots/robots.html。

  普遍认为,robots应该忽略大小写和版本号。要记住这是大多数商业搜索引擎的robots作者们的意见,因为你不想用
那些没用的页面来使用户感到苦恼。但是,虽然在命令行中你可以不必考虑大小写,但是必须保证在键入URL时是准确无误
的。虽然Windows NT 对文件名和路径名的大小写无所谓,但并不是所有的平台都如此。

  你希望包含进去的其它东西就只有注释了,这些使用UNIX bourne shell 协定,如用#符号表示在hash 符号前面空
白,和一行中可以被忽略的剩余部分。如果一行中只包含一个注释的话,它就可以完全被忽略,虽然它在记录之间的作用
与空行并不相同。

现在来看看两个最终的例子。

例1

# Don't come to this site
User-agent: *
Disallow: / # Disallows anything

例2

# robots.txt for XYZcorp
# webmaster: John Doe contact JohnD@xyzcorp.com
User-agent: * # Applies to all robots except next record
Disallow: /store/order/ # No robot should visit any URL starting with
/store/order/
Disallow: /admin/ # Disallow any pages in the admin folder
Disallow: /world_domination.asp # Disallow world_domination.asp

好,这就是有关robot.txt文件的全部内容。下面介绍如何使用 < META >标记 。

使用一个< META > robot 标记

  同样,你还是不能保证一个robot 会完全遵守< META >标记中的指示,但是对商业搜索引擎来说还是十分有效的。<
META >标记必须包含在一个文件的< HEAD > 部分。他们工作的原理是告诉robot 是否可以对其中有这个标记的页面进行索
引,是否可以跟随页面上或其下的文件夹中的任何链接。

  同样,语法非常简单。第一个例子是:

< META NAME="robots" CONTENT="noindex" >

  这行代码告诉 robot不要索引这一页。

下一个例子:

< META NAME="robots" CONTENT="nofollow" >

  允许robot索引这一页,但是规定它不能够跟随这一页上的任何链接。如果你想将二者都禁止,可以使用:

< META NAME="robots" CONTENT="noindex, nofollow" >

  这表示不要索引这一页,也不要跟随这页上的任何链接。但是,还有一个更简单的方法:

< META NAME="robots" CONTENT="none" >

  还是表示不要索引这一页,或跟随这页上的任何链接。

  不幸的是,如果你有一个名为admin.asp的文件与 update.asp相链接,在admin.asp中使用< META >
标记来防止robot 对admin.asp 或 update.asp 进行索引,却忘记在另一个与update.asp 相链接的
页面中也做同样的处理,那么robot 还是可以通过这个漏掉< META > 标记的第二页而到达update.asp。

  另外,你还可以使用值索引。但由于它们被忽略时是默认值,因此这是没有必要的,而且这样做没有意义。

  如果你使用的是IIS,那么应该总是使用定制的 HTTP 头文件来执行< META > 标记方法。从理论上讲,一个robot 对
以这种方式创建的< META > 标记的反应应该是完全一样的,看起来是这样:

< META HTTP-EQUIV="robots" CONTENT="noindex" >

  从理论上讲,现在我们就可以对所有的文件夹或文件夹中的文件或虚拟路径使用IIS创建的定制头文件。但是到目前为
止,这种方法的测试并不成功。这些方法都不能完全保证将你的页面藏起来。确实,如果有人故意写一个robot 去找到你
的私用页面的话,他们反而成了指向作者想要保护的页面的指针。但是,对于防止商业站点索引页面来说,这些方法还是
奏效的,也只有在这方面是有意义的。


上一篇:利用ASP实现三个强大功能之二 人气:11174
下一篇:用ASP开发一个在线考试程序(一) 人气:12787
浏览全部利用ASP实现三个强大功能的内容 Dreamweaver插件下载 常用网页广告代码全集
  最新网站源码 最新软件下载
2008-10-6 Menalto Gallery v2.3 Rc2 多国语
2008-10-6 花香盈路(Hxcms) v9.0
2008-10-6 华军软件下载系统 v1.5
2008-10-6 e107 v0.7.13
2008-10-6 (开源PHP框架) CodeIgniter v1.6
2008-10-6 PHP在线考试系统PPExam v1.2.6 b
2008-10-6 SiteDynamic企业网站管理系统 v1
2008-10-6 WebPlayer9 P2P视频点播电影整站
2008-10-6 BCMS v1.1 测试版
2008-9-29 酷狗音乐(原KuGoo)2008 v5.310 正
2008-9-29 QQTab 1.1
2008-9-29 网络传送带 Net Transport 2.64a
2008-9-29 谷歌金山词霸v1.8
2008-9-29 TweakVI 1.0 Build 1090
2008-9-29 ACDSee Pro 2.5 Build 333 汉化绿
2008-9-29 Winamp v5.541(2189) 周明波简体
2008-9-27 CCleaner 2.12.651
2008-9-27 Mozilla Thunderbird 2.0.0.17 英
  发表评论
姓 名: 验证码:
内 容:
站长工具:网站收录查询 | Google PR查询 | ALEXA排名查询 | CSS在线编辑器 | 广告代码 | js/vbs加密 | md5加密 | 进制转换 | UTF-8 转换工具 | Html转换js | Html转换asp | Html转换php | Html转换perl
实用工具:汉字翻译拼音 | 拼音字典 | 符号对照表 | 个税计算 | 实时汇率查询换算 | 经典小工具 | 汉字简繁转换 | 普通单位换算 | 公制单位换算 | 生辰老黄历 | 国内电话区号 | 国家代码与域名缩写 | 文字加密解密 | 健康查询 | 万年历 | 汉字横竖排版 | 手机号码查询 | 计算器 | ip搜索
业务联系 | 广告刊登 | 频道合作 | 投稿荐稿 | 联系方式 | 加入收藏 | RSS订阅
Copyright © 2000-2008 www.knowsky.com All rights reserved | 网络实名:动态网站制作指南 | 沪ICP备05001343号
ホームページ制作 不動産検索システム 求人情報
防水工事·改修工事 フットサル大会 探偵
SEO対策 中国語教室 ホームページ作成