Perl简介

3/5/2006来源:Perl教程人气:10332

##########################################################################
#版权声明#
##
#本篇文章的版权为作者萧永庆先生所有.允许网路上的非营利转载.#
#作者的电子邮件地址:syc@cc.ntu.edu.tw#
##
#本文可在下列URL取得:#
#ftp://ftp.math.ncu.edu.tw/chinese/DOC/#
##########################################################################

Perl简介-$ID$

写在前面:有点懒懒的,不太想用脑筋构思文章,想看的人就忍耐一下吧。

Perl是什麽东西呢?Manual上是这样写的:PRacticalExtractionandReportLanguage
它原始的目的就是用来取代UNIX原有的sed/awk与shellscript的组合,用来
汇集资讯,产生报表的一个工具语言(程式)。不过随着版本的改进,功能越来
越强,现在的功能已经超乎原先设计时的想像,几乎任何事都可以做到,也变
成每一部UNIX工作站必备的标准工具了。

Perl的作者是LarryWall,曾经贡献过好几个很有用的
程式给大家(publicdomain)使用,包括patch和rn。他设计perl时的哲学是以
实用为第一优先,(所谓的实用就是语言容易使用,有效率,而且完整),而不是设
计一个看起来很漂亮的语言。(漂亮就是程式非常的小,语法幽雅,而且只由
最少的语法基本元素构成)。Perl包含了C,sed,awk,和sh这几个工具最好(作
者(Larry)说的)的特色,而且主要的语法很接近C语言,对原本熟悉C语言
的人来说非常容易上手。

--------------------------------------------------------------------------
讲完废话,可以进入主题了。首先,我们按惯例用perl写个程式印出Hello,World
吧。首先,用你自己最喜欢的编辑器建立hello这个档案,如下:

#!/usr/local/bin/perl
#
#Program'hello':printout'Hello,World'onstandardout.
#
print"Hello,World";
#endoffile

前面几个以#号开头的行在UNIX的习惯里面是释,所以实际上的程式
只有一行而已。不要忘掉print那一行最後的那个分号。还有要注意perl
会区分大小写。

不过这里有个小细节要注意,就是第一行:
#!/usr/local/bin/perl
乍看之下是释,其实它大有作用。在古早的UNIX系统里面,可执行档分作两种,
一种是包含机器指令的二进位档,系统可以直接载入执行;另外一种叫做
script档,也就是包含一些shell命令的普通文字档:UNIX一遇到这种文字档
就会自动载入/bin/sh去解译与执行它。不过随着UNIX的发展,shell越来越多,
实在不晓得script档是用哪种shell写的。所以就发展出一个机制,在每个script
档的第一行(前面不可以有空白与空白行)写个#!,然後接着写真正要负责处理这个
script的程式档路径,就可以让UNIX知道要用那个程式来处理了。另外,顺便唆一下,
这个路径後面还可以再加一个参数(oneandonlyone),如下:
#!/usr/local/bin/perl-f对
#!/usr/local/bin/perl-pi.bak对
#!perl-f-pi.bak不对->-pi.bak会被忽略。
反正写超过一个就会被忽略就对了。

好了,回归主题,要如何执行这个程式呢?有好几个方法:

1.直接在命令列打:(venus是我们shell的提示号,不用输入)
venusperlhello

2.让perl从standardinput读入perl程式:
venusperl
3.把hello改成可执行档,然後再执行:
venuschmoda xhello
venus./hello

1:如果你的$PATH(或$pathincsh)有"."(目前目录)的话
就可以不用打"./"。
2:你必须确定perl是放在/usr/local/bin/perl上,不然的话
请把这个字串改到正确的值(可能是/bin/perl,试不出来问root)。

哇!好不容易可以执行第一个程式了。结果应该就是我们期望的Hello,World了。
第二个执行的方法蛮有趣的,换句话说,你可以这样子输入perl程式:

venusperl(直接按ENTER)
print"Hello,World\n";
CTRL-D

CTRL-D就是UNIX的endoffile,perl处理命令的时候会整个档案都读入、
分析一遍後,再开始执行,所以Hello,World会在按完CTRL-D後才印出来,
而不是打print...;之後就立刻印出。
--------------------------------------------------------------------------
唆完一些背景知识後,我们可以把注意力全部集中在perl本身了。首先是
perl支援的变数型态。perl下的变数型态总共有三种:scalars(纯量),arrays
ofscalars(纯量阵列),associativearrays(相关阵列?实在不会翻,看下
面的解好了)。

Arrays(ofscalars)与Associativearrays的差别:

"一般所谓的arrays是一块连续的记忆体,它的每一个元素的大小都是一样的,
可以很快的透过数字(第几号元素)利用CPU本身的定址能力直接取出来;
而associativearrays比较像一张对照表,给定一个值(有可能是一个字串),
要先在这张表内搜寻,找到这个『键』,然後才能找到相对应的值出来。

差别就是arrays(ofscalars)速度比较快,associativearrays通常都是
利用一些资料结构达成的,比较慢,不过比较有弹性就是了。"

perl的变数不需要事先宣告,直接就可以用了。

变数以$开头,以下是几个例子:(每一行都是独立互不相的)

$days#asimplescalarvariable
$days[28]#29thelementofarray@days
$days{'Feb'}#onevaluefromanassociativearray
$#days#lastindexofarray@days

一整个(或者是部份的)array用@表示:

@days#($days[0],$days[1],$days[2],...$days[n])
@days[3,4,5]#sameas@days[3..5]等於($days[3],$days[4],$days[5])
@days{'a','c'}#($days{'a'},$days{'c'})

一整个assosiativearray用开头:

趛s#(key1,val1,key2,val2,....)

对於每一种资料型态,他们的命名空间是互相独立而不受扰的,也就是说,
$days,@days,趛s这三个符号可以同时存在而互不影响。

以上这八种表示法都可以作为lvalue,换句话说,都可以放在等号的左边,
可以设值。如下:

$d=20;
$a[18]=1;
$days{'Feb'}=28;
@arr=('a','b','c','d','e');
@days[3,4,5]=(1,2,3);
@days{'a','c'}=('Monday','Wednesday');
甚至:($s1,$s2,$s3)=$Bar(2,3,4);

ps:前面没有提到,不过应该很简单,就是常数array就是用小括号括起来形成一个
"list"就对了。字串就是用单引号或双引号括起来。详情见後面说明。

Array@classes的大小可以由$#classes的值得到。(实际上是array长度减一,
因为$#classes是@classes最後一个元素的索引(index),而通常array都是从0开始
算的)。要改变array的大小就直接改$#classes就好了。不过缩小array并不会
真的把array的资料丢掉,$#array改大後又可以取回来了。把array删掉的方法是

@array=();
$#array=$[-1;(两者同义,$[是特殊变数,表示array的基数,
就是说array是由$[开始算的;array的第一个元素.
通常$[==0)

另外,如果把array当作scalar(纯量)用的话,array会传回该array的长度。

scalar(@array)等於$#array-$[ 1(末项-前项 1=长度)
如:$len=@array;

perl没有提供多维阵列,但是有提供一些机制来利用associativearray模拟
多维阵列。例:

$foo{$a,$b,$c}=1;(等於$foo{"$a,$b,$c"}=1;)

最後,如果一个变数名称用特殊符号开头,那该名称就只能该符号有一个字元,如

$;
$$
$

等。而且这些变数通常都有一些特别的意义。


常数的使用就像一般一样:
12345
12345.67
3.1428E-10
0xffff#十六进位
0377#八进位
4_294_976_296#429976296

字串常数则用单引号或双引号括起来。他们的效力与shell下一样:双引号括起来的字串
仍然会做变数和反斜线替换,而单引号不会(除了\'与\\)。如:

$h="Hello";
$w="World";
$hw="$h,$w";#Hello,World
print"Item1\tItem2\n";"Item1Item2"

反斜线替换常用的和C一样,详情请看perlmanpage.