runoops.com

Perl 特殊变量

Perl 语言中定义了一些特殊的变量,通常以 $, @, 或 % 作为前缀,例如:$_。

很多特殊的变量有一个很长的英文名,操作系统变量 $! 可以写为 $OS_ERROR。

如果你想使用英文名的特殊变量需要在程序头部添加 use English;。这样就可以使用具有描述性的英文特殊变量。

最常用的特殊变量为 $_,该变量包含了默认输入和模式匹配内容。实例如下:

实例

#!/usr/bin/perl
 
foreach ('Google','Runoops','Taobao') {
    print $_;
    print "\n";
}

执行以上程序,输出结果为:

Google
Runoops
Taobao

以下实例我们不使用 $_ 来输出内容:

实例

#!/usr/bin/perl
 
foreach ('Google','Runoops','Taobao') {
    print;
    print "\n";
}

执行以上程序,输出结果为:

Google
Runoops
Taobao

实例中,首先输出 "Google" ,接着输出 "Runoops" ,最后输出 "Taobao" 。

在迭代循环中,当前循环的字符串会放在 $_ 中, 然后 通过 print 输出。另外 print 在不指定输出变量,默认情况下使用的也是 $_。

以下是几处即使没有写明 Perl 也会假定使用 $_ 的地方:

  • 各种单目函数,包括像 ord() 和 int() 这样的函数以及除 "-t"以外所有的文件 测试操作 ("-f","-d"),"-t" 默认操作 STDIN。
  • 各种列表函数,例如 print() 和 unlink()。
  • 没有使用 "=~" 运算符时的模式匹配操作 "m//"、"s///" 和"tr///"。
  • 在没有给出其他变量时是 "foreach" 循环的默认迭代变量。
  • grep() 和 map() 函数的隐含迭代变量。
  • 当 "while" 仅有唯一条件,且该条件是对 ""操作的结果进行测试时,$_ 就是存放输入记录的默认位置。除了"while" 测试条件之外不会发生这种情况。(助记:下划线在特定操作中是可以省略的。)

特殊变量类型

根据特殊的变量的使用性质,可以分为以下几类:

  • 全局标量特殊变量。
  • 全局数组特殊变量。
  • 全局哈希特殊变量。
  • 全局特殊文件句柄。
  • 全局特殊常量。
  • 正则表达式特殊变量。
  • 文件句柄特殊变量。

全局标量特殊变量

以下列出了所有的标量特殊变量,包含了特殊字符与英文形式的变量:

$_默认输入和模式匹配内容。
$ARG
$.前一次读的文件句柄的当前行号
$NR
$/输入记录分隔符,默认是新行字符。如用undef这个变量,将读到文件结尾。
$RS
$,输出域分隔符
$OFS
$\输出记录分隔符
$ORS
$"该变量同 $,类似,但应用于向双引号引起的字符串(或类似的内插字符串)中内插数组和切片值的场合。默认为一个空格。
$LIST_SEPARATOR
$;在仿真多维数组时使用的分隔符。默认为 "\034"。
$SUBSCRIPT_SEPARATOR
$^L发送到输出通道的走纸换页符。默认为 "\f".
$FORMAT_FORMFEED
$:The current set of characters after which a string may be broken to fill continuation fields (starting with ^) in a format. Default is "\n"".
$FORMAT_LINE_BREAK_CHARACTERS
$^A打印前用于保存格式化数据的变量
$ACCUMULATOR
$#打印数字时默认的数字输出格式(已废弃)。
$OFMT
$?返回上一个外部命令的状态
$CHILD_ERROR
$!这个变量的数字值是errno的值,字符串值是对应的系统错误字符串
$OS_ERROR or $ERRNO
$@命令eval的错误消息.如果为空,则表示上一次eval命令执行成功
$EVAL_ERROR
$$运行当前Perl脚本程序的进程号
$PROCESS_ID or $PID
$<当前进程的实际用户号
$REAL_USER_ID or $UID
$>当前进程的有效用户号
$EFFECTIVE_USER_ID or $EUID
$(当前进程的实际组用户号
$REAL_GROUP_ID or $GID
$)当前进程的有效组用户号
$EFFECTIVE_GROUP_ID or $EGID
$0包含正在执行的脚本的文件名
$PROGRAM_NAME
$[数组的数组第一个元素的下标,默认是 0。
$]Perl的版本号
$PERL_VERSION
$^D调试标志的值
$DEBUGGING
$^E在非UNIX环境中的操作系统扩展错误信息
$EXTENDED_OS_ERROR
$^F最大的文件捆述符数值
$SYSTEM_FD_MAX
$^H由编译器激活的语法检查状态
$^I内置控制编辑器的值
$INPLACE_EDIT
$^M备用内存池的大小
$^O操作系统名
$OSNAME
$^P指定当前调试值的内部变量
$PERLDB
$^T从新世纪开始算起,脚步本以秒计算的开始运行的时间
$BASETIME
$^W警告开关的当前值
$WARNING
$^XPerl二进制可执行代码的名字
$EXECUTABLE_NAME
$ARGV从默认的文件句柄中读取时的当前文件名

全局数组特殊变量

@ARGV传给脚本的命令行参数列表
@INC在导入模块时需要搜索的目录列表
@F命令行的数组输入

全局哈希特殊变量

%INC散列表%INC包含所有用do或require语句包含的文件.关键字是文件名,值是这个文件的路径
%ENV包含当前环境变量
%SIG信号列表及其处理方式

全局特殊文件句柄

ARGV遍历数组变量@ARGV中的所有文件名的特殊文件句柄
STDERR标准错误输出句柄
STDIN标准输入句柄
STDOUT标准输出句柄
DATA特殊文件句柄引用了在文件中 __END__ 标志后的任何内容包含脚本内容。或者引用一个包含文件中__DATA__ 标志后的所有内容,只要你在同一个包有读取数据,__DATA__ 就存在。
_ (下划线)特殊的文件句柄用于缓存文件信息(fstat、stat和lstat)。

全局特殊常量

__END__脚本的逻辑结束,忽略后面的文本。
__FILE__当前文件名
__LINE__当前行号
__PACKAGE__当前包名,默认的包名是main。

正则表达式特殊变量

$n包含上次模式匹配的第n个子串
$&前一次成功模式匹配的字符串
$MATCH
$`前次匹配成功的子串之前的内容
$PREMATCH
$'前次匹配成功的子串之后的内容
$POSTMATCH
$+与上个正则表达式搜索格式匹配的最后一个括号。例如:/Version: (.*)|Revision: (.*)/ && ($rev = $+);
$LAST_PAREN_MATCH

文件句柄特殊变量

$|如果设置为零,在每次调用函数write或print后,自动调用函数fflush,将所写内容写回文件
$OUTPUT_AUTOFLUSH
$%当前输出页号
$FORMAT_PAGE_NUMBER
$=当前每页长度。默认为 60。
$FORMAT_LINES_PER_PAGE
$-当前页剩余的行数
$FORMAT_LINES_LEFT
$~当前报表输出格式的名称。默认值是文件句柄名。
$FORMAT_NAME
$^当前报表输出表头格式的名称。默认值是带后缀"_TOP"的文件句柄名。
$FORMAT_TOP_NAME

Perl 读取 .ini 风格配置文件之 Config::IniFiles

如果一个 Perl 脚本中有太多参数需要配置,使用命令行参数的方式就不太合适了。我们可以使用配置文件的方式来配置这些参数,刚好 Config::IniFiles 模块给我们提供了解析 .ini 风格配置文件的方法。重要的是其他语言,如 Python,也有 .ini 风格配置文件解析的包,所以用该方法,便于程序的通用性。

Config::IniFiles

先看一看 .ini 风格配置文件格式:

[section]          #参数模块
Parameter=Value    #该模块某参数的值。配置文件使用'#'或者';'注释

使用方法:

use Config::IniFiles; #加载模块
my $cfg = new Config::IniFiles( -file => "/path/configfile.ini" ); #读取配置文件
my $value = $cfg->val('Section', 'Parameter'); #读取参数

一个更加方便的读取方式:

my %ini
tie %ini, 'Config::IniFiles', ( -file => "/path/configfile.ini" );
#该方法把参数读进了二维哈希(引用的引用),即$ini{Section}{Parameter}

详细用法请参考: http://search.cpan.org/~wadg/Config-IniFiles-2.38/IniFiles.pm