数组

October 25, 2013 @ 03:05 PM

简单创建单词数组

qw 操作符使创建数组更容易。它意为将引用空白分成列表。

  1. # Perl 5
  2. my @stooges = qw( Larry Curly Moe Iggy );
  3. # or
  4. my @stooges = qw(
  5. Larry
  6. Curly
  7. Moe
  8. Iggy
  9. );

在 Perl 6 中,qw 更简洁:

  1. my @stooges = < Larry Curly Moe Iggy >;
  2. # or
  3. my @stooges = <
  4. Larry
  5. Curly
  6. Moe
  7. Iggy
  8. >;

元素不做内插:

  1. my @array = qw( $100,000 ); # Perl 5
  2. my @array = < $100,000 >; # Perl 6

@array 的单一元素是“$100,000”。

利用数字值访问数组

要获得数组的单个标量,使用 []$ 印记。在 Perl 中所有数组都从 0 开始。

  1. $stooges[1] # Curly

数组也能使用负偏移从尾端访问。

  1. $stooges[-1] # Iggy

读取不存在的元素将得到 undef

  1. $stooges[47] # undef

数组的长度是标量值

将数组放到标量环境能得到其长度。一些人也喜欢直接使用 scalar

  1. my $stooge_count = scalar @stooges; # 4
  2. my $stooge_count = @stooges; # 4

不要使用 length 来获得数组的长度。那只会得到字符串的长度。

  1. my $moe_length = length $stooges[@stooges/2];
  2. length $stooges[2];
  3. length 'Moe';
  4. 3;

数组没有边界

数组没有任何有限的大小,且不必预先声明。数组按需更改其大小。

数组也不稀疏。下列代码创建 10,000 个元素的数组。

  1. my @array = ();
  2. $array[10000] = 'x';

@array 现在具有 10,001 个元素(0-10,000)。它只填入了一个,其他 10,000个都是 undef

数组会平展,但不会嵌套

不像 PHP,当数组合并时会平展开为一个大列表。

  1. my @sandwich = ( 'PB', 'J' );
  2. my @other_sandwich = ( 'B', 'L', 'T' );
  3. my @ingredients = ( @other_sandwich, @sandwich );
  4. # ( 'B', 'L', 'T', 'PB', 'J' )

这意味着你不能将一个数组包含到另一个数组或哈希中。那样的话,你将需要使用引用。

列表能带扩展的逗号(,)

Perl 最好的特性之一是在列表的尾端能带一个扩展的逗号。例如:

  1. my @array = (
  2. 'This thing',
  3. 'That thing',
  4. );

当你编辑代码时,这使添加或者删除项目十分容易,因为你无需将最后一个项目作为特殊情况处理。

  1. my @array = (
  2. 'This thing',
  3. 'That thing',
  4. 'The other thing',
  5. );

像队列和堆栈一样使用数组

shift 从数组开头移除元素。

  1. my $next_customer = shift @customers;

unshift 将元素添加到数组的开头。

  1. unshift @customers, $line_jumper;

push 将元素添加到数组的结尾。

  1. push @customers, $dio; # The last in line

pop 从数组的结尾移除元素。

  1. my $went_home = pop @customers;

利用数组分片提取数组的部分元素

数组分片只是使用多个索引访问数组。

  1. my @a = 'a'..'z'; # 26 letters
  2. # a, e, i, o, u...
  3. my @vowels = @a[0,4,8,14,20];
  4. # And sometimes "y"
  5. push( @vowels, $a[-2] ) if rand > .5;

注意:当访问数组分片时,印记是 @,不是$。因为你返回的是数组,而不是标量。新手常范的错误是使用 @ 印记而不是 $访问一个数组元素。那将返回分片,实则是列表。

  1. # WRONG: Returns a 1-element list, or 1 in scalar context
  2. my $z = @a[-1];
  3. # RIGHT: Returns a single scalar element
  4. my $z = $a[-1];

利用数组分片来分配数组块

你能够将数组分片作为左值(lvalues),即能赋值给等号左边的值。

  1. # Replace vowels with uppercase versions
  2. @a[0,4,8,14,20] = qw( A E I O U );
  3. # Swap first and last elements
  4. @a[0,-1] = @a[-1,0];

注意:分片的左边和右边大小必须相同。在等号右边缺少的值将使用 undef 换掉。

利用 splice 就地修改数组

splice让你拼接数组为另一个数组。让我们来看几个常见的错误做法,那应该能说明它的有用性。

  1. my @a = qw(Steve Stu Stan);
  2. $a[1] = ['Stewart', 'Zane'];
  3. # @a = ('Steve', ARRAY(0x841214c), 'Stan')
  4. # Memory address to an array reference
  5. my @a = qw(Steve Stu Stan);
  6. my @b = qw(Stewart Zane);
  7. $a[1] = @b;
  8. # @a = ('Steve', 2, 'Stan')
  9. # Returns a scalar reference, the length of @b

现在使用 splice

  1. @a = qw(Steve Stu Stan);
  2. splice @a, 1, 1, 'Stewart', 'Zane';
  3. # @a = ('Steve', 'Stewart', 'Zane', 'Stan')
  4. # This is just what we wanted

让我们分解 splice 的参数列表:首先,我们命名要操作的数组(@a);其次,我们定义偏移(离我们想拼接的列表开始有多远);第三,我们指定拼接的长度;最后,我们列出想要插入的项目。

如果遇到错误,那么通过 perldoc -f splice 来了解详情。

利用 map 处理数组

map 本质上是返回列表的 foreach 循环。

你可以使用它将数组转换成哈希:

  1. my @array = ( 1, 2, 3, 4, 5 );
  2. my %hash = map { $_ => $_ * 9 } @array;
  3. # %hash = ( 1 => 9, 2 => 18, 3 => 27, 4 => 36, 5 => 45 )

或者变成列表:

  1. my @array = ( 'ReD', 'bLue', 'GrEEN' );
  2. my @fixed_array = map(ucfirst, map(lc, @array)); # note the nested 'map' functions
  3. # @fixed_array = ( 'Red', 'Blue', 'Green' )

注意:如果你修改 $_,源数据也会被修改。这样,上例可以修改成:

  1. my @array = ( 'ReD', 'bLue', 'GrEEN' );
  2. map { $_ = ucfirst lc $_ } @array;
  3. # @array = ( 'Red', 'Blue', 'Green' )

利用 grep 从数组选择项目

grep 本质上也是返回列表的 foreach 循环。但它不像map,它只返回导致条件为真的元素。

  1. my @array = ( 0, 1, 2, 3, 4, 5 );
  2. my @new_array = grep { $_ * 9 } @array;
  3. # @new_array = ( 1, 2, 3, 4, 5 );

它也将如 map 一样修改源数据:

  1. my @array = ( 0, 1, 2, 3, 4, 5 );
  2. my @new_array = grep { $_ *= 9 } @array;
  3. # @array = ( 0, 9, 18, 27, 36, 45 );
  4. # @new_array = ( 9, 18, 27, 36, 45 );

我们也可以传递正则表达式给 grep。在本例中,我们只想把包含 Doe的人放到新数组:

  1. my @people = (
  2. 'John Doe',
  3. 'Jane Doe',
  4. 'Joe Sixpack',
  5. 'John Q. Public',
  6. );
  7. my @does = grep { $_ =~ /\bDoe$/ } @people;
  8. # @does = ('John Doe', 'Jane Doe');

或更短的:

  1. my @does = grep { /\bDoe$/ } @people;