Perl 内部结构详解 -- PerlGuts Illustrated (4 HV)

HV

hash table是最复杂的数据结构,HV使用HE struct表示key/value结构,使用HEK表示key。


GvSTASH 当这个hash表示一个命名空间(模块),STASH指向Perl 语法树的一个节点,用来实现reset。(略过,未搞明白)

ARRAY 数组用于分配储存hash值,它的大小必须是2的n次方,当hash为空情况下,ARRAY为NULL。定位hash值在ARRAY中的位置只使用hash code的最后几位,ARRAY[HASH & MAX],稍后用一个例子说明。

FILL 表示ARRAY数组中有多少个不为NULL的节点。多个hash code可能共享ARRAY数组的一个节点,如上图所示。

MAX 表示ARRAY数组分配的空间减1,最小值为7,即使hash为空。

HE 包含三个指针,分别指向下一个节点,key和value。

HEK 包含hash code,key长度和key值。

RITER,EITER 这两个字段用来实现遍历hash 元素,RITER指向ARRAY的index,EITER指向HE的指针。当循环的时候,查找EITER->next值,为空的情况下RITER增1,直到ARRAY[RITER]不为空。初始情况RITER为-1,EITER 为空。

C:\>perl -MDevel::Peek -e "%a=0..5000; Dump \%a"
SV = RV(0x299120) at 0x299114
  REFCNT = 1
  FLAGS = (TEMP,ROK)
  RV = 0x182a9cc
  SV = PVHV(0x29e7bc) at 0x182a9cc
    REFCNT = 2
    FLAGS = (SHAREKEYS)
    ARRAY = 0x18d12c4  (0:2236,1:1341,2:417,3:85,4:14,5:3)
        (ARRAY中有2236个位置未占用,
         有1341个位置包含1个元素,
         有417个位置包含2个元素,
         有85个位置包含3个元素,
         有14个位置包含4个元素,
         有3个位置包含5个元素,
         1341+417+85+14+3=1860,正好是FILL的值
        )
    hash quality = 98.9%
    KEYS = 2501 (hash包含的元素个数)
    FILL = 1860 (hash code占用多少ARRAY位置,说明有多个值占用一个坑)
    MAX = 4095  (ARRAY分配了4096)
    RITER = -1
    EITER = 0x0
    Elt "1648" HASH = 0x2bb13004
    SV = IV(0x185a840) at 0x185a844
      REFCNT = 1
      FLAGS = (IOK,pIOK)
      IV = 1649
    Elt "3596" HASH = 0x4b03006
    SV = IV(0x18a4e38) at 0x18a4e3c
      REFCNT = 1
      FLAGS = (IOK,pIOK)
      IV = 3597
    Elt "3074" HASH = 0x1256006
    SV = IV(0x18beff0) at 0x18beff4
      REFCNT = 1
      FLAGS = (IOK,pIOK)
      IV = 3075
下边用一个例子说明RITER,EITER的变化过程。

取上边3个元素的hash code并与MAX 4095做& 运算,求得前三个元素在数组ARRAY中位置为4 6 6。

printf "%d\n",0x2bb13004 & 4095;
printf "%d\n",0x4b03006 & 4095;
printf "%d\n",0x1256006 & 4095;

output:
4
6
6
依次取hash 值并观察 RITER,EITER的变化。
use Devel::Peek;

%a = 0..5000;
#~ Dump \%a;

$i = 0;
while( my($a,$b) =each %a){
	last if $i++ > 4;
	print "$a $b\n";
	Dump \%a;
}
值输出,同上边相同:

1648 1649
3596 3597
3074 3075
2266 2267
1178 1179
RITER EITER在循环过程中ARRAY位置4 6 6与预计相同。

SV = RV(0x298f98) at 0x298f8c
  REFCNT = 1
  FLAGS = (TEMP,ROK)
  RV = 0x182a8cc
  SV = PVHV(0x29e59c) at 0x182a8cc
    REFCNT = 2
    FLAGS = (OOK,SHAREKEYS)
    ARRAY = 0x18d1164  (0:2236,5:3)
    hash quality = 98.9%
    KEYS = 2501
    FILL = 1860
    MAX = 4095
    RITER = 4
    EITER = 0x18a3c50
SV = RV(0x298f98) at 0x298f8c
  REFCNT = 1
  FLAGS = (TEMP,5:3)
    hash quality = 98.9%
    KEYS = 2501
    FILL = 1860
    MAX = 4095
    RITER = 6
    EITER = 0x18c3f48
SV = RV(0x298f98) at 0x298f8c
  REFCNT = 1
  FLAGS = (TEMP,5:3)
    hash quality = 98.9%
    KEYS = 2501
    FILL = 1860
    MAX = 4095
    RITER = 6
    EITER = 0x18ba91c
SV = RV(0x298f98) at 0x298f8c
  REFCNT = 1
  FLAGS = (TEMP,5:3)
    hash quality = 98.9%
    KEYS = 2501
    FILL = 1860
    MAX = 4095
    RITER = 9
    EITER = 0x18b1c4c
SV = RV(0x298f98) at 0x298f8c
  REFCNT = 1
  FLAGS = (TEMP,5:3)
    hash quality = 98.9%
    KEYS = 2501
    FILL = 1860
    MAX = 4095
    RITER = 11
    EITER = 0x1899dcc

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


1. 如何去重 #!/usr/bin/perl use strict; my %hash; while(<>){ chomp; print "$_n" unless
最近写了一个perl脚本,实现的功能是将表格中其中两列的数据进行拼凑,然后将拼凑后的数据用“|”连接在一起。表格内容如下: 员工号码员工姓名职位入职日期1001张三销售1980/12/17 0:00:
表的数据字典格式如下:如果手动写MySQL建表语句,确认麻烦,还不能保证书写一定正确。写了个Perl脚本,可快速构造MySQL脚本语句。脚本如下:#!/usr/bin/perluse strict;m
巡检类工作经常会出具日报,最近在原有日报的基础上又新增了一个表的数据量统计日报,主要是针对数据库中使用较频繁,数据量又较大的31张表。该日报有两个sheet组成,第一个sheet是数据填写,第二个sh
在实际生产环境中,常常需要从后台日志中截取报文,报文的形式类似于.........一个后台日志有多个报文,每个报文可由操作流水唯一确定。以前用AWK写过一个,程序如下:beginline=`awk &
最近写的一个perl程序,通过关键词匹配统计其出现的频率,让人领略到perl正则表达式的强大,程序如下:#!/usr/bin/perluse strict;my (%hash,%hash1,@arra
忍不住在 PerlChina 邮件列表中盘点了一下 Perl 里的 Web 应用框架(巧的是 PerlBuzz 最近也有一篇相关的讨论帖),于是乎,决定在我自己的 blog 上也贴一下 :) 原生 CGI/FastCGI 的 web app 对于较小的应用非常合适,但稍复杂一些就有些痛苦,但运行效率是最高的 ;) 如果是自己用 Perl 开发高性能的站,多推荐之。 Catalyst, CGI::A
bless有两个参数:对象的引用、类的名称。 类的名称是一个字符串,代表了类的类型信息,这是理解bless的关键。 所谓bless就是把 类型信息 赋予 实例变量。 程序包括5个文件: person.pm :实现了person类 dog.pm :实现了dog类 bless.pl : 正确的使用bless bless.wrong.pl : 错误的使用bless bless.cc : 使用C++语言实
gb2312转Utf的方法: use Encode; my $str = "中文"; $str_cnsoftware = encode("utf-8", decode("gb2312", $str));   Utf转 gb2312的方法: use Encode; my $str = "utf8中文"; $str_cnsoftware = encode("gb2312", decode("utf-8
  perl 计算硬盘利用率, 以%来查看硬盘资源是否存在IO消耗cpu资源情况; 部份代码参考了iostat源码;     #!/usr/bin/perl use Time::HiRes qw(gettimeofday); use POSIX; $SLEEPTIME=3; sub getDiskUtl() { $clock_ticks = POSIX::sysconf( &POSIX::_SC_
1 简单变量 Perl 的 Hello World 是怎么写的呢?请看下面的程序: #!/usr/bin/perl print "Hello World" 这个程序和前面 BASH 的 Hello World 程序几乎相同,只是第一行换成了 #!/usr/bin/perl ,还有显示的时候用的是 print,而不是 echo。有了前面 BASH 基础和 C 语言的基础,许多 Perl 的知识可以很
本文介绍Perl的Perl的简单语法,包括基本输入输出、分支循环控制结构、函数、常用系统调用和文件操作,以及进程管理几部分。 1 基本输入输出 在 BASH 脚本程序中,我们用 read var 来实现从键盘的输入,用 echo $var 来实现输出。那么在 Perl 中将有一点变化。Perl 中将标准输入用关键词 表示;标准输出用 表示,标准错误输出用 表示。故而从标准输入读取数据可以写成: $
正则表达式是 Perl 语言的一大特色,也是 Perl 程序中的一点难点,不过如果大家能够很好的掌握他,就可以轻易地用正则表达式来完成字符串处理的任务,当然在 CGI 程序设计中就更能得心应手了。下面我们列出一些正则表达式书写时的一些基本语法规则。 1 正则表达式的三种形式 首先我们应该知道 Perl 程序中,正则表达式有三种存在形式,他们分别是: 匹配:m/<regexp>/ (还可以简写为 /
在学习Perl和Shell时,有很多人可能会问这样一个问题,到底先学习哪个或者学习哪个更好! 每个人都有自己的想法,以下是个人愚见,请多多指教! Perl是larry wall为解决日常工作中的一个编程问题而产生的,它最初的主要功能是用于分析基于文本的数据和生成这些数据的统计和结果;尽管初衷很简单,但是后来发展了很多特点: 1、Perl是一种借鉴了awk、C、sed、shell、C++、Java等
Perl 有很多命令行参数. 通过它, 我们有机会写出更简单的程序. 在这篇文章里我们来了解一些常用的参数. (重点提示:在window下执行命令行程序的方式为 : perl -e "some code", 注意:是双引号啊,不是单引号,linux下执行时单引号) Safety Net Options 在使用 Perl 尝试一些聪明( 或 stupid) 的想法时, 错误难免会发生. 有经验的 P
转自: http://bbs.chinaunix.net/thread-1191868-1-1.html# 让你的perl代码看起来更像perl代码,而不是像C或者BASIC代码,最好的办法就是去了解perl的内置变量。perl可以通过这些内置变量可以控制程序运行时的诸多方面。 本文中,我们一起领略一下众多内置变量在文件的输入输出控制上的出色表现。 行计数 我决定写这篇文章的一个原因就是,当我发现
2009-02-02 13:07 #!/usr/bin/perl # D.O.M TEAM - 2007 # anonyph; arp; ka0x; xarnuz # 2005 - 2007 # BackConnectShell + Rootlab t00l # priv8! # 3sk0rbut0@gmail.com # # Backconnect by data cha0s (modifica
转自: http://bbs.chinaunix.net/thread-1191868-1-1.html# 让你的perl代码看起来更像perl代码,而不是像C或者BASIC代码,最好的办法就是去了解perl的内置变量。perl可以通过这些内置变量可以控制程序运行时的诸多方面。 本文中,我们一起领略一下众多内置变量在文件的输入输出控制上的出色表现。 行计数 我决定写这篇文章的一个原因就是,当我发现
黑莓 手机 屏幕发展历程对比 blackberry 各型号屏幕大小   黑莓手 机 一直在不断发展且新机型 也在不断上市. 因此,不同黑莓机型的屏幕分辨率也在不断变化着. 总的来说,屏幕分辨率一直在提高并且越来越清晰.我们对所有的黑莓 机型的屏幕分辨率做了个对比.~51blackberry ~com     可能大家特别感兴趣是新发布的黑莓机型,它的分辨率也是黑莓 机型中前所未有的.   黑莓 b
      公司里没有我用惯的UltraEdit的lisence了, 只能无奈转向开源的Notepad++, 找了半天才知道配置运行Perl的办法。         1,用Notepad++打开.pl文件,         2, F5或者Run->Run,打开运行窗口,在下面的框框里输入:Perl -w "$(FULL_CURRENT_PATH)", 然后Save,保存成一个命令就行,名字比如叫R