PostgreSQL可以在任何地方开始使用数组下标.
考虑这个创建一个包含3个元素的数组的示例,其中包含5到7的下标:
考虑这个创建一个包含3个元素的数组的示例,其中包含5到7的下标:
SELECT ('[5:7]={1,2,3}'::int[]);
返回:
[5:7]={1,3}
例如,你得到第一个元素的含义
SELECT ('[5:7]={1,3}'::int[])[5];
我想规范化任何给定的1维数组以从数组下标1开始.
我能想到的最好的:
SELECT ('[5:7]={1,3}'::int[])[array_lower('[5:7]={1,3}'::int[],1):array_upper('[5:7]={1,1)]
或者,同样,更容易阅读:
WITH x(a) AS ( SELECT '[5:7]={1,3}'::int[] ) SELECT a[array_lower(a,1):array_upper(a,1)] FROM x
你知道更简单/更快或更优雅的方式吗?
基准
为了测试性能,我提出了这个快速基准测试.
表有100k行,随机长度在1和11之间的简单整数数组:
CREATE TEMP TABLE t (a int[]); INSERT INTO t -- now with actually varying subscripts SELECT ('[' || g%10 || ':' || 2*(g%10) || ']={1' || repeat(','||g::text,g%10) || '}')::int[] FROM generate_series(1,100000) g; EXPLAIN ANALYZE SELECT substring(a::text,'{.*$')::int[] -- Total runtime: 949.304 ms -- a[-2147483648:2147483647] -- Total runtime: 283.877 ms -- a[array_lower(a,1)] -- Total runtime: 311.545 ms FROM t
所以,是的,@ Daniel的想法稍快一些.
@Kevin的文字转换也有效,但不会赚很多分.
还有其他想法吗?
有一个更简单的方法是丑陋的,但我认为技术上正确:从数组中提取最大可能的切片,而不是具有计算边界的精确切片.
它避免了两个函数调用.
它避免了两个函数调用.
例:
select ('[5:7]={1,3}'::int[])[-2147483648:2147483647];
结果是:
int4 --------- {1,3}
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。