REGEXP_REPLACE 函数

转载自:http://blog.csdn.net/gxftry1st/article/details/22489275

REGEXP_REPLACE函数

让我们首先看一下传统的REPLACESQL函数,它把一个字符串用另一个字符串来替换。假设您的数据在正文中有不必要的空格,您希望用单个空格来替换它们。利用REPLACE函数,您需要准确地列出您要替换多少个空格。然而,多余空格的数目在正文的各处可能不是相同的。下面的示例在Joe和Smith之间有三个空格。REPLACE函数的参数指定要用一个空格来替换两个空格。在这种情况下,结果在原来的字符串的Joe和Smith之间留下了一个额外的空格。

SELECTREPLACE('JoeSmith','','')
ASreplace
FROMdual
REPLACE
---------
JoeSmith

REGEXP_REPLACE函数把替换功能向前推进了一步,其语法在表9中列出。以下查询用单个空格替换了任意两个或更多的空格。()子表达式包含了单个空格,它可以按{2,}的指示重复两次或更多次。

表9:REGEXP_REPLACE函数

语法

说明

REGEXP_REPLACE(source_string,pattern
[,replace_string[,position
[,occurrence,[match_parameter]]]])

该函数用一个指定的replace_string来替换匹配的模式,从而允许复杂的"搜索并替换"操作。



SELECTREGEXP_REPLACE('JoeSmith',
'(){2,}','')
ASRX_REPLACE
FROMdual
RX_REPLACE
----------
JoeSmith

后向引用

正则表达式的一个有用的特性是能够存储子表达式供以后重用;这也被称为后向引用(在表10中对其进行了概述)。它允许复杂的替换功能,如在新的位置上交换模式或显示重复出现的单词或字母。子表达式的匹配部分保存在临时缓冲区中。缓冲区从左至右进行编号,并利用\digit符号进行访问,其中digit是1到9之间的一个数字,它匹配第digit个子表达式,子表达式用一组圆括号来显示。

接下来的例子显示了通过按编号引用各个子表达式将姓名EllenHildiSmith转变为Smith,EllenHildi。

SELECTREGEXP_REPLACE(
'EllenHildiSmith',
'(.*)(.*)(.*)','\3,\1\2')
FROMdual
REGEXP_REPLACE('EL
------------------
Smith,EllenHildi

该SQL语句显示了用圆括号括住的三个单独的子表达式。每一个单独的子表达式包含一个匹配元字符(.),并紧跟着*元字符,表示任何字符(除换行符之外)都必须匹配零次或更多次。空格将各个子表达式分开,空格也必须匹配。圆括号创建获取值的子表达式,并且可以用\digit来引用。第一个子表达式被赋值为\1,第二个\2,以此类推。这些后向引用被用在这个函数的最后一个参数(\3,\1\2)中,这个函数有效地返回了替换子字符串,并按期望的格式来排列它们(包括逗号和空格)。表11详细说明了该正则表达式的各个组成部分。

后向引用对替换、格式化和代替值非常有用,并且您可以用它们来查找相邻出现的值。接下来的例子显示了使用REGEP_SUBSTR函数来查找任意被空格隔开的重复出现的字母数字值。显示的结果给出了识别重复出现的单词is的子字符串。

SELECTREGEXP_SUBSTR(
'Thefinaltestisistheimplementation',
([[:alnum:]]+)([[:space:]]+)\1')ASsubstr
FROMdual
SUBSTR
------
isis

匹配参数选项

您可能已经注意到了正则表达式操作符和函数包含一个可选的匹配参数。这个参数控制是否区分大小写、换行符的匹配和保留多行输入。

正则表达式的实际应用

您不仅可以在队列中使用正则表达式,还可以在使用SQL操作符或函数的任何地方(比如说在PL/SQL语言中)使用正则表达式。您可以编写利用正则表达式功能的触发器,以验证、生成或提取值。

接下来的例子演示了您如何能够在一次列检查约束条件中应用REGEXP_LIKE操作符来进行数据验证。它在插入或更新时检验正确的社会保险号码格式。如123-45-6789和123456789之类格式的社会保险号码对于这种列约束条件是可接受的值。有效的数据必须以三个数字开始,紧跟着一个连字符,再加两个数字和一个连字符,最后又是四个数字。另一种表达式只允许9个连续的数字。竖线符号(|)将各个选项分开。

ALTERTABLEstudents

ADDCONSTRAINTstud_ssn_ckCHECK

(REGEXP_LIKE(ssn,

'^([[:digit:]]{3}-[[:digit:]]{2}-[[:digit:]]{4}|[[:digit:]]{9})$'))

由^和$指示的开头或结尾的字符都是不可接受的。确保您的正则表达式没有分成多行或包含任何不必要的空格,除非您希望格式如此并相应地进行匹配。表12说明了该正则表达式示例的各个组成部分。

将正则表达式与现有的功能进行比较

正则表达式有几个优点优于常见的LIKE操作符和INSTR、SUBSTR及REPLACE函数的。这些传统的SQL函数不便于进行模式匹配。只有LIKE操作符通过使用%和_字符匹配,但LIKE不支持表达式的重复、复杂的更替、字符范围、字符列表和POSIX字符类等等。此外,新的正则表达式函数允许检测重复出现的单词和模式交换。这里的例子为您提供了正则表达式领域的一个概览,以及您如何能够在您的应用程序中使用它们。

实实在在地丰富您的工具包

因为正则表达式有助于解决复杂的问题,所以它们是非常强大的。正则表达式的一些功能难于用传统的SQL函数来仿效。当您了解了这种稍显神秘的语言的基础构建程序块时,正则表达式将成为您的工具包的不可缺少的一部分(不仅在SQL环境下也在其它的编程语言环境下)。为了使您的各个模式正确,虽然尝试和错误有时是必须的,但正则表达式的简洁和强大是不容置疑的。

AliceRischert(ar280@yahoo.com)是哥伦比亚大学计算机技术与应用系的数据库应用程序开发和设计方向的主席。她编写了OracleSQL交互手册第2版(PrenticeHall,2002)和即将推出的OracleSQL示例(PrenticeHall,2003)。Rischert拥有超过15年的经验在财富100强公司内担任数据库设计师、DBA和项目主管,并且她自从Oracleversion5起就一直使用Oracle产品。

表1:定位元字符

元字符

说明

^

使表达式定位至一行的开头

$

使表达式定位至一行的末尾

^[]放在方括号外表示:首字母,[^] 放在方括号内表示,非,

表2:量词或重复操作符

量词

*

匹配0次或更多次

?

匹配0次或1次

+

匹配1次或更多次

{m}

正好匹配m次

{m,}

至少匹配m次

至少匹配m次但不超过n次

表3:预定义的POSIX字符类

字符类

[:alpha:]

字母字符

[:lower:]

小写字母字符

[:upper:]

大写字母字符

[:digit:]

数字

[:alnum:]

字母数字字符

[:space:]

空白字符(禁止打印),如回车符、换行符、竖直制表符和换页符

[:punct:]

标点字符

[:cntrl:]

控制字符(禁止打印)

[:print:]

可打印字符

表4:表达式的替换匹配和分组

|

替换

分隔替换选项,通常与分组操作符()一起使用

()

分组

将子表达式分组为一个替换单元、量词单元或后向引用单元(参见"后向引用"部分)

[char]

字符列表

表示一个字符列表;一个字符列表中的大多数元字符(除字符类、^和-元字符之外)被理解为文字

表5:REGEXP_LIKE操作符

语法

REGEXP_LIKE(source_string,match_parameter])

source_string支持字符数据类型(CHAR、VARCHAR2、CLOB、NCHAR、NVARCHAR2和NCLOB,但不包括LONG)。pattern参数是正则表达式的另一个名称。match_parameter允许可选的参数(如处理换行符、保留多行格式化以及提供对区分大小写的控制)。

表6:REGEXP_INSTR函数

REGEXP_INSTR(source_string,start_position
[,occurrence
[,return_option
[,match_parameter]]]])

该函数查找pattern,并返回该模式的第一个位置。您可以随意指定您想要开始搜索的start_position。occurrence参数默认为1,除非您指定您要查找接下来出现的一个模式。return_option的默认值为0,它返回该模式的起始位置;值为1则返回符合匹配条件的下一个字符的起始位置。

表7:5位数字加4位邮政编码表达式的说明

必须匹配的空白

POSIX数字类

]

字符列表的结尾

{5}

字符列表正好重复出现5次

(

子表达式的开头

-

一个文字连字符,因为它不是一个字符列表内的范围元字符

[

字符列表的开头

POSIX[:digit:]类

{4}

字符列表正好重复出现4次

)

结束圆括号,结束子表达式

?量词匹配分组的子表达式0或1次,从而使得4位代码可选

定位元字符,指示行尾

表8:REGEXP_SUBSTR函数

REGEXP_SUBSTR(source_string,position[,match_parameter]]])

REGEXP_SUBSTR函数返回匹配模式的子字符串。

表9:REGEXP_REPLACE函数

该函数用一个指定的replace_string来替换匹配的模式,从而允许复杂的"搜索并替换"操作。

表10:后向引用元字符

\digit

反斜线

紧跟着一个1到9之间的数字,反斜线匹配之前的用括号括起来的第digit个子表达式。
(注意:反斜线在正则表达式中有另一种意义,取决于上下文,它还可能表示Escape字符。

表11:模式交换正则表达式的说明

正则表达式项目

第一个子表达式的开头

.

匹配除换行符之外的任意单字符

重复操作符,匹配之前的.元字符0到n次

第一个子表达式的结尾;匹配结果在\1
中获取(在这个例子中,结果为Ellen。)

必须存在的空白

第二个子表达式的开头

匹配除换行符之外的任意单个字符

第二个子表达式的结尾;匹配结果在\2
中获取(在这个例子中,结果为Hildi。)

空白

第三个子表达式的开头tr>

第三个子表达式的结尾;匹配结果在\3
中获取(在这个例子中,结果为Smith。)

表12:社会保险号码正则表达式的说明

行首字符(正则表达式在匹配之前不能有任何前导字符。)

开始子表达式并列出用|元字符分开的可替换选项

{3}

字符列表正好重复出现3次

连字符

{2}

字符列表正好重复出现2次

另一个连字符

替换元字符;结束第一个选项并开始下一个替换表达式

{9}

字符列表正好重复出现9次

结束圆括号,结束用于替换的子表达式组

定位元字符,指示行尾;没有额外的字符能够符合模式

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 dio@foxmail.com 举报,一经查实,本站将立刻删除。

相关推荐


文章浏览阅读773次,点赞6次,收藏9次。【代码】c# json字符串转Oracle的insert into的小程序。
文章浏览阅读8.7k次,点赞2次,收藏17次。此现象一般定位到远端的监听服务来找问题,在远端查看监听服务状态(具体看下面的解决方案会详细呈现),服务是否开启,另外查看监听端点概要是否存在host未指向到计算名的,如无直接进入监听配置文件listener.ora内添加指向即可。2、查看监听服务状态 lsnrctl status,右边为远端端点状态,未添加host指向到计算名;1、本地及远端安装好Oracle并配置好连接,Oracle服务和监听已启动;1、远程Oracle数据库:Oracle11g R2。或者进入下述服务手动重启。,再进行远程连接即可。_ora-12541:tns:无监听程序
文章浏览阅读2.8k次。mysql脚本转化为oracle脚本_mysql建表语句转oracle
文章浏览阅读2.2k次。cx_Oracle报错:cx_Oracle DatabaseError: DPI-1047: Cannot locate a 64-bit Oracle Client library_cx_oracle.databaseerror: dpi-1047: cannot locate a 64-bit oracle client libr
文章浏览阅读1.1k次,点赞38次,收藏35次。本文深入探讨了Oracle数据库的核心要素,包括体系结构、存储结构以及各类参数。通过解析Oracle数据库的体系结构,读者可以深入了解其内部组成和工作原理。存储结构部分介绍了数据在Oracle中的存储方式,从表空间到数据文件的层层逻辑。最后,我们深入探讨了Oracle数据库中各类参数的作用和配置方法,帮助读者更好地理解和优化数据库性能。本文旨在帮助读者全面理解Oracle数据库的运作机制,为其在实践中的应用提供基础和指导。
文章浏览阅读1.5k次。默认自动收集统计信息的时间为晚上10点(周一到周五,4个小时),早上6点(周六,周日,20个小时)由于平时默认每天只收集4小时,时间有点短了,改成每天可收集8小时。oracle 18c中默认是打开的。查看当前自动收集统计信息的时间。_oracle自动收集统计信息
文章浏览阅读929次,点赞18次,收藏20次。只有assm(Automatic Shared Memory Management)模式可以使用大页,需要关闭amm(Memory Manager Process)HugePages_Free: 306 (空闲306页,已使用306-306=0页)防止oracle使用的内存交换,所以设置的大小与oracle配置的sga、pga相关。HugePages_Rsvd: 0 (操作系统承诺给oracle预留的页数)HugePages_Total: 306 (总共306页)_oracle11g 大页
文章浏览阅读801次。例如:10046:0,1,4,8,12。默认redo日志有三个,大小为50M,循环覆盖使用。redo log再覆盖之前,会被归档,形成归档日志。答:不同事件,不同级别。trace的不同级别?_oracle 日志
文章浏览阅读4.2k次,点赞84次,收藏77次。主要讲解MySQL中SQL的DDL语句,其中包括对数据库和表的一系列操作。_sql ddl 新增字段 mysql
文章浏览阅读1.1k次。ON DEMAND:仅在该物化视图“需要”被刷新了,才进行刷新(REFRESH),即更新物化视图,以保证和基表数据的一致性;ON COMMIT:一旦基表有了COMMIT,即事务提交,则立刻刷新,立刻更新物化视图,使得数据和基表一致。Method =>'C',物化视图有三种刷新方式:COMPLETE、FAST和FORCE。物化视图会占用空间,一半可用于大量数据查询时,减缓主表的查询压力使用。例如创建一个物化视图,让对接单位查询。_oracle物化视图定时刷新
文章浏览阅读713次,点赞21次,收藏18次。1.背景介绍在当今的大数据时代,数据量越来越大,传统的关系型数据库已经无法满足业务需求。因此,NoSQL数据库技术迅速崛起,成为企业和开发者的首选。Oracle NoSQL Database是Oracle公司推出的一款分布式NoSQL数据库产品,具有高性能、高可用性和易于扩展等特点。在本文中,我们将深入了解Oracle NoSQL Database的集成与开发者工具,帮助您更好地掌握这款产品的...
文章浏览阅读2.5k次,点赞2次,收藏4次。今天遇见一个问题需要将字段中包含中文字符串的筛选出来。_oracle查询包含中文字符
文章浏览阅读802次。arcmap 在oracle删除表重新创建提示表名存在解决放啊
文章浏览阅读4.3k次,点赞2次,收藏4次。Oracle连接数据库提示 ORA-12638:身份证明检索失败_ora-12638
文章浏览阅读3.4k次,点赞6次,收藏25次。etc/profile是一个全局配置文件,所有用户登录都会使用该文件构建用户环境。与windows配置环境变量是一个道理。选择Linux系统,找到适合自己系统的安装包,我的是CentOS 8 x64。接下来需要登陆Oracle账户才能下载,无账户的可以自己注册一个。Linux中export 命令用于设置或显示环境变量。模式,利用上下键到文档最后,添加以下代码。出现如图所示版本号字样,则说明安装成功。点击下载,勾选1,点击2。记住完整路径用于后面配置。找到Java并点击进去。往下翻,找到Java8。_linux安装jdk1.8
文章浏览阅读2.4w次,点赞26次,收藏109次。JDK 是的简称,也就是 Java 开发工具包。JDK 是整个 Java 的核心,其中JDK包含了 Java 运行环境(Java Runtime Envirnment,简称 JRE),Java 工具(比如 javac、java、javap 等等),以及 Java 基础类库(比如 rt.jar)。最主流的 JDK 是Oracle公司发布的 JDK,除了 Oracle JDK(商业化,更稳定)之外,还有很多公司和组织开发了属于自己的 JDK,比较有名的有IBM JDK(更适合 IBM) 和OpenJDK。_jdk安装教程
文章浏览阅读7.5w次。出现 “java.sql.SQLNonTransientConnectionException:Could not create connection to database server” 的错误通常是由于无法连接到数据库服务器引起的。_java.sql.sqlnontransientconnectionexception: could not create connection to
文章浏览阅读849次,点赞7次,收藏10次。在ClickHouse中创建用户、数据库并进行权限分配是一个重要的管理任务,它涉及到安全性和访问控制。下面是一个基本的指南来帮助你完成这些操作:1. 创建数据库首先,需要创建一个数据库。使用以下命令:CREATE DATABASE IF NOT EXISTS your_database_name;将 your_database_name 替换为你想要的数据库名。2. 创建用户接下来,创建一个新用户。使用以下命令:CREATE USER your_username IDENTIFIED WIT_在clickhouse中如何创建用户 赋权
文章浏览阅读1.2k次,点赞53次,收藏39次。本文是一篇关于Oracle数据库安装和使用的博文摘要。作者以轻松幽默的笔调介绍了自己在实验中掌握的Oracle数据库基本操作,包括使用组件查看命令、配置数据库监听器等。作者也分享了在实验中遇到的一些有趣问题,如SQL语句缺少分号导致的意外错误。此外,作者还强调了登录sys用户和启动实例加载数据库的注意事项,并鼓励读者面对挑战时保持乐观,不断提升自己的能力。整体风格风趣严谨,引人入胜。
文章浏览阅读820次,点赞17次,收藏16次。KingbaseES、xml、dbms_xmlgen、SETSKIPROWS、人大金仓、KingbaseES兼容Oracle包dbms_xmlgen的功能是通过SQL查询将关系表中数据转化为XML文档。转化方式一共有两种:(1)通过查询字符串直接转化。(2)通过上下文句柄转化。对于通过查询字符串直接转化的方式,无法跳过若干行进行查询,只能直接将表格中的所有数据转化为XML文档。