在 Oracle 中使用正則表達式

作者: killkill  來源: 博客園  發布時間: 2010-09-07 11:24  閱讀: 1330 次  推薦: 1   原文鏈接   [收藏]  

Oracle使用正則表達式離不開這4個函數:

1。regexp_like

2。regexp_substr

3。regexp_instr

4。regexp_replace

看函數名稱大概就能猜到有什么用了。

 

regexp_like 只能用于條件表達式,和 like 類似,但是使用的正則表達式進行匹配,語法很簡單:

regexp_substr 函數,和 substr 類似,用于拾取合符正則表達式描述的字符子串,語法如下:


regexp_instr 函數,和 instr 類似,用于標定符合正則表達式的字符子串的開始位置,語法如下:

regexp_replace 函數,和 replace 類似,用于替換符合正則表達式的字符串,語法如下:

這里解析一下幾個參數的含義:

1。source_char,輸入的字符串,可以是列名或者字符串常量、變量。

2。pattern,正則表達式。

3。match_parameter,匹配選項。

        取值范圍: i:大小寫不敏感; c:大小寫敏感;n:點號 . 不匹配換行符號;m:多行模式;x:擴展模式,忽略正則表達式中的空白字符。

4。position,標識從第幾個字符開始正則表達式匹配。

5。occurrence,標識第幾個匹配組。

6。replace_string,替換的字符串。

 

說了一堆文縐縐的,現在開始實例演練了,在此之前先建好一個表。

create table tmp as 
with data as (
  select 'like' as id ,'a9999' as str from dual union all
  select 'like'       ,'a9c'          from dual union all
  select 'like'       ,'A7007'        from dual union all
  select 'like'       ,'123a34cc'     from dual union all 
  select 'substr'     ,'123,234,345'  from dual union all
  select 'substr'     ,'12,34.56:78'  from dual union all
  select 'substr'     ,'123456789'    from dual union all
  select 'instr'      ,'192.168.0.1'  from dual union all
  select 'replace'    ,'(020)12345678' from dual union all
  select 'replace'    ,'001517729C28' from dual  
)
select * from data ;

select * from tmp ;
ID      STR
------- -------------
like    a9999
like    a9c
like    A7007
like    123a34cc
substr  123,234,345
substr  12,34.56:78
substr  123456789
instr   192.168.0.1
replace (020)12345678
replace 001517729C28

 

regexp_like 例子:

select str from tmp where id='like' and regexp_like(str,'A\d+','i'); -- 'i' 忽略大小寫
STR
-------------
a9999
a9c
A7007
123a34cc

select str from tmp where id='like' and regexp_like(str, 'a\d+');
STR
-------------
a9999
a9c
123a34cc

select str from tmp where id='like' and regexp_like(str,'^a\d+');
STR
-------------
a9999
a9c

select str from tmp where id='like' and regexp_like(str,'^a\d+$');
STR
-------------
a9999

 

regexp_substr 例子:

col str format a15;
select 
  str,
  regexp_substr(str,'[^,]+')     str,
  regexp_substr(str,'[^,]+',1,1) str,
  regexp_substr(str,'[^,]+',1,2) str,  -- occurrence 第幾個匹配組
  regexp_substr(str,'[^,]+',2,1) str   -- position 從第幾個字符開始匹配
from tmp
where id='substr';
STR             STR             STR             STR             STR
--------------- --------------- --------------- --------------- ---------------
123,234,345     123             123             234             23
12,34.56:78     12              12              34.56:78        2
123456789       123456789       123456789                       23456789

select 
  str, 
  regexp_substr(str,'\d')        str,
  regexp_substr(str,'\d+'  ,1,1) str,
  regexp_substr(str,'\d{2}',1,2) str,
  regexp_substr(str,'\d{3}',2,1) str 
from tmp      
where id='substr';
STR             STR             STR             STR             STR
--------------- --------------- --------------- --------------- ---------------
123,234,345     1               123             23              234
12,34.56:78     1               12              34
123456789       1               123456789       34              234


select regexp_substr('123456789','\d',1,level) str  --取出每位數字,有時這也是行轉列的方式
from dual
connect by level<=9
STR
---------------
1
2
3
4
5
6
7
8
9

 

regex_instr 例子:

col ind format 9999;
select
  str, 
  regexp_instr(str,'\.'    ) ind ,
  regexp_instr(str,'\.',1,2) ind ,
  regexp_instr(str,'\.',5,2) ind
from tmp where id='instr';
STR               IND   IND   IND
--------------- ----- ----- -----
192.168.0.1         4     8    10
    
select 
  regexp_instr('192.168.0.1','\.',1,level) ind ,  -- 點號. 所在的位置
  regexp_instr('192.168.0.1','\d',1,level) ind    -- 每個數字的位置
from dual 
connect by level <=  9
  IND   IND
----- -----
    4     1
    8     2
   10     3
    0     5
    0     6
    0     7
    0     9
    0    11
    0     0

 

regex_replace 例子:

select 
  str,
  regexp_replace(str,'020','GZ') str,
  regexp_replace(str,'(\d{3})(\d{3})','<\2\1>') str -- 將第一、第二捕獲組交換位置,用尖括號標識出來
from tmp
where id='replace';  
STR             STR             STR
--------------- --------------- ---------------
(020)12345678   (GZ)12345678    (020)<456123>78
001517729C28    001517729C28    <517001>729C28

 

綜合應用的例子:

col row_line format a30;
with sudoku as (
  select '020000080568179234090000010030040050040205090070080040050000060289634175010000020' as line
  from dual
),
tmp as (
  select regexp_substr(line,'\d{9}',1,level) row_line,
  level col
  from sudoku
  connect by level<=9
)
select regexp_replace( row_line ,'(\d)(\d)(\d)(\d)(\d)(\d)(\d)(\d)(\d)','\1 \2 \3 \4 \5 \6 \7 \8 \9') row_line
from tmp

ROW_LINE
------------------------------
0 2 0 0 0 0 0 8 0
5 6 8 1 7 9 2 3 4
0 9 0 0 0 0 0 1 0
0 3 0 0 4 0 0 5 0
0 4 0 2 0 5 0 9 0
0 7 0 0 8 0 0 4 0
0 5 0 0 0 0 0 6 0
2 8 9 6 3 4 1 7 5
0 1 0 0 0 0 0 2 0
1
0
 
 
 

文章列表

arrow
arrow
    全站熱搜
    創作者介紹
    創作者 大師兄 的頭像
    大師兄

    IT工程師數位筆記本

    大師兄 發表在 痞客邦 留言(0) 人氣()