найти недостающие числа из последовательности после получения sequenuce из строки?

Вопрос:

У меня есть миллионная строка, подобная этой, с 310 типами, которые имеют разный формат, чтобы получить последовательность, год, месяц и день.

сценарий получит последовательность, год, месяц и день… теперь я хочу, чтобы Pl/Sql получал максимальное и минимальное значение числа последовательности и находил недостающее число, где год и месяц, например, 14 – 06 как??

Ответ №1

Вы вообще не хотите смотреть на dual; конечно, не пытаться вставить. Вам нужно отслеживать самые высокие и самые низкие значения, которые вы видели, когда вы перебираете цикл. основанный на некоторых элементах ename представляющих даты, я уверен, что вы хотите, чтобы все ваши совпадения были 0-9, а не 1-9. Вы также имеете в виду имя курсора при доступе к его полям вместо имени переменной записи:

  FOR List_ENAME_rec IN List_ENAME_cur loop
if REGEXP_LIKE(List_ENAME_rec.ENAME,'emp[-][0-9]{4}[_][0-9]{2}[_][0-9]{2}[_][0-9]{2}[_][0-9]{4}[_][G][1]') then
V_seq := substr(List_ENAME_rec.ename,5,4);
V_Year := substr(List_ENAME_rec.ename,10,2);
V_Month := substr(List_ENAME_rec.ename,13,2);
V_day := substr(List_ENAME_rec.ename,16,2);

if min_seq is null or V_seq < min_seq then
min_seq := v_seq;
end if;
if max_seq is null or V_seq > max_seq then
max_seq := v_seq;
end if;

end if;
end loop;

Со значениями в таблице emp-1111_14_01_01_1111_G1 и emp-1115_14_02_02_1111_G1, которая сообщает max_seq 1115 min_seq 1111.

Если вы действительно хотели задействовать dual, вы можете сделать это внутри цикла, вместо шаблона if/then/assign, но это не обязательно:

      select least(min_seq, v_seq), greatest(max_seq, v_seq)
into min_seq, max_seq
from dual;

Я понятия не имею, что будет делать процедура; похоже, нет никакой связи между тем, что вы получили в test1 и ценностями, которые вы находите.

Для этого вам не нужен PL/SQL. Вы можете получить значения min/max из простого запроса:

select min(to_number(substr(ename, 5, 4))) as min_seq,
max(to_number(substr(ename, 5, 4))) as max_seq
from table1
where status = 2
and regexp_like(ename,
'emp[-][0-9]{4}[_][0-9]{2}[_][0-9]{2}[_][0-9]{2}[_][0-9]{4}[_][G][1]')

MIN_SEQ    MAX_SEQ
---------- ----------
1111       1115

И вы можете использовать их для создания списка всех значений в этом диапазоне:

with t as (
select min(to_number(substr(ename, 5, 4))) as min_seq,
max(to_number(substr(ename, 5, 4))) as max_seq
from table1
where status = 2
and regexp_like(ename,
'emp[-][0-9]{4}[_][0-9]{2}[_][0-9]{2}[_][0-9]{2}[_][0-9]{4}[_][G][1]')
)
select min_seq + level - 1 as seq
from t
connect by level <= (max_seq - min_seq) + 1;

SEQ
----------
1111
1112
1113
1114
1115

И немного другое общее табличное выражение, чтобы увидеть, какие из них не существуют в вашей таблице, и я думаю, что вы после этого:

with t as (
select to_number(substr(ename, 5, 4)) as seq
from table1
where status = 2
and regexp_like(ename,
'emp[-][0-9]{4}[_][0-9]{2}[_][0-9]{2}[_][0-9]{2}[_][0-9]{4}[_][G][1]')
),
u as (
select min(seq) as min_seq,
max(seq) as max_seq
from t
),
v as (
select min_seq + level - 1 as seq
from u
connect by level <= (max_seq - min_seq) + 1
)
select v.seq as missing_seq
from v
left join t on t.seq = v.seq
where t.seq is null
order by v.seq;

MISSING_SEQ
-----------
1112
1113
1114

или если вы предпочитаете:

...
select v.seq as missing_seq
from v
where not exists (select 1 from t where t.seq = v.seq)
order by v.seq;

SQL Fiddle.


Основываясь на комментариях, я думаю, что вам нужны отсутствующие значения для последовательности для каждой комбинации других элементов идентификатора (YY_MM_DD). Это даст вам эту разбивку:

with t as (
select to_number(substr(ename, 5, 4)) as seq,
substr(ename, 10, 2) as yy,
substr(ename, 13, 2) as mm,
substr(ename, 16, 2) as dd
from table1
where status = 2
and regexp_like(ename,
'emp[-][0-9]{4}[_][0-9]{2}[_][0-9]{2}[_][0-9]{2}[_][0-9]{4}[_][G][1]')
),
r (yy, mm, dd, seq, max_seq) as (
select yy, mm, dd, min(seq), max(seq)
from t
group by yy, mm, dd
union all
select yy, mm, dd, seq + 1, max_seq
from r
where seq + 1 <= max_seq
)
select yy, mm, dd, seq as missing_seq
from r
where not exists (
select 1 from t
where t.yy = r.yy
and t.mm = r.mm
and t.dd = r.dd
and t.seq = r.seq
)
order by yy, mm, dd, seq;

С выходом, например:

YY   MM   DD    MISSING_SEQ
---- ---- ---- -------------
14   01   01            1112
14   01   01            1113
14   01   01            1114
14   02   02            1118
14   02   02            1120
14   02   03            1127
14   02   03            1128

SQL Fiddle.

Если вы хотите найти конкретную дату, вы используете фильтр холода, который (либо в t, либо в первой ветки в r), но вы также можете изменить шаблон регулярного выражения, чтобы включить фиксированные значения; так что для поиска 14 06 шаблон будет 'emp[-][0-9]{4}_14_06_[0-9]{2}[_][0-9]{4}[_][G][1]', например. Однако это труднее обобщить, поэтому фильтр (where t.yy = '14' and t.mm = '06' может быть более гибким.


Если вы настаиваете на том, чтобы это было в процедуре, вы можете сделать элементы даты необязательными и изменить шаблон регулярного выражения:

create or replace procedure show_missing_seqs(yy in varchar2 default '[0-9]{2}',
mm in varchar2 default '[0-9]{2}', dd in varchar2 default '[0-9]{2}') as

pattern varchar2(80);
cursor cur (pattern varchar2) is
with t as (
select to_number(substr(ename, 5, 4)) as seq,
substr(ename, 10, 2) as yy,
substr(ename, 13, 2) as mm,
substr(ename, 16, 2) as dd
from table1
where status = 2
and regexp_like(ename, pattern)
),
r (yy, mm, dd, seq, max_seq) as (
select yy, mm, dd, min(seq), max(seq)
from t
group by yy, mm, dd
union all
select yy, mm, dd, seq + 1, max_seq
from r
where seq + 1 <= max_seq
)
select yy, mm, dd, seq as missing_seq
from r
where not exists (
select 1 from t
where t.yy = r.yy
and t.mm = r.mm
and t.dd = r.dd
and t.seq = r.seq
)
order by yy, mm, dd, seq;
begin
pattern := 'emp[-][0-9]{4}[_]'
|| yy || '[_]' || mm || '[_]' || dd
|| '[_][0-9]{4}[_][G][1]';
for rec in cur(pattern) loop
dbms_output.put_line(to_char(rec.missing_seq, 'FM0000'));
end loop;
end show_missing_seqs;
/

Я не знаю, почему вы настаиваете на том, что это нужно сделать так, или почему вы хотите использовать dbms_output поскольку вы полагаетесь на отображение клиента/вызывающего абонента; что будет делать ваша работа с выходом? Вы можете сделать это возвратом sys_refcursor который был бы более гибким. но в любом случае вы можете так называть SQL * Plus/SQL Developer:

set serveroutput on
exec show_missing_seqs(yy => '14', mm => '01');

anonymous block completed
1112
1113
1114

Оцените статью
TechArks.Ru
Добавить комментарий