20 авг. 2012 г.

Генерация тестовых данных в Oracle

Наиболее простым методом генерации тестовых данных в Oracle, является метод комбинирования запросов на основе CONNECT BY LEVEL и пакета DBMS_RANDOM. При помощи запроса мы легко можем генерировать необходимое количество строк, а с используя пакет DBMS_RANDOM, добавить необходимое наполнение полей. Простейшим запросом в этом случае будет такой:

SELECT LEVEL AS ID,
       dbms_random.String('X', 10) AS NAME
FROM dual CONNECT BY LEVEL < 10;

Выводим 9 строк, с двумя полями:
ID      NAME
--      --

1 4txer6oa9h
2 sppv4klnh1
3 oz33rs9fsy
4 0dl8azesaq
5 gc33xxnm2g
6 4i5hmvm6uj
7 5oovp3o4oe
8 a10k5lwrqt
9 9eyxgm98f5

Регулируя значения LEVEL, добиваемся необходимого количества строк. В данном случае, LEVEL так же выступает уникальным идентификатором записи, потому как имеет уникальное значения и может быть использован вместо sequece.
Количество полей, которое необходимо вставить, регулируем подстановкой вызовов необходимого метода DBMS_RANDOM. Наиболее полезные и востребованные методы пакета и примеры их использования:
SELECT dbms_random.value(),
       -- случайное число, больше или равно 0 и меньше чем 1

       dbms_random.value(1,5),
       -- случайное число, в заданой границе

       dbms_random.normal(),
       -- случайное число, как пололожительное так и отрицательное

       dbms_random.random(),
       -- устаревшая функция, не рекомендуется использовать

       dbms_random.string('x',10),
       -- случайная строка, как с буквами так и с цифрами

       trunc(SYSDATE,'yyyy') + dbms_random.value(1,360) 
       -- пример для генерации случайных дат
FROM dual;
Подробное использования пакета DBMS_RANDOM описано на сайте oracle в соответствующем разделе http://docs.oracle.com/cd/B19306_01/appdev.102/b14258/d_random.htm.

20 дек. 2011 г.

Мониторинг использования индексов


Создавая индекс на поле(я) таблицы, мы не можем с уверенностью утверждать, что они будут использованы оптимизатором (Cost-Based Optimizer), для построения наиболее оптимального плана выполнения запроса.
Для уверенности, что индексы реально используются приложениями, а не занимают попусту дисковое пространство, удобно использовать - Monitoring Index Usage.

Включаем мониторинг использования индекса (на примере индекса EMP_EMP_ID_PK таблицы hr.employees):
  1. ALTER INDEX EMP_EMP_ID_PK monitoring usage;

Делаем выборку из таблицы, на которой построен индекс:

  1. SELECT * FROM hr.employees e WHERE e.employee_id > 100;

Делаем выборку, чтоб удостовериться что индекс используется:

  1. INDEX_NAME                 TABLE_NAME                     MONITORING USED
  2. -------------------------- ------------------------------ ---------- ----
  3. EMP_EMP_ID_PK              EMPLOYEES                      YES        NO
Значение "NO" в поле USED, говорит о том, что индекс не был использован, как при выполнении последнего запроса так и в целом, при выполнении любых запросов в системе с участием этой таблицы.

Попробуем немного видоизменить запрос, и посмотреть что получится:

  1. SELECT * FROM hr.employees e WHERE e.employee_id = 100;

Делаем выборку, чтоб удостовериться что индекс используется:

  1. INDEX_NAME                 TABLE_NAME                     MONITORING USED
  2. -------------------------- ------------------------------ ---------- ----
  3. EMP_EMP_ID_PK              EMPLOYEES                      YES        YES
Значение "YES" в поле USED, говорит о том, что индекс был использован.

Теперь можно отключить мониторинг использования индекса:
  1. ALTER INDEX index_name nomonitoring usage;

Когда нужно(удобно) использовать Monitoring Index Usage:
Для обычных запросов, которые вы выполняете в ручном режиме в SQL+ либо какой-то другой среде, нет смысла использовать подобный мониторинг. Проще построить план выполнения (Explain Plan), который однозначно скажет, участвует ваш индекс в выборке или нет. Мониторинг использования индексов, очень удобен, когда нужно удостовериться в использовании индексов приложениями, которые взаимодействуют с базой посредством stored procedures, functions либо через технологии ORM (Object-relational mapping). В этом случае,
получить доступ к планам выполнения (Explain Plan) не всегда удобно и очевидно.

P.S. Использовать Monitoring Index Usage нужно осторожно, потому как он не дает понимания, какой именно запрос/процедура/функция использовали индекс в своей работе. Мониторинг удобно включать на индексы, чтобы выявить ненужные/лишние индексы, созданные без понимания того, как в дальнейшем они будут использоваться.