Настройка производительности SQL

Добавил Sergey Moiseenko on Среда, 20 сентября. 2023

Пересказ статьи Gaurav Rajapurkar. SQL Performance Tuning

Настройка производительности SQL - это процесс оптимизации запросов SQL, гарантирующий их быстрое выполнение, насколько это возможно. Имеется множество факторов, которые влияют на производительность SQL-запросов, таких как число участвующих в запросе таблиц, размер и число столбцов в таблицах, индексы на таблицах.
Настройка производительности SQL является важным элементом, который сказывается на масштабируемости и скорости запросов. Здесь обсуждаются некоторые способы настройки SQL.

Каждый из нас хотел бы иметь быстрый отклик процесса извлечения данных. Поэтому нам необходимо иметь хорошо спроектированную базу данных, которая обеспечит наилучшую производительность при манипуляции с данными, что в результате даст лучшую производительность приложения.

Хотя нет прямого пути определения лучшей производительности, мы можем выбирать различные способы для улучшения производительности запросов SQL, которые относятся к разным категориям, таким как создание индексов, использование соединений, замена подзапроса использованием JOIN и т.д.

Мы знаем, что любой запрос SQL может быть записан множеством способов, но нам следует придерживаться лучшей практики/техники, чтобы улучшить производительность запроса. Вот некоторые из них:

Используйте EXISTS вместо IN для проверки существования данных.

Избегайте использования оператора SELECT *. Перечисляйте имена требуемых столбцов.

Выбирайте подходящий тип данных. Например, для хранения строк используйте varchar вместо типа данных text (varchar(max)). Используйте varchar(max), когда вам необходимо хранить большие данные (более 8000 символов).

Если возможно, избегайте nchar и nvarchar, поскольку эти типы данных занимают вдвое больше памяти по сравнению с char и varchar.

Избегайте использования NULL в полях фиксированной длины. Если NULL необходим, используйте поля переменной длины (varchar), которые занимают меньше места для хранения NULL.

Избегайте предложения HAVING. Предложение HAVING требуется, если вы в дальнейшем хотите фильтровать результаты по значениям агрегатных функций.

Создавайте кластеризованный и некластеризованные индексы.

Придерживайтесь небольших кластеризованных индексов, т.к. ключи кластеризованного индекса могут также присутствовать в некластеризованных индексах.

Наиболее селективные столбцы должны следовать самыми левыми в некластеризованном индексе.

Удаляйте неиспользуемые индексы.

Лучше создавать индексы на целочисленных столбцах, а не на символьных. Целочисленные значения потребляют меньше накладных расходов, чем символьные значения.

Используйте соединения вместо подзапросов.

Используйте выражения WHERE для ограничения результирующих таблиц, создаваемых соединениями.

Используйте TABLOCKX при вставке в таблицу и TABLOCK при слиянии.

Используйте WITH (NOLOCK) при выборке данных из таблиц.

Используйте SET NOCOUNT ON и TRY- CATCH во избежание тупика.

Избегайте курсоров по причине их низкой производительности.

Используйте табличные переменные вместо временных таблиц. Использование временных таблиц требует взаимодействия с базой данных TempDB, что связано с затратами времени.

Где это возможно, используйте UNION ALL вместо UNION.

Указывайте имя схемы перед именем объекта.

Для часто востребованных данных и сложных запросов используйте хранимые процедуры.

Используйте небольшие, насколько это возможно, транзакции, поскольку транзакция накладывает блокировку на обрабатываемые табличные данные, что может вызвать тупиковую ситуацию.

Избегайте использования префикса "sp_" в именах пользовательских хранимых процедур, поскольку SQL Server сначала будет искать такую процедуру в базе данных master, а уже потом в базе данных текущей сессии.

Избегайте использования некоррелирующих скалярных подзапросов. Используйте этот запрос как отдельный вместо части основного запроса и сохраняйте выходные данные в переменной, на которую можно ссылаться в основном запросе или в последующей части пакета.

Избегайте многооператорных табличнозначных функций (TVF). Эти функции более затратны по сравнению со встроенными (inline) TVF.

Из сказанного выше понятно, что в SQL Server есть много этапов, которые вы можете выполнить для улучшения производительности ваших запросов и в целом базы данных. Много этапов применимы и в других РСУБД, например, в Oracle.

Вот некоторые основные советы для настройки производительности Oracle SQL:

Используйте EXPLAIN PLAN или AUTOTRACE для анализа плана выполнения ваших запросов и обнаружения проблем при том способе, который используется для их исполнения.

Используйте хинт INDEX для указания индекса, который следует использовать оптимизатору для этого конкретного запроса.

Рассмотрите возможность использования хинтов FULL или INDEX_FFS, чтобы принудить оптимизатор использовать полное сканирование таблицы или быстрое полное сканирование индекса соответственно.

Используйте хинт OPTIMIZER_MODE для указания конкретного режима оптимизации запроса.

Рассмотрите возможность использования материализованных представлений для предварительного расчета и сохранения часто востребованных данных, что может улучшить производительность запросов, которые обращаются к этим данным.

Используйте пакет DBMS_STATS для анализа и сбора статистики о вашей базе данных и ее объектах, что может помочь оптимизатору принять более обоснованные решения при создании планов выполнения.

Рассмотрите возможность использования секционирования для разбиения больших таблиц на меньшие, более управляемые части, что может улучшить производительность запросов, которые обращаются к этим таблицам.

Используйте SQL Tuning Advisor для обнаружения и исправления любых потенциальных проблем производительности в ваших операторах SQL.

Это всего лишь незначительная часть того множества методов, которые вы можете использовать для улучшения производительности ваших запросов и базы данных Oracle. Важно помнить, что конкретные шаги, которые вам потребуются, зависят от конкретной базы данных и рабочей нагрузки.

Всегда хорошей идеей является консультация с администратором базы данных или другими экспертами, если у вас возникли проблемы производительности.

Ссылки по теме

Почему не следует использовать SELECT * в рабочих системах (никогда!)

Когда использовать CHAR, VARCHAR или VARCHAR(MAX)

Основы использования хинта NOLOCK в SQL Server

CTE или временные таблицы, что лучше?

О хранилище запросов, навязывании плана и табличных переменных

Блокировки, блокирование и тупики в SQL Server

Что такое материализованное представление, и зачем его использовать?

Как решить, нужно ли вам секционировать таблицы

Обратные ссылки

URI этой записи для создания обратных ссылок (trackback)

Нет обратных ссылок

Добавить комментарий

Имя

Домашняя страница

Комментарий

В ответ на

Enclosing asterisks marks text as bold (*word*), underscore are made via _word_.

Standard emoticons like :-) and ;-) are converted to images.

To prevent automated Bots from commentspamming, please enter the string you see in the image below in the appropriate input box. Your comment will only be submitted if the strings match. Please ensure that your browser supports and accepts cookies, or your comment cannot be verified correctly.
CAPTCHA

Enter the string from the spam-prevention image above:

Form options

Запомнить информацию?

Добавленные комментарии должны будут пройти модерацию прежде, чем будут показаны.

SQL-Ex blog