نشانی: تهران، میدان صادقیه، بلوار آیت اله کاشانی، نبش گلستان شمالی، پلاک 29، واحد 8
افزایش سرعت کوئری با تمرکز بر Where Condition

افزایش سرعت کوئری با تمرکز بر Where Condition

بهینه سازی کوئری های SQL، به ویژه با تمرکز بر شرط‌های WHERE، نقش بسیار مهمی در افزایش سرعت و عملکرد پایگاه داده دارد. استفاده بهینه از این شرط ها می‌تواند تأثیر قابل توجهی بر زمان اجرا و مصرف منابع داشته باشد. در این مقاله، به بررسی تکنیک ها و روش هایی خواهیم پرداخت که با بهینه‌سازی شرط های WHERE، می‌توان افزایش سرعت کوئری را انجام داد. از جمله این تکنیک ها، استفاده از ایندکس ها، بهینه سازی عبارات شرطی و اجتناب از جداول سنگین و پیچیده است که می‌تواند به بهبود عملکرد پایگاه داده کمک کند.

استفاده از نام ستون های به جای * SELECT

یکی از تکنیک‌های مهم برای بهینه‌سازی عملکرد کوئری‌های SQL، اجتناب از استفاده از SELECT * و به جای آن، لیست کردن دقیق نام فیلدهایی است که نیاز دارید. استفاده از SELECT * مشکلات متعددی را ایجاد می‌کند که می‌تواند منجر به کاهش کارایی و افزایش مصرف منابع شود.
اولین مشکل این است که استفاده از SELECT * می‌تواند منجر به افزایش زمان اجرای کوئری شود، زیرا سرور پایگاه داده مجبور است تمام ستون‌ها را از جدول فراخوانی کند، حتی اگر برخی از آن‌ها مورد نیاز نباشند. این موضوع نه تنها باعث افزایش عملیات I/O می‌شود، بلکه ممکن است باعث کندی چشمگیری در عملکرد سیستم شود.

همچنین، در صورت استفاده از SELECT *، ایندکس‌های مناسب که ممکن است بر روی فیلدهای خاصی ایجاد شده باشند، نمی‌توانند به طور بهینه استفاده شوند. این امر منجر به ایجاد عملیات پرهزینه‌ای مانند Clustered Index Scan یا Table Scan می‌شود که عملکرد کوئری را به شدت تحت تأثیر قرار می‌دهد. علاوه بر این ، **SELECT *** باعث افزایش ترافیک شبکه می‌شود، زیرا تمامی ستون‌ها به سمت کلاینت ارسال می‌شوند. این موضوع در محیط‌های با پهنای باند محدود یا حجم داده‌های بزرگ، می‌تواند منجر به افزایش هزینه‌ها و کاهش سرعت پاسخگویی شود.

برای مثال، فرض کنید یک جدول با نام Customers داریم که شامل فیلدهای CustomerID، FirstName، LastName و Email است. اگر شما فقط به CustomerID و FirstName نیاز دارید، به جای SELECT * FROM Customers بهتر است از SELECT CustomerID, FirstName FROM Customers استفاده کنید. این کار نه تنها سرعت کوئری را افزایش می‌دهد، بلکه منابع را نیز بهینه‌تر مصرف می‌کند.

استفاده از نام ستون های به جای SELECT

بهینه سازی کوئری‌ با استفاده صحیح از عملگر LIKE

استفاده صحیح از عملگر LIKE می‌تواند تاثیر بسزایی در بهبود عملکرد کوئری‌های SQL داشته باشد. یکی از موارد مهمی که باید در نظر گرفت، استفاده مناسب از علامت % است. زمانی که % در ابتدای یک الگوی LIKE قرار می‌گیرد، موتور پایگاه داده قادر نخواهد بود از ایندکس‌ها به صورت بهینه استفاده کند. این موضوع منجر به کاهش سرعت جستجو و افزایش زمان اجرای کوئری می‌شود، زیرا موتور SQL مجبور به انجام عملیات Index Scan به جای Index Seek خواهد بود.
در واقع، زمانی که % در ابتدا و انتهای الگوی جستجو قرار می‌گیرد، پایگاه داده مجبور است تمامی رکوردها را برای پیدا کردن تطابق احتمالی بررسی کند. این موضوع به ویژه در جداول بزرگ، منجر به کاهش کارایی سیستم می‌شود. در مقابل، اگر % تنها در انتهای الگوی جستجو قرار گیرد، موتور SQL می‌تواند از ایندکس‌ها به صورت بهینه‌تری استفاده کند و تنها به بررسی رکوردهایی بپردازد که مطابقت اولیه با الگوی جستجو دارند. به عنوان مثال، فرض کنید جدولی به نام Employees داریم که شامل فیلد LastName است. در صورتی که بخواهید تمامی رکوردهایی که نام خانوادگی آن‌ها با “Smith” به پایان می‌رسد را پیدا کنید، بهتر است از کوئری SELECT * FROM Employees WHERE LastName LIKE 'Smith%' استفاده کنید. این روش منجر به Index Seek می‌شود که عملکرد بهتری نسبت به کوئری SELECT * FROM Employees WHERE LastName LIKE '%Smith' که منجر به Index Scan می‌شود، خواهد داشت.

پرهیز از استفاده از عبارات محاسباتی در  WHERE Clause

پرهیز از استفاده از عبارات محاسباتی در WHERE Clause

استفاده از عبارت‌های محاسباتی در قسمت WHERE کوئری‌های SQL می‌تواند به طور جدی کارایی کوئری‌های شما را کاهش دهد. وقتی از توابع محاسباتی یا تغییرات داده‌ای در این بخش استفاده می‌کنید، موتور پایگاه داده مجبور است این محاسبات را برای هر رکورد در جدول انجام دهد. این موضوع می‌تواند منجر به افزایش عملیات I/O (ورودی/خروجی) و زمان اجرای کوئری شود. همچنین، استفاده از توابع محاسباتی می‌تواند مانع از بهره‌برداری بهینه از ایندکس‌های موجود شود، چرا که ایندکس‌ها معمولاً بر اساس مقادیر خام ستون‌ها عمل می‌کنند و نه نتایج محاسباتی.مثال : فرض کنید در یک جدول به نام Orders می‌خواهید رکوردهایی را پیدا کنید که مربوط به سال 2023 هستند. اگر از یک عبارت محاسباتی مانند YEAR(OrderDate) در شرط WHERE استفاده کنید، کوئری شما به شکل زیر خواهد بود :

SELECT * FROM Orders WHERE YEAR(OrderDate) = 2023;

این روش باعث می شود موتور پایگاه داده نتواند به درستی از ایندکس‌های موجود بر روی ستون OrderDate استفاده کند، زیرا تابع YEAR() باید برای هر رکورد اجرا شود. این امر می‌تواند باعث کاهش سرعت کوئری و افزایش بار پردازشی شود.

به جای آن، بهتر است از یک روش مستقیم استفاده کنید که مستقیماً از مقادیر موجود در ستون OrderDate استفاده کند :

SELECT * FROM Orders WHERE OrderDate >= ‘2023-01-01’ AND OrderDate < ‘2024-01-01’;

در این روش، از مقادیر خام ستون استفاده می شود که اجازه می‌دهد ایندکس ها بهینه ترین مسیر را برای دسترسی به داده ها انتخاب کنند و در نتیجه سرعت و کارایی کوئری بهبود یابد.

پرهیز از استفاده از Join Hints در SQL Server

برای بهبود عملکرد جستجو در SQL Server، یکی از توصیه‌ها این است که تا حد امکان از استفاده از Join Hints خودداری کنید. Join Hints دستورالعمل هایی هستند که به موتور پایگاه داده SQL Server می‌گویند که چگونه جداول را به یکدیگر متصل کند. این دستورالعمل ها می‌توانند یکی از چهار روش مختلف زیر را تعیین کنند:

  1. LOOP JOIN : این نوع Join زمانی که یکی از جداول کوچک باشد و جدول دیگر بزرگ، کارایی خوبی دارد. SQL Server به ترتیب از یک حلقه تکرار برای هر رکورد در جدول کوچک استفاده می‌کند تا رکوردهای مطابقت‌دار در جدول بزرگ را پیدا کند.
  2. MERGE JOIN : این نوع Join زمانی که هر دو جدول به صورت مرتب شده (از طریق ایندکس) باشند، مؤثر است. SQL Server هر دو جدول را به ترتیب می‌خواند و رکوردها را با یکدیگر مقایسه می‌کند.
  3. HASH JOIN : در این روش، SQL Server یک جدول را در حافظه هش می‌کند و سپس از جدول دیگر برای جستجو در هش استفاده می‌کند. این نوع Join برای جداول بزرگ و زمانی که ایندکس مناسبی وجود ندارد، مفید است.
  4. REMOTE JOIN: این نوع Join برای ترکیب داده‌ها از منابع داده مختلف (مثلاً جداول از سرورهای مختلف) استفاده می‌شود. این روش کمتر رایج است و به طور کلی در سناریوهای خاصی استفاده می‌شود.

پرهیز از استفاده از Join Hints در SQL Server

هرچند که Join Hints می‌توانند در موارد خاص مفید باشند، اما به‌طور کلی توصیه می‌شود از آنها استفاده نکنید، مگر در شرایطی که کاملاً مطمئن هستید که یک استراتژی خاص عملکرد بهتری دارد. موتور SQL Server به‌طور خودکار بهترین روش را برای اجرای Join انتخاب می‌کند. با استفاده از Join Hints، شما این انتخاب خودکار را محدود کرده و ممکن است عملکرد کلی را کاهش دهید.

فرض کنید دو جدول Orders و Customers داریم و می‌خواهیم از Join Hint استفاده کنیم:

SELECT *

FROM Orders o

INNER MERGE JOIN Customers c ON o.CustomerID = c.CustomerID;

در اینجا از MERGE JOIN به‌صورت صریح استفاده شده است. اگرچه ممکن است این روش در برخی سناریوها مؤثر باشد، اما اگر شرایط جدول‌ها تغییر کند، این روش ممکن است دیگر بهینه نباشد. بنابراین بهتر است از Join Hint استفاده نکنیم و اجازه دهیم SQL Server به‌طور خودکار بهترین روش را انتخاب کند :

SELECT *

FROM Orders o

INNER JOIN Customers c ON o.CustomerID = c.CustomerID;

در این مثال، SQL Server خود تصمیم می گیرد که بهترین استراتژی Join کدام است.

استفاده از UNION ALL به جای UNION

عملگر UNION برای ترکیب نتایج دو یا چند دستور SELECT در SQL Server استفاده می‌شود و به‌طور خودکار داده‌های تکراری را حذف می‌کند. این کار معمولاً از طریق مرتب‌سازی داده‌ها و سپس ادغام آنها انجام می‌شود، که می‌تواند باعث کاهش سرعت عملیات به خصوص در جداول بزرگ شود. در مقابل، عملگر UNION ALL تمامی نتایج SELECT‌ها را بدون حذف داده‌های تکراری و بدون نیاز به مرتب‌سازی ترکیب می‌کند. از این رو، UNION ALL به دلیل عدم نیاز به مرتب‌سازی و حذف داده‌های تکراری، سریع‌تر عمل می‌کند و منابع کمتری مصرف می‌کند.

استفاده از UNION ALL به جای UNION

نکته مهم :

  • اگر اطمینان دارید که داده‌های تکراری برای شما اهمیتی ندارند یا داده‌های تکراری در نتایج SELECT‌های شما وجود ندارند، استفاده از UNION ALL می‌تواند به شدت عملکرد کوئری شما را بهبود بخشد.
  • اما اگر لازم است که داده‌های تکراری حذف شوند، استفاده از UNION معمولی ضروری است، هرچند که سرعت اجرای کوئری ممکن است کمتر باشد.

مثال :

فرض کنید دو جدول Employees و Contractors داریم و می‌خواهیم لیستی از تمام افراد (اعم از کارکنان دائم و قراردادی) داشته باشیم :

SELECT FirstName, LastName FROM Employees

UNION ALL

SELECT FirstName, LastName FROM Contractors;

سخن پایانی

Where Clause یکی از بخش‌های مهم در SQL است که تاثیر زیادی بر سرعت اجرای کوئری‌ها دارد. با استفاده صحیح از این شرط، می‌توان کوئری‌های SQL را بهینه‌سازی کرد و زمان اجرای آنها را کاهش داد.

برخی از تکنیک‌های کلیدی برای بهبود عملکرد شامل اجتناب از عبارات محاسباتی در Where Clause، استفاده از شاخص‌ها (Indexes) و بهره‌گیری از عبارات SARGable است. به این ترتیب، پردازش سریع‌تر و استفاده بهینه از منابع سیستم میسر می‌شود، که در نهایت باعث افزایش کارایی پایگاه داده ها خواهد شد. برای بهینه‌سازی بیشتر، باید بهترین شیوه ها و تکنیک ها را به‌کار بگیرید.

میانگین امتیازات 5 از 5 - از مجموع 1 رای

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

درخواست مشاوره رایگان