MySQL — Медленная операция COUNT(*) / COUNT(id)

Жил я себе спокойно, разрабатывал приложения, углубился в базы данных, почитал про highload, и умные люди на конференции в прошлом году заявляли, что в PgSQL операция count(id) весьма медленная. Интересно, никогда об этом не думал, что там — посчитать по индексу… а, нет, не по индексу, полный скан, значит не так уж и быстро…

В большинстве случаев, не требуется знать точное значение count() для таблицы, когда нет условий на выборку оптимальнее использовать вместо классического

SELECT count(id) FROM <table>

запрос на статистику таблицы:

show table status like '<table name>';

Я тестировал на таблицы в ~20 тыс строк, скорость работы отличается значительно

  • 0,63 ms для обычного точного count, при этом реальное число 21902
  • 0,47 ms для статуса таблицы, а тут число 22008

То есть, чем таблица больше тем актуальнее использовать приближенный count вместо живого-настоящего.

 

Еще раз о RAND в SQL

В предыдущем посте я писал о том, что можно сделать функцию RAND, для генирации в диапазоне, однако при тестировании выяснилось, что она не работает должным образом — выкидываемое значение было больше чем max, в параметре функции.

Новая функция:

CREATE FUNCTION getRandom(@min int, @max int)
RETURNS INT
AS
BEGIN
Return (SELECT ROUND(((@max - @min -1) * V + @min), 0) FROM dbo.vRand)

END

SQL: Обертка на RAND()

В SQL есть функция RAND() которая может генерировать псевдослучайные числа.  Например такой запрос:

Select Rand()

Вернет:

rand

Дальше можно немного модифицировать выборку. Скажем, нам нужно, что бы выбиралось целое число от 0 до 100, тогда запрос будет таким:

SELECT FLOOR(100*RAND());

Ну и если от 10 до 100, то таким:

SELECT FLOOR(100*RAND()+10);

В языке SQL поддерживаются функции, так почему бы не написать обертку на Rand, которая будет генерировать числа от и до нужных нам границ?

Continue reading

SQL: Получить дату и время

Вот несколько способов получить текущую дату и время в Microsoft SQL Server. Можно использовать: CURRENT_TIMESTAMP, GETDATE(), {fn NOW()}

CURRENT_TIMESTAMP
CURRENT_TIMESTAMP это не недетерминированная функция. Представления и выражения, которые ссылаются  на эту колонку не могут быть проиндексированны. CURRENT_TIMESTAMP может использоваться что бы вывести текущую дату и время  в отчетах.

Continue reading