2019-09-09 13:40:24 +03:00
|
|
|
|
/*
|
2023-01-16 16:24:51 +03:00
|
|
|
|
* Copyright 2017-2023 Leonid Yuriev <leo@yuriev.ru>
|
2017-03-30 18:54:57 +03:00
|
|
|
|
* and other libmdbx authors: please see AUTHORS file.
|
|
|
|
|
* All rights reserved.
|
|
|
|
|
*
|
|
|
|
|
* Redistribution and use in source and binary forms, with or without
|
|
|
|
|
* modification, are permitted only as authorized by the OpenLDAP
|
|
|
|
|
* Public License.
|
|
|
|
|
*
|
|
|
|
|
* A copy of this license is available in the file LICENSE in the
|
|
|
|
|
* top-level directory of the distribution or, alternatively, at
|
|
|
|
|
* <http://www.OpenLDAP.org/license.html>.
|
|
|
|
|
*/
|
|
|
|
|
|
|
|
|
|
#pragma once
|
|
|
|
|
|
2022-11-08 16:17:14 +03:00
|
|
|
|
#include "base.h++"
|
|
|
|
|
#include "log.h++"
|
|
|
|
|
#include "utils.h++"
|
2017-03-30 18:54:57 +03:00
|
|
|
|
|
|
|
|
|
#define ACTOR_ID_MAX INT16_MAX
|
|
|
|
|
|
2017-10-26 20:51:46 +03:00
|
|
|
|
enum actor_testcase {
|
|
|
|
|
ac_none,
|
|
|
|
|
ac_hill,
|
|
|
|
|
ac_deadread,
|
|
|
|
|
ac_deadwrite,
|
|
|
|
|
ac_jitter,
|
2018-11-04 18:57:36 +03:00
|
|
|
|
ac_try,
|
2019-02-03 22:37:57 +03:00
|
|
|
|
ac_copy,
|
2019-06-21 22:42:45 +03:00
|
|
|
|
ac_append,
|
2019-10-09 23:38:44 +03:00
|
|
|
|
ac_ttl,
|
|
|
|
|
ac_nested
|
2017-10-26 20:51:46 +03:00
|
|
|
|
};
|
2017-03-30 18:54:57 +03:00
|
|
|
|
|
|
|
|
|
enum actor_status {
|
|
|
|
|
as_unknown,
|
2019-11-18 00:13:27 +03:00
|
|
|
|
as_debugging,
|
2017-03-30 18:54:57 +03:00
|
|
|
|
as_running,
|
|
|
|
|
as_successful,
|
|
|
|
|
as_killed,
|
2019-07-07 02:33:35 +03:00
|
|
|
|
as_failed,
|
|
|
|
|
as_coredump,
|
2017-03-30 18:54:57 +03:00
|
|
|
|
};
|
|
|
|
|
|
|
|
|
|
const char *testcase2str(const actor_testcase);
|
|
|
|
|
const char *status2str(actor_status status);
|
|
|
|
|
|
2017-05-17 20:10:56 +03:00
|
|
|
|
enum keygen_case {
|
|
|
|
|
kc_random, /* [ 6.. 2.. 7.. 4.. 0.. 1.. 5.. 3.. ] */
|
|
|
|
|
kc_dashes, /* [ 0123.. 4567.. ] */
|
|
|
|
|
kc_custom,
|
|
|
|
|
/* TODO: more cases */
|
|
|
|
|
};
|
|
|
|
|
|
|
|
|
|
const char *keygencase2str(const keygen_case);
|
|
|
|
|
|
2017-03-30 18:54:57 +03:00
|
|
|
|
//-----------------------------------------------------------------------------
|
|
|
|
|
|
|
|
|
|
namespace config {
|
|
|
|
|
|
|
|
|
|
enum scale_mode { no_scale, decimal, binary, duration };
|
|
|
|
|
|
|
|
|
|
bool parse_option(int argc, char *const argv[], int &narg, const char *option,
|
|
|
|
|
const char **value, const char *default_value = nullptr);
|
|
|
|
|
|
|
|
|
|
bool parse_option(int argc, char *const argv[], int &narg, const char *option,
|
|
|
|
|
std::string &value, bool allow_empty = false);
|
|
|
|
|
|
2018-08-20 13:23:54 +03:00
|
|
|
|
bool parse_option(int argc, char *const argv[], int &narg, const char *option,
|
|
|
|
|
std::string &value, bool allow_empty,
|
|
|
|
|
const char *default_value);
|
|
|
|
|
|
2017-03-30 18:54:57 +03:00
|
|
|
|
bool parse_option(int argc, char *const argv[], int &narg, const char *option,
|
|
|
|
|
bool &value);
|
|
|
|
|
|
|
|
|
|
struct option_verb {
|
|
|
|
|
const char *const verb;
|
|
|
|
|
unsigned mask;
|
|
|
|
|
};
|
|
|
|
|
|
2020-07-08 02:26:46 +03:00
|
|
|
|
template <typename MASK>
|
2017-03-30 18:54:57 +03:00
|
|
|
|
bool parse_option(int argc, char *const argv[], int &narg, const char *option,
|
2020-07-08 02:26:46 +03:00
|
|
|
|
MASK &mask, const option_verb *verbs) {
|
|
|
|
|
static_assert(sizeof(MASK) <= sizeof(unsigned), "WTF?");
|
|
|
|
|
unsigned u = unsigned(mask);
|
|
|
|
|
if (parse_option<unsigned>(argc, argv, narg, option, u, verbs)) {
|
|
|
|
|
mask = MASK(u);
|
|
|
|
|
return true;
|
|
|
|
|
}
|
|
|
|
|
return false;
|
|
|
|
|
}
|
|
|
|
|
|
|
|
|
|
template <>
|
|
|
|
|
bool parse_option<unsigned>(int argc, char *const argv[], int &narg,
|
|
|
|
|
const char *option, unsigned &mask,
|
|
|
|
|
const option_verb *verbs);
|
2017-03-30 18:54:57 +03:00
|
|
|
|
|
|
|
|
|
bool parse_option(int argc, char *const argv[], int &narg, const char *option,
|
|
|
|
|
uint64_t &value, const scale_mode scale,
|
2018-08-20 13:23:54 +03:00
|
|
|
|
const uint64_t minval = 0, const uint64_t maxval = INT64_MAX,
|
|
|
|
|
const uint64_t default_value = 0);
|
2017-03-30 18:54:57 +03:00
|
|
|
|
|
|
|
|
|
bool parse_option(int argc, char *const argv[], int &narg, const char *option,
|
|
|
|
|
unsigned &value, const scale_mode scale,
|
2018-08-20 13:23:54 +03:00
|
|
|
|
const unsigned minval = 0, const unsigned maxval = INT32_MAX,
|
|
|
|
|
const unsigned default_value = 0);
|
2017-03-30 18:54:57 +03:00
|
|
|
|
|
2017-05-17 20:10:56 +03:00
|
|
|
|
bool parse_option(int argc, char *const argv[], int &narg, const char *option,
|
|
|
|
|
uint8_t &value, const uint8_t minval = 0,
|
2018-08-20 13:23:54 +03:00
|
|
|
|
const uint8_t maxval = 255, const uint8_t default_value = 0);
|
2017-05-17 20:10:56 +03:00
|
|
|
|
|
2018-08-20 13:23:54 +03:00
|
|
|
|
bool parse_option(int argc, char *const argv[], int &narg, const char *option,
|
|
|
|
|
int64_t &value, const int64_t minval, const int64_t maxval,
|
|
|
|
|
const int64_t default_value = -1);
|
|
|
|
|
|
|
|
|
|
bool parse_option(int argc, char *const argv[], int &narg, const char *option,
|
|
|
|
|
int32_t &value, const int32_t minval, const int32_t maxval,
|
|
|
|
|
const int32_t default_value = -1);
|
2019-08-13 02:12:13 +03:00
|
|
|
|
|
|
|
|
|
inline bool parse_option_intptr(int argc, char *const argv[], int &narg,
|
|
|
|
|
const char *option, intptr_t &value,
|
|
|
|
|
const intptr_t minval, const intptr_t maxval,
|
|
|
|
|
const intptr_t default_value = -1) {
|
|
|
|
|
static_assert(sizeof(intptr_t) == 4 || sizeof(intptr_t) == 8, "WTF?");
|
|
|
|
|
if (sizeof(intptr_t) == 8)
|
|
|
|
|
return parse_option(argc, argv, narg, option,
|
|
|
|
|
*reinterpret_cast<int64_t *>(&value), int64_t(minval),
|
|
|
|
|
int64_t(maxval), int64_t(default_value));
|
|
|
|
|
else
|
|
|
|
|
return parse_option(argc, argv, narg, option,
|
|
|
|
|
*reinterpret_cast<int32_t *>(&value), int32_t(minval),
|
|
|
|
|
int32_t(maxval), int32_t(default_value));
|
|
|
|
|
}
|
|
|
|
|
|
2022-04-21 19:42:57 +03:00
|
|
|
|
bool parse_option(int argc, char *const argv[], int &narg, const char *option,
|
|
|
|
|
logging::loglevel &);
|
2017-03-30 18:54:57 +03:00
|
|
|
|
//-----------------------------------------------------------------------------
|
|
|
|
|
|
2017-05-17 20:10:56 +03:00
|
|
|
|
struct keygen_params_pod {
|
2020-05-26 18:39:36 +03:00
|
|
|
|
/* Параметры генератора пар key-value. Также может быть полезным описание
|
|
|
|
|
* алгоритма генерации в keygen.h
|
2017-05-17 20:10:56 +03:00
|
|
|
|
*
|
|
|
|
|
* Ключи и значения генерируются по задаваемым параметрам на основе "плоской"
|
|
|
|
|
* исходной координаты. При этом, в общем случае, в процессе тестов исходная
|
|
|
|
|
* координата последовательно итерируется в заданном диапазоне, а необходимые
|
|
|
|
|
* паттерны/последовательности/узоры получаются за счет преобразования
|
|
|
|
|
* исходной координаты, согласно описанным ниже параметрам.
|
|
|
|
|
*
|
|
|
|
|
* Стоит отметить, что порядок описания параметров для удобства совпадает с
|
|
|
|
|
* порядком их использования, т.е. с порядком соответствующих преобразований.
|
|
|
|
|
*
|
|
|
|
|
* Второе важное замечание касается ограничений одновременной координированной
|
|
|
|
|
* генерации паттеров как для ключей, так и для значений. Суть в том, что
|
|
|
|
|
* такая возможность не нужна по следующим причинам:
|
|
|
|
|
* - libmdbx поддерживает два существенно различающихся вида таблиц,
|
|
|
|
|
* "уникальные" (без дубликатов и без multi-value), и так называемые
|
|
|
|
|
* "с дубликатами" (c multi-value).
|
2020-05-13 00:14:01 +03:00
|
|
|
|
* - Для таблиц "без дубликатов" только размер связанных с ключами значений
|
2017-05-17 20:10:56 +03:00
|
|
|
|
* (данных) оказывает влияния на работу движка, непосредственно содержимое
|
|
|
|
|
* данных не анализируется движком и не оказывает влияния на его работу.
|
|
|
|
|
* - Для таблиц "с дубликатами", при наличии более одного значения для
|
|
|
|
|
* некоторого ключа, формируется дочернее btree-поддерево. Это дерево
|
2020-05-26 18:39:36 +03:00
|
|
|
|
* формируется во вложенной странице или отдельном "кусте" страниц,
|
|
|
|
|
* и обслуживается независимо от окружения родительского ключа.
|
2017-05-17 20:10:56 +03:00
|
|
|
|
* - Таким образом, паттерн генерации значений имеет смысл только для
|
|
|
|
|
* таблиц "с дубликатами" и только в контексте одного значения ключа.
|
2020-05-26 18:39:36 +03:00
|
|
|
|
* Иначе говоря, не имеет смысла взаимная координация при генерации
|
|
|
|
|
* значений для разных ключей. Поэтому генерацию значений следует
|
|
|
|
|
* рассматривать только в контексте связки с одним значением ключа.
|
|
|
|
|
* - Тем не менее, во всех случаях достаточно важным является равновероятное
|
|
|
|
|
* распределение всех возможных сочетаний длин ключей и данных.
|
2017-05-17 20:10:56 +03:00
|
|
|
|
*
|
|
|
|
|
* width:
|
|
|
|
|
* Большинство тестов предполагают создание или итерирование некоторого
|
|
|
|
|
* количества записей. При этом требуется итерирование или генерация
|
|
|
|
|
* значений и ключей из некоторого ограниченного пространства вариантов.
|
|
|
|
|
*
|
|
|
|
|
* Параметр width задает такую ширину пространства вариантов в битах.
|
|
|
|
|
* Таким образом мощность пространства вариантов (пока) всегда равна
|
|
|
|
|
* степени двойки. Это ограничение можно снять, но ценой увеличения
|
|
|
|
|
* вычислительной сложности, включая потерю простоты и прозрачности.
|
|
|
|
|
*
|
2020-05-26 18:39:36 +03:00
|
|
|
|
* С другой стороны, не-n-битовый width может быть полезен:
|
2017-05-17 20:10:56 +03:00
|
|
|
|
* - Позволит генерировать ключи/значения в точно задаваемом диапазоне.
|
|
|
|
|
* Например, перебрать в псевдо-случайном порядке 10001 значение.
|
|
|
|
|
* - Позволит поровну разделять заданное пространство (диапазон)
|
|
|
|
|
* ключей/значений между количеством потоков некратным степени двойки.
|
|
|
|
|
*
|
|
|
|
|
* mesh и seed:
|
|
|
|
|
* Позволяют получить псевдо-случайные последовательности ключей/значений.
|
|
|
|
|
* Параметр mesh задает сколько младших бит исходной плоской координаты
|
|
|
|
|
* будет "перемешано" (инъективно отображено), а параметр seed позволяет
|
|
|
|
|
* выбрать конкретный вариант "перемешивания".
|
|
|
|
|
*
|
|
|
|
|
* Перемешивание выполняется при ненулевом значении mesh. Перемешивание
|
|
|
|
|
* реализуется посредством применения двух инъективных функций для
|
|
|
|
|
* заданного количества бит:
|
|
|
|
|
* - применяется первая инъективная функция;
|
|
|
|
|
* - к результату добавляется salt полученный из seed;
|
|
|
|
|
* - применяется вторая инъективная функция;
|
|
|
|
|
*
|
|
|
|
|
* Следует отметить, что mesh умышленно позволяет перемешать только младшую
|
|
|
|
|
* часть, что при ненулевом значении split (см далее) не позволяет получать
|
|
|
|
|
* псевдо-случайные значений ключей без псевдо-случайности в значениях.
|
|
|
|
|
*
|
|
|
|
|
* Такое ограничение соответствуют внутренней алгоритмике libmdbx. Проще
|
2018-08-31 18:50:35 +03:00
|
|
|
|
* говоря, мы можем проверить движок псевдо-случайной последовательностью
|
2017-05-17 20:10:56 +03:00
|
|
|
|
* ключей на таблицах без дубликатов (без multi-value), а затем проверить
|
|
|
|
|
* корректность работу псевдо-случайной последовательностью значений на
|
|
|
|
|
* таблицах с дубликатами (с multi-value), опционально добавляя
|
|
|
|
|
* псевдо-случайности к последовательности ключей. Однако, нет смысла
|
|
|
|
|
* генерировать псевдо-случайные ключи, одновременно с формированием
|
|
|
|
|
* какого-либо паттерна в значениях, так как содержимое в данных либо
|
|
|
|
|
* не будет иметь значения (для таблиц без дубликатов), либо будет
|
|
|
|
|
* обрабатываться в отдельных btree-поддеревьях.
|
|
|
|
|
*
|
|
|
|
|
* rotate и offset:
|
|
|
|
|
* Для проверки слияния и разделения страниц внутри движка требуются
|
|
|
|
|
* генерация ключей/значений в виде не-смежных последовательностей, как-бы
|
2020-05-26 18:39:36 +03:00
|
|
|
|
* в виде "пунктира", который постепенно заполняет весь заданный диапазон.
|
2017-05-17 20:10:56 +03:00
|
|
|
|
*
|
|
|
|
|
* Параметры позволяют генерировать такой "пунктир". Соответственно rotate
|
|
|
|
|
* задает циклический сдвиг вправо, а offset задает смещение, точнее говоря
|
|
|
|
|
* сложение по модулю внутри диапазона заданного посредством width.
|
|
|
|
|
*
|
|
|
|
|
* Например, при rotate равном 1 (циклический сдвиг вправо на 1 бит),
|
|
|
|
|
* четные и нечетные исходные значения сложатся в две линейные
|
|
|
|
|
* последовательности, которые постепенно закроют старшую и младшую
|
|
|
|
|
* половины диапазона.
|
|
|
|
|
*
|
|
|
|
|
* split:
|
|
|
|
|
* Для таблиц без дубликатов (без multi-value ключей) фактически требуется
|
|
|
|
|
* генерация только ключей, а данные могут быть постоянным. Но для таблиц с
|
|
|
|
|
* дубликатами (с multi-value ключами) также требуется генерация значений.
|
|
|
|
|
*
|
|
|
|
|
* Ненулевое значение параметра split фактически включает генерацию значений,
|
|
|
|
|
* при этом значение split определяет сколько бит исходного абстрактного
|
|
|
|
|
* номера будет отрезано для генерации значения.
|
|
|
|
|
*/
|
|
|
|
|
|
2020-05-02 22:38:19 +03:00
|
|
|
|
uint8_t width{0};
|
|
|
|
|
uint8_t mesh{0};
|
|
|
|
|
uint8_t rotate{0};
|
|
|
|
|
uint8_t split{0};
|
|
|
|
|
uint32_t seed{0};
|
|
|
|
|
uint64_t offset{0};
|
|
|
|
|
keygen_case keycase{kc_random};
|
2020-05-25 02:25:24 +03:00
|
|
|
|
bool zero_fill{false};
|
2017-05-17 20:10:56 +03:00
|
|
|
|
};
|
|
|
|
|
|
2017-03-30 18:54:57 +03:00
|
|
|
|
struct actor_params_pod {
|
2020-07-08 02:26:46 +03:00
|
|
|
|
MDBX_env_flags_t mode_flags{MDBX_ENV_DEFAULTS};
|
|
|
|
|
MDBX_db_flags_t table_flags{MDBX_DB_DEFAULTS};
|
2020-05-02 22:38:19 +03:00
|
|
|
|
intptr_t size_lower{0};
|
|
|
|
|
intptr_t size_now{0};
|
|
|
|
|
intptr_t size_upper{0};
|
|
|
|
|
int shrink_threshold{0};
|
|
|
|
|
int growth_step{0};
|
|
|
|
|
int pagesize{0};
|
|
|
|
|
|
|
|
|
|
unsigned test_duration{0};
|
|
|
|
|
unsigned test_nops{0};
|
|
|
|
|
unsigned nrepeat{0};
|
|
|
|
|
unsigned nthreads{0};
|
|
|
|
|
|
|
|
|
|
unsigned keylen_min{0}, keylen_max{0};
|
|
|
|
|
unsigned datalen_min{0}, datalen_max{0};
|
|
|
|
|
|
|
|
|
|
unsigned batch_read{0};
|
|
|
|
|
unsigned batch_write{0};
|
|
|
|
|
|
|
|
|
|
unsigned delaystart{0};
|
|
|
|
|
unsigned waitfor_nops{0};
|
|
|
|
|
unsigned inject_writefaultn{0};
|
|
|
|
|
|
|
|
|
|
unsigned max_readers{0};
|
|
|
|
|
unsigned max_tables{0};
|
2017-05-17 20:10:56 +03:00
|
|
|
|
keygen_params_pod keygen;
|
|
|
|
|
|
2020-05-02 22:38:19 +03:00
|
|
|
|
uint8_t loglevel{0};
|
2020-07-05 02:25:52 +03:00
|
|
|
|
bool drop_table{false};
|
|
|
|
|
bool ignore_dbfull{false};
|
|
|
|
|
bool speculum{false};
|
|
|
|
|
bool random_writemap{true};
|
2021-03-16 02:44:28 +03:00
|
|
|
|
|
|
|
|
|
uint64_t serial_base() const {
|
|
|
|
|
// FIXME: TODO
|
|
|
|
|
return 0;
|
|
|
|
|
}
|
|
|
|
|
static MDBX_PURE_FUNCTION uint64_t serial_mask(unsigned bits) {
|
|
|
|
|
assert(bits > 0 && bits <= 64);
|
|
|
|
|
return (~(uint64_t)0u) >> (64 - bits);
|
|
|
|
|
}
|
2017-03-30 18:54:57 +03:00
|
|
|
|
};
|
|
|
|
|
|
|
|
|
|
struct actor_config_pod {
|
2020-05-02 22:38:19 +03:00
|
|
|
|
unsigned actor_id{0}, space_id{0};
|
|
|
|
|
actor_testcase testcase{ac_none};
|
|
|
|
|
unsigned wait4id{0};
|
|
|
|
|
unsigned signal_nops{0};
|
|
|
|
|
|
|
|
|
|
actor_config_pod() = default;
|
|
|
|
|
actor_config_pod(unsigned actor_id, actor_testcase testcase,
|
|
|
|
|
unsigned space_id, unsigned wait4id)
|
|
|
|
|
: actor_id(actor_id), space_id(space_id), testcase(testcase),
|
|
|
|
|
wait4id(wait4id) {}
|
2017-03-30 18:54:57 +03:00
|
|
|
|
};
|
|
|
|
|
|
|
|
|
|
extern const struct option_verb mode_bits[];
|
|
|
|
|
extern const struct option_verb table_bits[];
|
2017-04-11 12:55:16 +03:00
|
|
|
|
void dump(const char *title = "config-dump: ");
|
2017-03-30 18:54:57 +03:00
|
|
|
|
|
|
|
|
|
} /* namespace config */
|
|
|
|
|
|
|
|
|
|
struct actor_params : public config::actor_params_pod {
|
|
|
|
|
std::string pathname_log;
|
|
|
|
|
std::string pathname_db;
|
2020-05-02 22:38:19 +03:00
|
|
|
|
actor_params() = default;
|
2018-08-31 17:05:00 +03:00
|
|
|
|
|
2020-05-02 22:38:19 +03:00
|
|
|
|
void set_defaults(const std::string &tmpdir);
|
2021-03-16 02:44:28 +03:00
|
|
|
|
bool make_keygen_linear();
|
2018-08-31 17:05:00 +03:00
|
|
|
|
unsigned mdbx_keylen_min() const;
|
|
|
|
|
unsigned mdbx_keylen_max() const;
|
|
|
|
|
unsigned mdbx_datalen_min() const;
|
|
|
|
|
unsigned mdbx_datalen_max() const;
|
2017-03-30 18:54:57 +03:00
|
|
|
|
};
|
|
|
|
|
|
|
|
|
|
struct actor_config : public config::actor_config_pod {
|
|
|
|
|
actor_params params;
|
|
|
|
|
|
|
|
|
|
bool wanna_event4signalling() const { return true /* TODO ? */; }
|
|
|
|
|
|
2020-05-02 22:38:19 +03:00
|
|
|
|
actor_config() = default;
|
2017-04-21 18:41:11 +03:00
|
|
|
|
actor_config(actor_testcase testcase, const actor_params ¶ms,
|
|
|
|
|
unsigned space_id, unsigned wait4id);
|
2017-03-30 18:54:57 +03:00
|
|
|
|
|
2020-05-02 22:38:19 +03:00
|
|
|
|
actor_config(const char *str) : actor_config() {
|
2017-03-30 18:54:57 +03:00
|
|
|
|
if (!deserialize(str, *this))
|
|
|
|
|
failure("Invalid internal parameter '%s'\n", str);
|
|
|
|
|
}
|
|
|
|
|
|
|
|
|
|
const std::string osal_serialize(simple_checksum &) const;
|
|
|
|
|
bool osal_deserialize(const char *str, const char *end, simple_checksum &);
|
|
|
|
|
|
|
|
|
|
const std::string serialize(const char *prefix) const;
|
|
|
|
|
static bool deserialize(const char *str, actor_config &config);
|
|
|
|
|
|
|
|
|
|
bool is_waitable(size_t nops) const {
|
|
|
|
|
switch (testcase) {
|
|
|
|
|
case ac_hill:
|
2017-04-21 18:41:11 +03:00
|
|
|
|
if (!params.test_nops || params.test_nops >= nops)
|
2017-03-30 18:54:57 +03:00
|
|
|
|
return true;
|
2017-10-28 10:35:01 +03:00
|
|
|
|
__fallthrough;
|
2017-03-30 18:54:57 +03:00
|
|
|
|
default:
|
|
|
|
|
return false;
|
|
|
|
|
}
|
|
|
|
|
}
|
|
|
|
|
};
|