mirror of
https://github.com/isar/libmdbx.git
synced 2025-01-20 00:18:21 +08:00
aea40fb79f
Поддерживающий выпуск с исправлением обнаруженных ошибок и устранением недочетов в память Героя России гвардии майора Дмитрия Семёнова с позывным "СЭМ". Значимые исправления и доработки: --------------------------------- - Устранение унаследованной от LMDB ошибки приводящей к повреждению БД при использовании `MDBX_DUPFIXED`. - Исправление ложной ошибки `MDBX_CORRUPTED (-30796)` в сценарии работы в режиме `MDBX_DUPFIXED` и нечетной длинной мульти-значений. - Исправление недочета корректировки сопутствующих курсоров при разделении страницы по сценарию добавления пустой страницы слева. - Доработка `rebalance()` ради уменьшения WAF. - Исправление assert-проверки внутри `check_txn()` для случая завершенных транзакций в режиме `MDBX_NO_TLS`. Последствий ошибки, кроме срабатывания assert-проверки в отладочных сборках, нет. - Устранение ошибки при открытии БД на файловой системе только-для-чтения. - Удалены излишне строгие проверки в утилите `mdbx_chk`, которые приводили к ложно-позитивным ошибкам при проверке БД после серии последних доработок. Более подробная информация в [ChangeLog](https://libmdbx.dqdkfa.ru/md__change_log.html). git diff' stat: 19 commits, 57 files changed, 751 insertions(+), 331 deletions(-) Signed-off-by: Леонид Юрьев (Leonid Yuriev) <leo@yuriev.ru>
356 lines
13 KiB
C++
356 lines
13 KiB
C++
/*
|
||
* Copyright 2017-2024 Leonid Yuriev <leo@yuriev.ru>
|
||
* and other libmdbx authors: please see AUTHORS file.
|
||
* All rights reserved.
|
||
*
|
||
* Redistribution and use in source and binary forms, with or without
|
||
* modification, are permitted only as authorized by the OpenLDAP
|
||
* Public License.
|
||
*
|
||
* A copy of this license is available in the file LICENSE in the
|
||
* top-level directory of the distribution or, alternatively, at
|
||
* <http://www.OpenLDAP.org/license.html>.
|
||
*/
|
||
|
||
#include "test.h++"
|
||
#include <cmath>
|
||
|
||
/* LY: тест "эмуляцией time-to-live" с вложенными транзакциями:
|
||
* - организуется "скользящее окно", которое каждую транзакцию сдвигается
|
||
* вперед вдоль числовой оси.
|
||
* - по переднему краю "скользящего окна" записи добавляются в таблицу,
|
||
* а по заднему удаляются.
|
||
* - количество добавляемых/удаляемых записей псевдослучайно зависит
|
||
* от номера транзакции, но с экспоненциальным распределением.
|
||
* - размер "скользящего окна" также псевдослучайно зависит от номера
|
||
* транзакции с "отрицательным" экспоненциальным распределением
|
||
* MAX_WIDTH - exp(rnd(N)), при уменьшении окна сдвигается задний
|
||
* край и удаляются записи позади него.
|
||
* - групповое добавление данных в начало окна и групповое удаление в конце,
|
||
* преимущественно выполняются во вложенных транзакциях.
|
||
* - меньшая часть запускаемых вложенных транзакций отменяется, с последующим
|
||
* продолжением итераций с состояния предыдущиего коммита.
|
||
*
|
||
* Таким образом имитируется поведение таблицы с TTL: записи стохастически
|
||
* добавляются и удаляются, и изредка происходят массивные удаления. */
|
||
|
||
class testcase_nested : public testcase_ttl {
|
||
using inherited = testcase_ttl;
|
||
using FIFO = std::deque<std::pair<uint64_t, unsigned>>;
|
||
|
||
uint64_t serial{0};
|
||
unsigned clear_wholetable_passed{0};
|
||
unsigned clear_stepbystep_passed{0};
|
||
unsigned dbfull_passed{0};
|
||
bool keyspace_overflow{false};
|
||
FIFO fifo;
|
||
std::stack<std::tuple<scoped_txn_guard, uint64_t, FIFO, SET>> stack;
|
||
|
||
bool trim_tail(unsigned window_width);
|
||
bool grow_head(unsigned head_count);
|
||
bool pop_txn(bool abort);
|
||
bool pop_txn() {
|
||
return pop_txn(inherited::is_nested_txn_available() ? flipcoin_x3()
|
||
: flipcoin_x2());
|
||
}
|
||
void push_txn();
|
||
bool stochastic_breakable_restart_with_nested(bool force_restart = false);
|
||
|
||
public:
|
||
testcase_nested(const actor_config &config, const mdbx_pid_t pid)
|
||
: inherited(config, pid) {}
|
||
bool setup() override;
|
||
bool run() override;
|
||
bool teardown() override;
|
||
};
|
||
REGISTER_TESTCASE(nested);
|
||
|
||
bool testcase_nested::setup() {
|
||
if (!inherited::setup())
|
||
return false;
|
||
int err = db_open__begin__table_create_open_clean(dbi);
|
||
if (unlikely(err != MDBX_SUCCESS)) {
|
||
log_notice("nested: bailout-prepare due '%s'", mdbx_strerror(err));
|
||
return false;
|
||
}
|
||
|
||
keyvalue_maker.setup(config.params, config.actor_id, 0 /* thread_number */);
|
||
key = keygen::alloc(config.params.keylen_max);
|
||
data = keygen::alloc(config.params.datalen_max);
|
||
serial = 0;
|
||
fifo.clear();
|
||
speculum.clear();
|
||
assert(stack.empty());
|
||
stack.emplace(nullptr, serial, fifo, speculum);
|
||
return true;
|
||
}
|
||
|
||
bool testcase_nested::teardown() {
|
||
while (!stack.empty())
|
||
pop_txn(true);
|
||
|
||
bool ok = true;
|
||
if (dbi) {
|
||
if (config.params.drop_table && !mode_readonly()) {
|
||
txn_begin(false);
|
||
db_table_drop(dbi);
|
||
int err = breakable_commit();
|
||
if (unlikely(err != MDBX_SUCCESS) &&
|
||
(err != MDBX_MAP_FULL || !config.params.ignore_dbfull)) {
|
||
log_notice("nested: bailout-clean due '%s'", mdbx_strerror(err));
|
||
ok = false;
|
||
}
|
||
} else {
|
||
if (txn_guard)
|
||
txn_end(false);
|
||
db_table_close(dbi);
|
||
}
|
||
dbi = 0;
|
||
}
|
||
return inherited::teardown() && ok;
|
||
}
|
||
|
||
void testcase_nested::push_txn() {
|
||
MDBX_txn *nested_txn;
|
||
MDBX_txn_flags_t flags = MDBX_txn_flags_t(
|
||
prng32() & uint32_t(MDBX_TXN_NOSYNC | MDBX_TXN_NOMETASYNC));
|
||
int err = mdbx_txn_begin(db_guard.get(), txn_guard.get(), flags, &nested_txn);
|
||
if (unlikely(err != MDBX_SUCCESS))
|
||
failure_perror("mdbx_txn_begin(nested)", err);
|
||
/* CLANG/LLVM C++ library could stupidly copy std::set<> item-by-item,
|
||
* i.e. with insertion(s) & comparison(s), which will cause null dereference
|
||
* during call mdbx_cmp() with zero txn. So it is the workaround for this:
|
||
* - explicitly set txn_guard with the new nested txn;
|
||
* - explicitly copy the `speculum` (an instance of std::set<>). */
|
||
scoped_txn_guard nested_txn_guard(nested_txn);
|
||
txn_guard.swap(nested_txn_guard);
|
||
SET speculum_snapshot(speculum);
|
||
stack.emplace(std::move(nested_txn_guard), serial, fifo,
|
||
std::move(speculum_snapshot));
|
||
log_verbose("begin level#%zu txn #%" PRIu64 ", flags 0x%x, serial %" PRIu64,
|
||
stack.size(), mdbx_txn_id(nested_txn), flags, serial);
|
||
if (!dbi && stack.size() == 1)
|
||
dbi = db_table_open(true);
|
||
}
|
||
|
||
bool testcase_nested::pop_txn(bool abort) {
|
||
assert(txn_guard && !stack.empty());
|
||
bool should_continue = true;
|
||
MDBX_txn *txn = txn_guard.release();
|
||
bool committed = false;
|
||
if (abort) {
|
||
log_verbose(
|
||
"abort level#%zu txn #%" PRIu64 ", undo serial %" PRIu64 " <- %" PRIu64,
|
||
stack.size(), mdbx_txn_id(txn), serial, std::get<1>(stack.top()));
|
||
if (dbi > 0 && stack.size() == 1 &&
|
||
is_handle_created_in_current_txn(dbi, txn))
|
||
dbi = 0;
|
||
int err = mdbx_txn_abort(txn);
|
||
if (unlikely(err != MDBX_SUCCESS))
|
||
failure_perror("mdbx_txn_abort()", err);
|
||
} else {
|
||
log_verbose("commit level#%zu txn, nested serial %" PRIu64 " -> %" PRIu64,
|
||
stack.size(), serial, std::get<1>(stack.top()));
|
||
int err = mdbx_txn_commit(txn);
|
||
if (likely(err == MDBX_SUCCESS))
|
||
committed = true;
|
||
else {
|
||
should_continue = false;
|
||
if (err == MDBX_MAP_FULL && config.params.ignore_dbfull) {
|
||
err = mdbx_txn_abort(txn);
|
||
if (unlikely(err != MDBX_SUCCESS && err != MDBX_THREAD_MISMATCH &&
|
||
err != MDBX_BAD_TXN))
|
||
failure_perror("mdbx_txn_abort()", err);
|
||
} else
|
||
failure_perror("mdbx_txn_commit()", err);
|
||
}
|
||
}
|
||
|
||
std::swap(txn_guard, std::get<0>(stack.top()));
|
||
if (!committed) {
|
||
serial = std::get<1>(stack.top());
|
||
std::swap(fifo, std::get<2>(stack.top()));
|
||
std::swap(speculum, std::get<3>(stack.top()));
|
||
}
|
||
stack.pop();
|
||
return should_continue;
|
||
}
|
||
|
||
bool testcase_nested::stochastic_breakable_restart_with_nested(
|
||
bool force_restart) {
|
||
log_trace(">> stochastic_breakable_restart_with_nested%s",
|
||
force_restart ? ": force_restart" : "");
|
||
|
||
if (force_restart)
|
||
while (txn_guard)
|
||
pop_txn(true);
|
||
|
||
bool should_continue = true;
|
||
while (!stack.empty() &&
|
||
(flipcoin() || txn_underutilization_x256(txn_guard.get()) < 42))
|
||
should_continue &= pop_txn();
|
||
|
||
if (flipcoin_x3()) {
|
||
unsigned period;
|
||
int err = mdbx_env_get_syncperiod(db_guard.get(), &period);
|
||
if (unlikely(err != MDBX_SUCCESS))
|
||
failure_perror("mdbx_env_get_syncperiod()", err);
|
||
|
||
size_t bytes;
|
||
err = mdbx_env_get_syncbytes(db_guard.get(), &bytes);
|
||
if (unlikely(err != MDBX_SUCCESS))
|
||
failure_perror("mdbx_env_get_syncbytes()", err);
|
||
|
||
err = mdbx_env_set_syncperiod(db_guard.get(), period ^ 42);
|
||
if (unlikely(err != MDBX_SUCCESS) && err != MDBX_BUSY)
|
||
failure_perror("mdbx_env_set_syncperiod()", err);
|
||
|
||
err = mdbx_env_set_syncbytes(db_guard.get(), bytes ^ 42000);
|
||
if (unlikely(err != MDBX_SUCCESS) && err != MDBX_BUSY)
|
||
failure_perror("mdbx_env_set_syncbytes()", err);
|
||
}
|
||
|
||
if (should_continue)
|
||
while (stack.empty() ||
|
||
(is_nested_txn_available() && flipcoin() && stack.size() < 5))
|
||
push_txn();
|
||
|
||
log_trace("<< stochastic_breakable_restart_with_nested: should_continue=%s",
|
||
should_continue ? "yes" : "no");
|
||
return should_continue;
|
||
}
|
||
|
||
bool testcase_nested::trim_tail(unsigned window_width) {
|
||
if (window_width || flipcoin()) {
|
||
clear_stepbystep_passed += window_width == 0;
|
||
while (fifo.size() > window_width) {
|
||
uint64_t tail_serial = fifo.back().first;
|
||
const unsigned tail_count = fifo.back().second;
|
||
log_verbose("nested: trim-tail (serial %" PRIu64 ", count %u)",
|
||
tail_serial, tail_count);
|
||
fifo.pop_back();
|
||
for (unsigned n = 0; n < tail_count; ++n) {
|
||
log_trace("nested: remove-tail %" PRIu64, tail_serial);
|
||
generate_pair(tail_serial);
|
||
int err = remove(key, data);
|
||
if (unlikely(err != MDBX_SUCCESS)) {
|
||
if (err == MDBX_MAP_FULL && config.params.ignore_dbfull) {
|
||
log_notice("nested: tail-bailout due '%s'", mdbx_strerror(err));
|
||
return false;
|
||
}
|
||
failure_perror("mdbx_del(tail)", err);
|
||
}
|
||
if (unlikely(!keyvalue_maker.increment(tail_serial, 1)))
|
||
failure("nested: unexpected key-space overflow on the tail");
|
||
}
|
||
report(tail_count);
|
||
}
|
||
} else if (!fifo.empty()) {
|
||
log_verbose("nested: purge state %" PRIu64 " - %" PRIu64 ", fifo-items %zu",
|
||
fifo.front().first, fifo.back().first + fifo.back().second,
|
||
fifo.size());
|
||
db_table_clear(dbi, txn_guard.get());
|
||
fifo.clear();
|
||
clear_wholetable_passed += 1;
|
||
report(1);
|
||
}
|
||
return true;
|
||
}
|
||
|
||
bool testcase_nested::grow_head(unsigned head_count) {
|
||
const MDBX_put_flags_t insert_flags =
|
||
(config.params.table_flags & MDBX_DUPSORT)
|
||
? MDBX_NODUPDATA
|
||
: MDBX_NODUPDATA | MDBX_NOOVERWRITE;
|
||
retry:
|
||
fifo.push_front(std::make_pair(serial, head_count));
|
||
for (unsigned n = 0; n < head_count; ++n) {
|
||
log_trace("nested: insert-head %" PRIu64, serial);
|
||
generate_pair(serial);
|
||
int err = insert(key, data, insert_flags);
|
||
if (unlikely(err != MDBX_SUCCESS)) {
|
||
if (err == MDBX_MAP_FULL && config.params.ignore_dbfull) {
|
||
log_notice("nested: head-insert skip due '%s'", mdbx_strerror(err));
|
||
head_count = n;
|
||
stochastic_breakable_restart_with_nested(true);
|
||
dbfull_passed += 1;
|
||
goto retry;
|
||
}
|
||
failure_perror("mdbx_put(head)", err);
|
||
}
|
||
|
||
if (unlikely(!keyvalue_maker.increment(serial, 1))) {
|
||
log_notice("nested: unexpected key-space overflow");
|
||
keyspace_overflow = true;
|
||
head_count = n;
|
||
stochastic_breakable_restart_with_nested(true);
|
||
goto retry;
|
||
}
|
||
}
|
||
|
||
return true;
|
||
}
|
||
|
||
bool testcase_nested::run() {
|
||
uint64_t seed =
|
||
prng64_map2_white(config.params.keygen.seed) + config.actor_id;
|
||
|
||
clear_wholetable_passed = 0;
|
||
clear_stepbystep_passed = 0;
|
||
dbfull_passed = 0;
|
||
unsigned loops = 0;
|
||
while (true) {
|
||
const uint64_t salt = prng64_white(seed) /* mdbx_txn_id(txn_guard.get()) */;
|
||
const unsigned window_width =
|
||
(!should_continue() || flipcoin_x4()) ? 0 : edge2window(salt);
|
||
const unsigned head_count = edge2count(salt);
|
||
log_debug("nested: step #%" PRIu64 " (serial %" PRIu64
|
||
", window %u, count %u) salt %" PRIu64,
|
||
nops_completed, serial, window_width, head_count, salt);
|
||
|
||
if (!trim_tail(window_width))
|
||
return false;
|
||
if (!stochastic_breakable_restart_with_nested()) {
|
||
log_notice("nested: bailout at commit/restart after tail-trim");
|
||
return false;
|
||
}
|
||
if (!speculum_verify()) {
|
||
log_notice("nested: bailout after tail-trim");
|
||
return false;
|
||
}
|
||
|
||
if (!keyspace_overflow && (should_continue() || !clear_wholetable_passed ||
|
||
!clear_stepbystep_passed)) {
|
||
unsigned underutilization_x256 =
|
||
txn_underutilization_x256(txn_guard.get());
|
||
if (dbfull_passed > underutilization_x256) {
|
||
log_notice("nested: skip head-grow to avoid one more dbfull (was %u, "
|
||
"underutilization %.2f%%)",
|
||
dbfull_passed, underutilization_x256 / 2.560);
|
||
continue;
|
||
}
|
||
if (!grow_head(head_count))
|
||
return false;
|
||
if (!stochastic_breakable_restart_with_nested())
|
||
log_notice("nested: skip commit/restart after head-grow");
|
||
if (!speculum_verify()) {
|
||
log_notice("nested: bailout after head-grow");
|
||
return false;
|
||
}
|
||
loops += 1;
|
||
} else if (fifo.empty()) {
|
||
log_notice("nested: done %u whole loops, %" PRIu64 " ops, %" PRIu64
|
||
" items",
|
||
loops, nops_completed, serial);
|
||
break;
|
||
} else {
|
||
log_notice("nested: done, wait for empty, skip head-grow");
|
||
}
|
||
}
|
||
|
||
while (!stack.empty())
|
||
pop_txn(false);
|
||
|
||
return speculum_verify();
|
||
}
|