mirror of
https://github.com/isar/libmdbx.git
synced 2025-01-16 06:34:30 +08:00
358 lines
18 KiB
C
358 lines
18 KiB
C
/// \copyright SPDX-License-Identifier: Apache-2.0
|
||
/// \author Леонид Юрьев aka Leonid Yuriev <leo@yuriev.ru> \date 2015-2024
|
||
|
||
#pragma once
|
||
|
||
#include "essentials.h"
|
||
|
||
/* Состояние курсора.
|
||
*
|
||
* плохой/poor:
|
||
* - неустановленный курсор с незаполненым стеком;
|
||
* - следует пропускать во всех циклах отслеживания/корректировки
|
||
* позиций курсоров;
|
||
* - допускаются только операции предполагающие установку абсолютной позиции;
|
||
* - в остальных случаях возвращается ENODATA.
|
||
*
|
||
* У таких курсоров top = -1 и flags < 0, что позволяет дешево проверять и
|
||
* пропускать такие курсоры в циклах отслеживания/корректировки по условию
|
||
* probe_cursor->top < this_cursor->top.
|
||
*
|
||
* пустой/hollow:
|
||
* - частично инициализированный курсор, но без доступной пользователю позиции,
|
||
* поэтому нельзя выполнить какую-либо операцию без абсолютного (не
|
||
* относительного) позиционирования;
|
||
* - ki[top] может быть некорректным, в том числе >= page_numkeys(pg[top]).
|
||
*
|
||
* У таких курсоров top >= 0, но flags < 0 (есть флажок z_hollow).
|
||
*
|
||
* установленный/pointed:
|
||
* - полностью инициализированный курсор с конкретной позицией с данными;
|
||
* - можно прочитать текущую строку, удалить её, либо выполнить
|
||
* относительное перемещение;
|
||
* - может иметь флажки z_after_delete, z_eof_hard и z_eof_soft;
|
||
* - наличие z_eof_soft означает что курсор перемещен за пределы данных,
|
||
* поэтому нелья прочитать текущие данные, либо удалить их.
|
||
*
|
||
* У таких курсоров top >= 0 и flags >= 0 (нет флажка z_hollow).
|
||
*
|
||
* наполненный данными/filled:
|
||
* - это установленный/pointed курсор без флагов z_eof_soft;
|
||
* - за курсором есть даные, возможны CRUD операции в текущей позиции.
|
||
*
|
||
* У таких курсоров top >= 0 и (unsigned)flags < z_eof_soft.
|
||
*
|
||
* Изменения состояния.
|
||
*
|
||
* - Сбрасывается состояние курсора посредством top_and_flags |= z_poor_mark,
|
||
* что равносильно top = -1 вместе с flags |= z_poor_mark;
|
||
* - При позиционировании курсора сначала устанавливается top, а flags
|
||
* только в самом конце при отсутстви ошибок.
|
||
* - Повторное позиционирование first/last может начинаться
|
||
* с установки/обнуления только top без сброса flags, что позволяет работать
|
||
* быстрому пути внутри tree_search_finalize().
|
||
*
|
||
* - Заморочки с концом данных:
|
||
* - mdbx_cursor_get(NEXT) выполняет две операции (перемещение и чтение),
|
||
* поэтому перемещение на последнюю строку строку всегда успешно,
|
||
* а ошибка возвращается только при последующем next().
|
||
* Однако, из-за этой двойственности семантика ситуации возврата ошибки
|
||
* из mdbx_cursor_get(NEXT) допускает разночтение/неопределенность, ибо
|
||
* не понятно к чему относится ошибка:
|
||
* - Если к чтению данных, то курсор перемещен и стоит после последней
|
||
* строки. Соответственно, чтение в текущей позиции запрещено,
|
||
* а при выполнении prev() курсор вернется на последнюю строку;
|
||
* - Если же ошибка относится к перемещению, то курсор не перемещен и
|
||
* остается на последней строке. Соответственно, чтение в текущей
|
||
* позиции допустимо, а при выполнении prev() курсор встанет
|
||
* на пред-последнюю строку.
|
||
* - Пикантность в том, что пользователи (так или иначе) полагаются
|
||
* на оба варианта поведения, при этом конечно ожидают что после
|
||
* ошибки MDBX_NEXT функция mdbx_cursor_eof() будет возвращать true.
|
||
* - далее добавляется схожая ситуация с MDBX_GET_RANGE, MDBX_LOWERBOUND,
|
||
* MDBX_GET_BOTH_RANGE и MDBX_UPPERBOUND. Тут при неуспехе поиска курсор
|
||
* может/должен стоять после последней строки.
|
||
* - далее добавляется MDBX_LAST. Тут курсор должен стоять на последней
|
||
* строке и допускать чтение в текузщей позиции,
|
||
* но mdbx_cursor_eof() должен возвращать true.
|
||
*
|
||
* Решение = делаем два флажка z_eof_soft и z_eof_hard:
|
||
* - Когда установлен только z_eof_soft,
|
||
* функция mdbx_cursor_eof() возвращает true, но допускается
|
||
* чтение данных в текущей позиции, а prev() передвигает курсор
|
||
* на пред-последнюю строку.
|
||
* - Когда установлен z_eof_hard, чтение данных в текущей позиции
|
||
* не допускается, и mdbx_cursor_eof() также возвращает true,
|
||
* а prev() устанавливает курсора на последюю строку. */
|
||
enum cursor_state {
|
||
/* Это вложенный курсор для вложенного дерева/страницы и является
|
||
inner-элементом struct cursor_couple. */
|
||
z_inner = 0x01,
|
||
|
||
/* Происходит подготовка к обновлению GC,
|
||
поэтому можно брать страницы из GC даже для FREE_DBI. */
|
||
z_gcu_preparation = 0x02,
|
||
|
||
/* Курсор только-что создан, поэтому допускается авто-установка
|
||
в начало/конец, вместо возврата ошибки. */
|
||
z_fresh = 0x04,
|
||
|
||
/* Предыдущей операцией было удаление, поэтому курсор уже физически указывает
|
||
на следующий элемент и соответствующая операция перемещения должна
|
||
игнорироваться. */
|
||
z_after_delete = 0x08,
|
||
|
||
/* */
|
||
z_disable_tree_search_fastpath = 0x10,
|
||
|
||
/* Курсор логически в конце данных, но физически на последней строке,
|
||
* ki[top] == page_numkeys(pg[top]) - 1 и читать данные в текущей позиции. */
|
||
z_eof_soft = 0x20,
|
||
|
||
/* Курсор логически за концом данных, поэтому следующий переход "назад"
|
||
должен игнорироваться и/или приводить к установке на последнюю строку.
|
||
В текущем же состоянии нельзя делать CRUD операции. */
|
||
z_eof_hard = 0x40,
|
||
|
||
/* За курсором нет данных, логически его позиция не определена,
|
||
нельзя делать CRUD операции в текущей позиции.
|
||
Относительное перемещение запрещено. */
|
||
z_hollow = -128 /* 0x80 */,
|
||
|
||
/* Маски для сброса/установки состояния. */
|
||
z_clear_mask = z_inner | z_gcu_preparation,
|
||
z_poor_mark = z_eof_hard | z_hollow | z_disable_tree_search_fastpath,
|
||
z_fresh_mark = z_poor_mark | z_fresh
|
||
};
|
||
|
||
MDBX_MAYBE_UNUSED MDBX_NOTHROW_PURE_FUNCTION static inline bool is_inner(const MDBX_cursor *mc) {
|
||
return (mc->flags & z_inner) != 0;
|
||
}
|
||
|
||
MDBX_MAYBE_UNUSED MDBX_NOTHROW_PURE_FUNCTION static inline bool is_poor(const MDBX_cursor *mc) {
|
||
const bool r = mc->top < 0;
|
||
cASSERT(mc, r == (mc->top_and_flags < 0));
|
||
if (r && mc->subcur)
|
||
cASSERT(mc, mc->subcur->cursor.flags < 0 && mc->subcur->cursor.top < 0);
|
||
return r;
|
||
}
|
||
|
||
MDBX_MAYBE_UNUSED MDBX_NOTHROW_PURE_FUNCTION static inline bool is_pointed(const MDBX_cursor *mc) {
|
||
const bool r = mc->top >= 0;
|
||
cASSERT(mc, r == (mc->top_and_flags >= 0));
|
||
if (!r && mc->subcur)
|
||
cASSERT(mc, is_poor(&mc->subcur->cursor));
|
||
return r;
|
||
}
|
||
|
||
MDBX_MAYBE_UNUSED MDBX_NOTHROW_PURE_FUNCTION static inline bool is_hollow(const MDBX_cursor *mc) {
|
||
const bool r = mc->flags < 0;
|
||
if (!r) {
|
||
cASSERT(mc, mc->top >= 0);
|
||
cASSERT(mc, (mc->flags & z_eof_hard) || mc->ki[mc->top] < page_numkeys(mc->pg[mc->top]));
|
||
} else if (mc->subcur)
|
||
cASSERT(mc, is_poor(&mc->subcur->cursor));
|
||
return r;
|
||
}
|
||
|
||
MDBX_MAYBE_UNUSED MDBX_NOTHROW_PURE_FUNCTION static inline bool is_eof(const MDBX_cursor *mc) {
|
||
const bool r = z_eof_soft <= (uint8_t)mc->flags;
|
||
return r;
|
||
}
|
||
|
||
MDBX_MAYBE_UNUSED MDBX_NOTHROW_PURE_FUNCTION static inline bool is_filled(const MDBX_cursor *mc) {
|
||
const bool r = z_eof_hard > (uint8_t)mc->flags;
|
||
return r;
|
||
}
|
||
|
||
MDBX_MAYBE_UNUSED MDBX_NOTHROW_PURE_FUNCTION static inline bool inner_filled(const MDBX_cursor *mc) {
|
||
return mc->subcur && is_filled(&mc->subcur->cursor);
|
||
}
|
||
|
||
MDBX_MAYBE_UNUSED MDBX_NOTHROW_PURE_FUNCTION static inline bool inner_pointed(const MDBX_cursor *mc) {
|
||
return mc->subcur && is_pointed(&mc->subcur->cursor);
|
||
}
|
||
|
||
MDBX_MAYBE_UNUSED MDBX_NOTHROW_PURE_FUNCTION static inline bool inner_hollow(const MDBX_cursor *mc) {
|
||
const bool r = !mc->subcur || is_hollow(&mc->subcur->cursor);
|
||
#if MDBX_DEBUG || MDBX_FORCE_ASSERTIONS
|
||
if (!r) {
|
||
cASSERT(mc, is_filled(mc));
|
||
const page_t *mp = mc->pg[mc->top];
|
||
const node_t *node = page_node(mp, mc->ki[mc->top]);
|
||
cASSERT(mc, node_flags(node) & N_DUP);
|
||
}
|
||
#endif /* MDBX_DEBUG || MDBX_FORCE_ASSERTIONS */
|
||
return r;
|
||
}
|
||
|
||
MDBX_MAYBE_UNUSED static inline void inner_gone(MDBX_cursor *mc) {
|
||
if (mc->subcur) {
|
||
TRACE("reset inner cursor %p", __Wpedantic_format_voidptr(&mc->subcur->cursor));
|
||
mc->subcur->nested_tree.root = 0;
|
||
mc->subcur->cursor.top_and_flags = z_inner | z_poor_mark;
|
||
}
|
||
}
|
||
|
||
MDBX_MAYBE_UNUSED static inline void be_poor(MDBX_cursor *mc) {
|
||
const bool inner = is_inner(mc);
|
||
if (inner) {
|
||
mc->tree->root = 0;
|
||
mc->top_and_flags = z_inner | z_poor_mark;
|
||
} else {
|
||
mc->top_and_flags |= z_poor_mark;
|
||
inner_gone(mc);
|
||
}
|
||
cASSERT(mc, is_poor(mc) && !is_pointed(mc) && !is_filled(mc));
|
||
cASSERT(mc, inner == is_inner(mc));
|
||
}
|
||
|
||
MDBX_MAYBE_UNUSED static inline void be_filled(MDBX_cursor *mc) {
|
||
cASSERT(mc, mc->top >= 0);
|
||
cASSERT(mc, mc->ki[mc->top] < page_numkeys(mc->pg[mc->top]));
|
||
const bool inner = is_inner(mc);
|
||
mc->flags &= z_clear_mask;
|
||
cASSERT(mc, is_filled(mc));
|
||
cASSERT(mc, inner == is_inner(mc));
|
||
}
|
||
|
||
MDBX_MAYBE_UNUSED static inline bool is_related(const MDBX_cursor *base, const MDBX_cursor *scan) {
|
||
cASSERT(base, base->top >= 0);
|
||
return base->top <= scan->top && base != scan;
|
||
}
|
||
|
||
/* Флаги контроля/проверки курсора. */
|
||
enum cursor_checking {
|
||
z_branch = 0x01 /* same as P_BRANCH for check_leaf_type() */,
|
||
z_leaf = 0x02 /* same as P_LEAF for check_leaf_type() */,
|
||
z_largepage = 0x04 /* same as P_LARGE for check_leaf_type() */,
|
||
z_updating = 0x08 /* update/rebalance pending */,
|
||
z_ignord = 0x10 /* don't check keys ordering */,
|
||
z_dupfix = 0x20 /* same as P_DUPFIX for check_leaf_type() */,
|
||
z_retiring = 0x40 /* refs to child pages may be invalid */,
|
||
z_pagecheck = 0x80 /* perform page checking, see MDBX_VALIDATION */
|
||
};
|
||
|
||
MDBX_INTERNAL int __must_check_result cursor_check(const MDBX_cursor *mc);
|
||
|
||
MDBX_MAYBE_UNUSED MDBX_NOTHROW_PURE_FUNCTION static inline size_t cursor_dbi(const MDBX_cursor *mc) {
|
||
cASSERT(mc, mc->txn && mc->txn->signature == txn_signature);
|
||
size_t dbi = mc->dbi_state - mc->txn->dbi_state;
|
||
cASSERT(mc, dbi < mc->txn->env->n_dbi);
|
||
return dbi;
|
||
}
|
||
|
||
MDBX_MAYBE_UNUSED MDBX_NOTHROW_PURE_FUNCTION static inline bool cursor_dbi_changed(const MDBX_cursor *mc) {
|
||
return dbi_changed(mc->txn, cursor_dbi(mc));
|
||
}
|
||
|
||
MDBX_MAYBE_UNUSED MDBX_NOTHROW_PURE_FUNCTION static inline uint8_t *cursor_dbi_state(const MDBX_cursor *mc) {
|
||
return mc->dbi_state;
|
||
}
|
||
|
||
MDBX_MAYBE_UNUSED MDBX_NOTHROW_PURE_FUNCTION static inline bool cursor_is_gc(const MDBX_cursor *mc) {
|
||
return mc->dbi_state == mc->txn->dbi_state + FREE_DBI;
|
||
}
|
||
|
||
MDBX_MAYBE_UNUSED MDBX_NOTHROW_PURE_FUNCTION static inline bool cursor_is_main(const MDBX_cursor *mc) {
|
||
return mc->dbi_state == mc->txn->dbi_state + MAIN_DBI;
|
||
}
|
||
|
||
MDBX_MAYBE_UNUSED MDBX_NOTHROW_PURE_FUNCTION static inline bool cursor_is_core(const MDBX_cursor *mc) {
|
||
return mc->dbi_state < mc->txn->dbi_state + CORE_DBS;
|
||
}
|
||
|
||
MDBX_MAYBE_UNUSED static inline int cursor_dbi_dbg(const MDBX_cursor *mc) {
|
||
/* Debugging output value of a cursor's DBI: Negative for a sub-cursor. */
|
||
const int dbi = cursor_dbi(mc);
|
||
return (mc->flags & z_inner) ? -dbi : dbi;
|
||
}
|
||
|
||
MDBX_MAYBE_UNUSED static inline int __must_check_result cursor_push(MDBX_cursor *mc, page_t *mp, indx_t ki) {
|
||
TRACE("pushing page %" PRIaPGNO " on db %d cursor %p", mp->pgno, cursor_dbi_dbg(mc), __Wpedantic_format_voidptr(mc));
|
||
if (unlikely(mc->top >= CURSOR_STACK_SIZE - 1)) {
|
||
be_poor(mc);
|
||
mc->txn->flags |= MDBX_TXN_ERROR;
|
||
return MDBX_CURSOR_FULL;
|
||
}
|
||
mc->top += 1;
|
||
mc->pg[mc->top] = mp;
|
||
mc->ki[mc->top] = ki;
|
||
return MDBX_SUCCESS;
|
||
}
|
||
|
||
MDBX_MAYBE_UNUSED static inline void cursor_pop(MDBX_cursor *mc) {
|
||
TRACE("popped page %" PRIaPGNO " off db %d cursor %p", mc->pg[mc->top]->pgno, cursor_dbi_dbg(mc),
|
||
__Wpedantic_format_voidptr(mc));
|
||
cASSERT(mc, mc->top >= 0);
|
||
mc->top -= 1;
|
||
}
|
||
|
||
MDBX_NOTHROW_PURE_FUNCTION static inline bool check_leaf_type(const MDBX_cursor *mc, const page_t *mp) {
|
||
return (((page_type(mp) ^ mc->checking) & (z_branch | z_leaf | z_largepage | z_dupfix)) == 0);
|
||
}
|
||
|
||
MDBX_INTERNAL void cursor_eot(MDBX_cursor *mc, const bool merge);
|
||
MDBX_INTERNAL int cursor_shadow(MDBX_cursor *parent_cursor, MDBX_txn *nested_txn, const size_t dbi);
|
||
|
||
MDBX_INTERNAL MDBX_cursor *cursor_cpstk(const MDBX_cursor *csrc, MDBX_cursor *cdst);
|
||
|
||
MDBX_INTERNAL int __must_check_result cursor_ops(MDBX_cursor *mc, MDBX_val *key, MDBX_val *data,
|
||
const MDBX_cursor_op op);
|
||
|
||
MDBX_INTERNAL int __must_check_result cursor_put_checklen(MDBX_cursor *mc, const MDBX_val *key, MDBX_val *data,
|
||
unsigned flags);
|
||
|
||
MDBX_INTERNAL int __must_check_result cursor_put(MDBX_cursor *mc, const MDBX_val *key, MDBX_val *data, unsigned flags);
|
||
|
||
MDBX_INTERNAL int __must_check_result cursor_check_updating(MDBX_cursor *mc);
|
||
|
||
MDBX_INTERNAL int __must_check_result cursor_del(MDBX_cursor *mc, unsigned flags);
|
||
|
||
MDBX_INTERNAL int __must_check_result cursor_sibling_left(MDBX_cursor *mc);
|
||
MDBX_INTERNAL int __must_check_result cursor_sibling_right(MDBX_cursor *mc);
|
||
|
||
typedef struct cursor_set_result {
|
||
int err;
|
||
bool exact;
|
||
} csr_t;
|
||
|
||
MDBX_INTERNAL csr_t cursor_seek(MDBX_cursor *mc, MDBX_val *key, MDBX_val *data, MDBX_cursor_op op);
|
||
|
||
MDBX_INTERNAL int __must_check_result inner_first(MDBX_cursor *__restrict mc, MDBX_val *__restrict data);
|
||
MDBX_INTERNAL int __must_check_result inner_last(MDBX_cursor *__restrict mc, MDBX_val *__restrict data);
|
||
MDBX_INTERNAL int __must_check_result outer_first(MDBX_cursor *__restrict mc, MDBX_val *__restrict key,
|
||
MDBX_val *__restrict data);
|
||
MDBX_INTERNAL int __must_check_result outer_last(MDBX_cursor *__restrict mc, MDBX_val *__restrict key,
|
||
MDBX_val *__restrict data);
|
||
|
||
MDBX_INTERNAL int __must_check_result inner_next(MDBX_cursor *__restrict mc, MDBX_val *__restrict data);
|
||
MDBX_INTERNAL int __must_check_result inner_prev(MDBX_cursor *__restrict mc, MDBX_val *__restrict data);
|
||
MDBX_INTERNAL int __must_check_result outer_next(MDBX_cursor *__restrict mc, MDBX_val *__restrict key,
|
||
MDBX_val *__restrict data, MDBX_cursor_op op);
|
||
MDBX_INTERNAL int __must_check_result outer_prev(MDBX_cursor *__restrict mc, MDBX_val *__restrict key,
|
||
MDBX_val *__restrict data, MDBX_cursor_op op);
|
||
|
||
MDBX_INTERNAL int cursor_init4walk(cursor_couple_t *couple, const MDBX_txn *const txn, tree_t *const tree,
|
||
kvx_t *const kvx);
|
||
|
||
MDBX_INTERNAL int __must_check_result cursor_init(MDBX_cursor *mc, const MDBX_txn *txn, size_t dbi);
|
||
|
||
MDBX_INTERNAL int __must_check_result cursor_dupsort_setup(MDBX_cursor *mc, const node_t *node, const page_t *mp);
|
||
|
||
MDBX_INTERNAL int __must_check_result cursor_touch(MDBX_cursor *const mc, const MDBX_val *key, const MDBX_val *data);
|
||
|
||
/*----------------------------------------------------------------------------*/
|
||
|
||
/* Update sub-page pointer, if any, in mc->subcur.
|
||
* Needed when the node which contains the sub-page may have moved.
|
||
* Called with mp = mc->pg[mc->top], ki = mc->ki[mc->top]. */
|
||
MDBX_MAYBE_UNUSED static inline void cursor_inner_refresh(const MDBX_cursor *mc, const page_t *mp, unsigned ki) {
|
||
cASSERT(mc, is_leaf(mp));
|
||
const node_t *node = page_node(mp, ki);
|
||
if ((node_flags(node) & (N_DUP | N_TREE)) == N_DUP)
|
||
mc->subcur->cursor.pg[0] = node_data(node);
|
||
}
|
||
|
||
MDBX_MAYBE_UNUSED MDBX_INTERNAL bool cursor_is_tracked(const MDBX_cursor *mc);
|