diff --git a/.travis.yml b/.travis.yml
new file mode 100644
index 00000000..27287a04
--- /dev/null
+++ b/.travis.yml
@@ -0,0 +1,15 @@
+language: c
+sudo: false
+dist: trusty
+cache: bundler
+notifications:
+        email: false
+
+compiler:
+        - gcc
+        - clang
+
+os:
+        - linux
+
+script: if [ "${COVERITY_SCAN_BRANCH}" != 1 ]; then make all lmdb check; fi
diff --git a/CHANGES b/CHANGES
index cb19ff64..93486855 100644
--- a/CHANGES
+++ b/CHANGES
@@ -1,16 +1,29 @@
 MDBX
 	Add MDB_PREV_MULTIPLE
-	Fix MDB_CP_COMPACT (ITS#8209)
 	Add error MDB_PROBLEM, replace some MDB_CORRUPTED
-	Backport fixes for ITS#8406
+	Workarounds for glibc bugs: #21031 and 21032.
 
-LMDB 0.9.19 Release Engineering
+LMDB 0.9.20 Release Engineering
+	Fix mdb_load with escaped plaintext (ITS#8558)
+	Fix mdb_cursor_last / mdb_put interaction (ITS#8557)
+
+LMDB 0.9.19 Release (2016/12/28)
 	Fix mdb_env_cwalk cursor init (ITS#8424)
 	Fix robust mutexes on Solaris 10/11 (ITS#8339)
 	Fix MDB_GET_BOTH on non-dup record (ITS#8393)
 	Optimize mdb_drop
 	Fix xcursors after mdb_cursor_del (ITS#8406)
 	Fix MDB_NEXT_DUP after mdb_cursor_del (ITS#8412)
+	Fix mdb_cursor_put resetting C_EOF (ITS#8489)
+	Fix mdb_env_copyfd2 to return EPIPE on SIGPIPE (ITS#8504)
+	Fix mdb_env_copy with empty DB (ITS#8209)
+	Fix behaviors with fork (ITS#8505)
+	Fix mdb_dbi_open with mainDB cursors (ITS#8542)
+	Fix F_NOCACHE on MacOS, error is non-fatal (ITS#7682)
+	Documentation
+		Cleanup doxygen nits
+		Note reserved vs actual mem/disk usage
+
 
 LMDB 0.9.18 Release (2016/02/05)
 	already done for mdbx - Fix robust mutex detection on glibc 2.10-11 (ITS#8330)
diff --git a/COPYRIGHT b/COPYRIGHT
index e3af9b29..f4a7607c 100644
--- a/COPYRIGHT
+++ b/COPYRIGHT
@@ -1,6 +1,6 @@
-Copyright (c) 2015,2016 Leonid Yuriev <leo@yuriev.ru>.
-Copyright (c) 2015,2016 Peter-Service R&D LLC.
-Copyright 2011-2016 Howard Chu, Symas Corp.
+Copyright 2015-2017 Leonid Yuriev <leo@yuriev.ru>.
+Copyright 2011-2017 Howard Chu, Symas Corp.
+Copyright 2015,2016 Peter-Service R&D LLC.
 All rights reserved.
 
 Redistribution and use in source and binary forms, with or without
diff --git a/Doxyfile b/Doxyfile
index 5047c0bb..5ca2cfe8 100644
--- a/Doxyfile
+++ b/Doxyfile
@@ -253,7 +253,7 @@ IDL_PROPERTY_SUPPORT   = YES
 # member in the group (if any) for the other members of the group. By default
 # all members of a group must be documented explicitly.
 
-DISTRIBUTE_GROUP_DOC   = NO
+DISTRIBUTE_GROUP_DOC   = YES
 
 # Set the SUBGROUPING tag to YES (the default) to allow class member groups of
 # the same type (for instance a group of public functions) to be put as a
diff --git a/Makefile b/Makefile
index 0fac4f4d..bfc7a667 100644
--- a/Makefile
+++ b/Makefile
@@ -24,8 +24,8 @@ suffix	?=
 
 CC	?= gcc
 XCFLAGS	?= -DNDEBUG=1 -DMDB_DEBUG=0
-CFLAGS	?= -O2 -g3 -Wall -Werror -Wextra
-CFLAGS	+= -pthread $(XCFLAGS)
+CFLAGS	?= -O2 -g3 -Wall -Werror -Wextra -ffunction-sections
+CFLAGS	+= -std=gnu99 -pthread $(XCFLAGS)
 
 # LY: for ability to built with modern glibc,
 #     but then run with the old
@@ -207,13 +207,15 @@ bench: bench-lmdb.txt bench-mdbx.txt
 endif
 
 ci-rule = ( CC=$$(which $1); if [ -n "$$CC" ]; then \
-		echo -n "probe by $2 ($$CC): " && \
+		echo -n "probe by $2 ($$(readlink -f $$(which $$CC))): " && \
 		$(MAKE) clean >$1.log 2>$1.err && \
 		$(MAKE) CC=$$(readlink -f $$CC) XCFLAGS="-UNDEBUG -DMDB_DEBUG=2" all check 1>$1.log 2>$1.err && echo "OK" \
 			|| ( echo "FAILED"; cat $1.err >&2; exit 1 ); \
 	else echo "no $2 ($1) for probe"; fi; )
 ci:
-	@if [ "$(CC)" != "gcc" ]; then \
+	@if [ "$$(readlink -f $$(which $(CC)))" != "$$(readlink -f $$(which gcc || echo /bin/false))" -a \
+		"$$(readlink -f $$(which $(CC)))" != "$$(readlink -f $$(which clang || echo /bin/false))" -a \
+		"$$(readlink -f $$(which $(CC)))" != "$$(readlink -f $$(which icc || echo /bin/false))" ]; then \
 		$(call ci-rule,$(CC),default C compiler); \
 	fi
 	@$(call ci-rule,gcc,GCC)
diff --git a/README.md b/README.md
new file mode 100644
index 00000000..f81dfef1
--- /dev/null
+++ b/README.md
@@ -0,0 +1,375 @@
+libmdbx
+======================================
+Extended LMDB, aka "Расширенная LMDB".
+
+*The Future will Positive. Всё будет хорошо.*
+[![Build Status](https://travis-ci.org/ReOpen/libmdbx.svg?branch=master)](https://travis-ci.org/ReOpen/libmdbx)
+
+English version by Google [is here](https://translate.googleusercontent.com/translate_c?act=url&ie=UTF8&sl=ru&tl=en&u=https://github.com/ReOpen/libmdbx/tree/master).
+
+
+## Кратко
+
+_libmdbx_ - это встраиваемый key-value движок хранения со специфическим
+набором возможностей, которые при правильном применении позволяют
+создавать уникальные решения с чемпионской производительностью, идеально
+сочетаясь с технологией [MRAM](https://en.wikipedia.org/wiki/Magnetoresistive_random-access_memory).
+
+_libmdbx_ обновляет совместно используемый набор данных, никак не мешая
+при этом параллельным операциям чтения, не применяя атомарных операций к
+самим данным, и обеспечивая согласованность при аварийной остановке в
+любой момент. Поэтому _libmdbx_ позволяя строить системы с линейным
+масштабированием производительности чтения/поиска по ядрам CPU и
+амортизационной стоимостью любых операций Olog(N).
+
+### История
+
+_libmdbx_ является потомком "Lightning Memory-Mapped Database",
+известной под аббревиатурой
+[LMDB](https://en.wikipedia.org/wiki/Lightning_Memory-Mapped_Database).
+Изначально доработка производилась в составе проекта
+[ReOpenLDAP](https://github.com/ReOpen/ReOpenLDAP). Примерно за год
+работы внесенные изменения приобрели самостоятельную ценность. Осенью
+2015 доработанный движок был выделен в отдельный проект, который был
+[представлен на конференции Highload++
+2015](http://www.highload.ru/2015/abstracts/1831.html).
+
+
+Характеристики и ключевые особенности
+=====================================
+
+_libmdbx_ наследует все ключевые возможности и особенности от
+своего прародителя [LMDB](https://en.wikipedia.org/wiki/Lightning_Memory-Mapped_Database),
+с устранением описанных далее проблем и архитектурных недочетов.
+
+### Общее для оригинальной _LMDB_ и _libmdbx_
+
+1. Данные хранятся в упорядоченном отображении (ordered map), ключи всегда
+   отсортированы, поддерживается выборка диапазонов (range lookups).
+
+2. Данные отображается в память каждого работающего с БД процесса.
+   Ключам и данным обеспечивается прямой доступ без необходимости их
+   копирования, так как они защищены транзакцией чтения и не изменяются.
+
+3. Транзакции согласно
+   [ACID](https://ru.wikipedia.org/wiki/ACID), посредством
+   [MVCC](https://ru.wikipedia.org/wiki/MVCC) и
+   [COW](https://ru.wikipedia.org/wiki/%D0%9A%D0%BE%D0%BF%D0%B8%D1%80%D0%BE%D0%B2%D0%B0%D0%BD%D0%B8%D0%B5_%D0%BF%D1%80%D0%B8_%D0%B7%D0%B0%D0%BF%D0%B8%D1%81%D0%B8).
+   Изменения строго последовательны и не блокируются чтением,
+   конфликты между транзакциями не возможны.
+
+4. Чтение и поиск [без блокировок](https://ru.wikipedia.org/wiki/%D0%9D%D0%B5%D0%B1%D0%BB%D0%BE%D0%BA%D0%B8%D1%80%D1%83%D1%8E%D1%89%D0%B0%D1%8F_%D1%81%D0%B8%D0%BD%D1%85%D1%80%D0%BE%D0%BD%D0%B8%D0%B7%D0%B0%D1%86%D0%B8%D1%8F),
+   без [атомарных операций](https://ru.wikipedia.org/wiki/%D0%90%D1%82%D0%BE%D0%BC%D0%B0%D1%80%D0%BD%D0%B0%D1%8F_%D0%BE%D0%BF%D0%B5%D1%80%D0%B0%D1%86%D0%B8%D1%8F).
+   Читатели не блокируются операциями записи и не конкурируют
+   между собой, чтение масштабируется линейно по ядрам CPU.
+
+5. Эффективное хранение дубликатов (ключей с несколькими
+   значениями), без дублирования ключей, с сортировкой значений, в
+   том числе целочисленных (для вторичных индексов).
+
+6. Эффективная поддержка ключей фиксированной длины, в том числе целочисленных.
+
+7. Амортизационная стоимость любой операции Olog(N),
+   [WAF](https://en.wikipedia.org/wiki/Write_amplification) и RAF также Olog(N).
+
+8. Нет [WAL](https://en.wikipedia.org/wiki/Write-ahead_logging) и журнала
+   транзакций, после сбоев не требуется восстановление. Не требуется компактификация
+   или какое-либо периодическое обслуживание. Поддерживается резервное копирование
+   "по горячему", на работающей БД без приостановки изменения данных.
+
+9. Отсутствует какое-либо внутреннее управление памятью или кэшированием. Всё
+   необходимое штатно выполняет ядро ОС.
+
+
+### Недостатки и Компромиссы
+
+1. Единовременно может выполняться не более одной транзакция изменения данных
+   (один писатель). Зато все изменения всегда последовательны, не может быть
+   конфликтов или ошибок при откате транзакций.
+
+2. Отсутствие [WAL](https://en.wikipedia.org/wiki/Write-ahead_logging)
+   обуславливает относительно большой
+   [WAF](https://en.wikipedia.org/wiki/Write_amplification). Поэтому фиксация
+   изменений на диске может быть дорогой и является главным ограничителем для
+   производительности по записи. В качестве компромисса предлагается несколько
+   режимов ленивой и/или периодической фиксации. В том числе режим `MAPASYNC`,
+   при котором изменения происходят только в памяти и асинхронно фиксируются на
+   диске ядром ОС.
+
+3. [COW](https://ru.wikipedia.org/wiki/%D0%9A%D0%BE%D0%BF%D0%B8%D1%80%D0%BE%D0%B2%D0%B0%D0%BD%D0%B8%D0%B5_%D0%BF%D1%80%D0%B8_%D0%B7%D0%B0%D0%BF%D0%B8%D1%81%D0%B8)
+   для реализации [MVCC](https://ru.wikipedia.org/wiki/MVCC) выполняется на
+   уровне страниц в [B+ дереве](https://ru.wikipedia.org/wiki/B-%D0%B4%D0%B5%D1%80%D0%B5%D0%B2%D0%BE).
+   Поэтому изменение данных амортизационно требует копирования Olog(N) страниц,
+   что расходует [пропускную способность оперативной
+   памяти](https://en.wikipedia.org/wiki/Memory_bandwidth) и является основным
+   ограничителем производительности в режиме `MAPASYNC`.
+
+4. В _LMDB_ существует проблема долгих чтений (приостановленных читателей),
+   которая приводит к деградации производительности и переполнению БД.
+   В _libmdbx_ предложены средства для предотвращения, выхода из проблемной
+   ситуации и устранения её последствий. Подробности ниже.
+
+5. В _LMDB_ есть вероятность разрушения БД в режиме `WRITEMAP+MAPASYNC`.
+   В _libmdbx_ для `WRITEMAP+MAPASYNC` гарантируется как сохранность базы,
+   так и согласованность данных. При этом также, в качестве альтернативы,
+   предложен режим `UTTERLY_NOSYNC`. Подробности ниже.
+
+
+#### Проблема долгих чтений
+
+Понимание проблемы требует некоторых пояснений, которые
+изложены ниже, но могут быть сложны для быстрого восприятия.
+Поэтому, тезисно:
+
+* Изменение данных на фоне долгой операции чтения может
+  приводить к исчерпанию места в БД.
+
+* После чего любая попытка обновить данные будет приводить к
+  ошибке `MAP_FULL` до завершения долгой операции чтения.
+
+* Характерными примерами долгих чтений являются горячее
+  резервное копирования и отладка клиентского приложения при
+  активной транзакции чтения.
+
+* В оригинальной _LMDB_ после этого будет наблюдаться
+  устойчивая деградация производительности всех механизмов
+  обратной записи на диск (в I/O контроллере, в гипервизоре,
+  в ядре ОС).
+
+* В _libmdbx_ предусмотрен механизм аварийного прерывания таких
+  операций, а также режим `LIFO RECLAIM` устраняющий последующую
+  деградацию производительности.
+
+Операции чтения выполняются в контексте снимка данных (версии
+БД), который был актуальным на момент старта транзакции чтения.
+Такой читаемый снимок поддерживается неизменным до завершения
+операции. В свою очередь, это не позволяет повторно
+использовать страницы БД в последующих версиях (снимках БД).
+
+Другими словами, если обновление данных выполняется на фоне
+долгой операции чтения, то вместо повторного использования
+"старых" ненужных страниц будут выделяться новые, так как
+"старые" страницы составляют снимок БД, который еще
+используется долгой операцией чтения.
+
+В результате, при интенсивном изменении данных и достаточно
+длительной операции чтения, в БД могут быть исчерпаны свободные
+страницы, что не позволит создавать новые снимки/версии БД.
+Такая ситуация будет сохраняться до завершения операции чтения,
+которая использует старый снимок данных и препятствует
+повторному использованию страниц БД.
+
+Однако, на этом проблемы не заканчиваются. После описанной
+ситуации, все дополнительные страницы, которые были выделены
+пока переработка старых была невозможна, будут участвовать в
+цикле выделения/освобождения до конца жизни экземпляра БД. В
+оригинальной _LMDB_ этот цикл использования страниц работает по
+принципу [FIFO](https://ru.wikipedia.org/wiki/FIFO). Поэтому
+увеличение количества циркулирующий страниц, с точки зрения
+механизмов кэширования и/или обратной записи, выглядит как
+увеличение рабочего набор данных. Проще говоря, однократное
+попадание в ситуацию "уснувшего читателя" приводит к
+устойчивому эффекту вымывания I/O кэша при всех последующих
+изменениях данных.
+
+Для устранения описанных проблемы в _libmdbx_ сделаны
+существенные доработки, подробности ниже. Иллюстрации к
+проблеме "долгих чтений" можно найти в [слайдах
+презентации](http://www.slideshare.net/leoyuriev/lmdb).
+Там же приведен пример количественной оценки прироста
+производительности за счет эффективной работы
+[BBWC](https://en.wikipedia.org/wiki/BBWC) при включении `LIFO
+RECLAIM` в _libmdbx_.
+
+
+#### Вероятность разрушения БД в режиме `WRITEMAP+MAPASYNC`
+
+При работе в режиме `WRITEMAP+MAPSYNC` запись измененных
+страниц выполняется ядром ОС, что имеет ряд преимуществ. Так
+например, при крахе приложения, ядро ОС сохранит все изменения.
+
+Однако, при аварийном отключении питания или сбое в ядре ОС, на
+диске будет сохранена только часть измененных страниц БД. При
+этом с большой вероятностью может оказаться так, что будут
+сохранены мета-страницы со ссылками на страницы с новыми
+версиями данных, но не сами новые данные. В этом случае БД
+будет безвозвратна разрушена, даже если до аварии производилась
+полная синхронизация данных (посредством `mdb_env_sync()`).
+
+В _libmdbx_ эта проблема устранена, подробности ниже.
+
+
+Доработки _libmdbx_
+===================
+
+1. Режим `LIFO RECLAIM`.
+
+	Для повторного использования выбираются не самые старые, а
+	самые новые страницы из доступных. За счет этого цикл
+	использования страниц всегда имеет минимальную длину и не
+	зависит от общего числа выделенных страниц.
+
+	В результате механизмы кэширования и обратной записи работают с
+	максимально возможной эффективностью. В случае использования
+	контроллера дисков или системы хранения с
+	[BBWC](https://en.wikipedia.org/wiki/BBWC) возможно
+	многократное увеличение производительности по записи
+	(обновлению данных).
+
+2. Обработчик `OOM-KICK`.
+
+	Посредством `mdbx_env_set_oomfunc()` может быть установлен
+	внешний обработчик (callback), который будет вызван при
+	исчерпания свободных страниц из-за долгой операцией чтения.
+	Обработчику будет передан PID и pthread_id. В свою очередь
+	обработчик может предпринять одно из действий:
+
+	* отправить сигнал kill (#9), если долгое чтение выполняется
+	  сторонним процессом;
+
+	* отменить или перезапустить проблемную операцию чтения, если
+	  операция выполняется одним из потоков текущего процесса;
+
+	* подождать некоторое время, в расчете что проблемная операция
+	  чтения будет штатно завершена;
+
+	* перервать текущую операцию изменения данных с возвратом кода
+	  ошибки.
+
+3. Гарантия сохранности БД в режиме `WRITEMAP+MAPSYNC`.
+
+	При работе в режиме `WRITEMAP+MAPSYNC` запись измененных
+	страниц выполняется ядром ОС, что имеет ряд преимуществ. Так
+	например, при крахе приложения, ядро ОС сохранит все изменения.
+
+	Однако, при аварийном отключении питания или сбое в ядре ОС, на
+	диске будет сохранена только часть измененных страниц БД. При
+	этом с большой вероятностью может оказаться так, что будут
+	сохранены мета-страницы со ссылками на страницы с новыми
+	версиями данных, но не сами новые данные. В этом случае БД
+	будет безвозвратна разрушена, даже если до аварии производилась
+	полная синхронизация данных (посредством `mdb_env_sync()`).
+
+	В _libmdbx_ эта проблема устранена путем полной переработки
+	пути записи данных:
+
+	* В режиме `WRITEMAP+MAPSYNC` _libmdbx_ не обновляет
+	  мета-страницы непосредственно, а поддерживает их теневые копии
+	  с переносом изменений после фиксации данных.
+
+	* При завершении транзакций, в зависимости от состояния
+	  синхронности данных между диском и оперативной память,
+	  _libmdbx_ помечает точки фиксации либо как сильные (strong),
+	  либо как слабые (weak). Так например, в режиме
+	  `WRITEMAP+MAPSYNC` завершаемые транзакции помечаются как
+	  слабые, а при явной синхронизации данных как сильные.
+
+	* При открытии БД выполняется автоматический откат к последней
+	  сильной фиксации. Этим обеспечивается гарантия сохранности БД.
+
+	К сожалению, такая гарантия надежности не дается бесплатно. Для
+	сохранности данных, страницы формирующие крайний снимок с
+	сильной фиксацией, не должны повторно использоваться
+	(перезаписываться) до формирования следующей сильной точки
+	фиксации. Таким образом, крайняя точка фиксации создает
+	описанный выше эффект "долгого чтения". Разница же здесь в том,
+	что при исчерпании свободных страниц ситуация будет
+	автоматически исправлена, посредством записи изменений на диск
+	и формированием новой сильной точки фиксации.
+
+	В последующих версиях _libmdbx_ будут предусмотрены средства
+	для асинхронной записи данных на диск с автоматическим
+	формированием сильных точек фиксации.
+
+4. Возможность автоматического формирования контрольных точек
+(сброса данных на диск) при накоплении заданного объёма изменений,
+устанавливаемого функцией `mdbx_env_set_syncbytes()`.
+
+5. Возможность получить отставание текущей транзакции чтения от
+последней версии данных в БД посредством `mdbx_txn_straggler()`.
+
+6. Утилита mdbx_chk для проверки БД и функция `mdbx_env_pgwalk()` для
+обхода всех страниц БД.
+
+7. Управление отладкой и получение отладочных сообщений посредством
+`mdbx_setup_debug()`.
+
+8. Возможность связать с каждой завершаемой транзакцией до 3
+дополнительных маркеров посредством `mdbx_canary_put()`, и прочитать их
+в транзакции чтения посредством `mdbx_canary_get()`.
+
+9. Возможность узнать есть ли за текущей позицией курсора строка данных
+посредством `mdbx_cursor_eof()`.
+
+10. Возможность явно запросить обновление существующей записи, без
+создания новой посредством флажка `MDB_CURRENT` для `mdbx_put()`.
+
+11. Возможность обновить или удалить запись с получением предыдущего
+значения данных посредством `mdbx_replace()`.
+
+12. Поддержка ключей и значений нулевой длины. Включая сортированные
+дубликаты, в том числе вне зависимости от порядка их добавления или
+обновления.
+
+13. Исправленный вариант `mdbx_cursor_count()`, возвращающий корректное
+количество дубликатов для всех типов таблиц и любого положения курсора.
+
+14. Возможность открыть БД в эксклюзивном режиме посредством
+`mdbx_env_open_ex()`, например в целях её проверки.
+
+15. Возможность закрыть БД в "грязном" состоянии (без сброса данных и
+формирования сильной точки фиксации) посредством `mdbx_env_close_ex()`.
+
+16. Возможность получить посредством `mdbx_env_info()` дополнительную
+информацию, включая номер самой старой версии БД (снимка данных),
+который используется одним из читателей.
+
+17. Функция `mdbx_del()` не игнорирует дополнительный (уточняющий)
+аргумент `data` для таблиц без дубликатов (без флажка `MDB_DUPSORT`), а
+при его ненулевом значении всегда использует его для сверки с удаляемой
+записью.
+
+18. Возможность открыть dbi-таблицу, одновременно с установкой
+компараторов для ключей и данных, посредством `mdbx_dbi_open_ex()`.
+
+19. Возможность посредством `mdbx_is_dirty()` определить находятся ли
+некоторый ключ или данные в "грязной" странице БД. Таким образом избегаю
+лишнего копирования данных перед выполнением модифицирующих операций
+(значения в размещенные "грязных" страницах могут быть перезаписаны при
+изменениях, иначе они будут неизменны).
+
+20. Корректное обновление текущей записи, в том числе сортированного
+дубликата, при использовании режима `MDB_CURRENT` в `mdbx_cursor_put()`.
+
+21. Все курсоры, как в транзакциях только для чтения, так и в пишущих,
+могут быть переиспользованы посредством `mdbx_cursor_renew()` и ДОЛЖНЫ
+ОСВОБОЖДАТЬСЯ ЯВНО.
+  >
+  > ## _ВАЖНО_, Обратите внимание!
+  >
+  > Это единственное изменение в API, которое значимо меняет
+  > семантику управления курсорами и может приводить к утечкам
+  > памяти. Следует отметить, что это изменение вынужденно.
+  > Так устраняется неоднозначность с массой тяжких последствий:
+  >
+  >  - обращение к уже освобожденной памяти;
+  >  - попытки повторного освобождения памяти;
+  >  - memory corruption and segfaults.
+
+22. Дополнительный код ошибки `MDBX_EMULTIVAL`, который возвращается из
+`mdbx_put()` и `mdbx_replace()` при попытке выполнять неоднозначное
+обновление или удаления одного из нескольких значений с одним ключом,
+т.е. когда невозможно однозначно идентифицировать одно целевое значение
+из нескольких.
+
+23. Возможность посредством `mdbx_get_ex()` получить значение по
+заданному ключу, одновременно с количеством дубликатов.
+
+24. Наличие функций mdbx_cursor_on_first() и mdbx_cursor_on_last(),
+которые позволяют быстро выяснить стоит ли курсор на первой/последней
+позиции.
+
+25. При завершении читающих транзакций, открытые в них DBI-хендлы не
+закрываются и не теряются при завершении таких транзакций посредством
+mdb_txn_abort() или mdb_txn_reset(). Что позволяет избавится от ряда
+сложно обнаруживаемых ошибок.
diff --git a/barriers.h b/barriers.h
index bce314e1..1e98730d 100644
--- a/barriers.h
+++ b/barriers.h
@@ -1,6 +1,6 @@
 /*
- * Copyright (c) 2015,2016 Leonid Yuriev <leo@yuriev.ru>.
- * Copyright (c) 2015,2016 Peter-Service R&D LLC.
+ * Copyright 2015-2017 Leonid Yuriev <leo@yuriev.ru>.
+ * Copyright 2015,2016 Peter-Service R&D LLC.
  * All rights reserved.
  *
  * Redistribution and use in source and binary forms, with or without
diff --git a/intro.doc b/intro.doc
index b0353bf3..9462df18 100644
--- a/intro.doc
+++ b/intro.doc
@@ -1,7 +1,7 @@
 /*
- * Copyright (c) 2015,2016 Leonid Yuriev <leo@yuriev.ru>.
- * Copyright (c) 2015,2016 Peter-Service R&D LLC.
- * Copyright 2015 Howard Chu, Symas Corp.
+ * Copyright 2015-2017 Leonid Yuriev <leo@yuriev.ru>.
+ * Copyright 2015-2017 Howard Chu, Symas Corp.
+ * Copyright 2015,2016 Peter-Service R&D LLC.
  * All rights reserved.
  *
  * Redistribution and use in source and binary forms, with or without
diff --git a/lmdb.h b/lmdb.h
index fba9468b..a1c086d3 100644
--- a/lmdb.h
+++ b/lmdb.h
@@ -1,7 +1,7 @@
 /** @file lmdb.h
- *	@brief Reliable Lightning memory-mapped database library
+ *	@brief Extended Lightning memory-mapped database library
  *
- *	@mainpage	Reliable Lightning Memory-Mapped Database Manager (MDBX)
+ *	@mainpage	Extended Lightning Memory-Mapped Database (MDBX)
  *
  *	@section intro_sec Introduction
  *	MDBX is a Btree-based database management library modeled loosely on the
@@ -66,6 +66,11 @@
  *	  This does not use actual memory or disk space, but users may need
  *	  to understand the difference so they won't be scared off.
  *
+ *	- An LMDB configuration will often reserve considerable \b unused
+ *	  memory address space and maybe file size for future growth.
+ *	  This does not use actual memory or disk space, but users may need
+ *	  to understand the difference so they won't be scared off.
+ *
  *	- By default, in versions before 0.9.10, unused portions of the data
  *	  file might receive garbage data from memory freed by other code.
  *	  (This does not happen when using the #MDB_WRITEMAP flag.) As of
@@ -120,17 +125,17 @@
  *	@author	Leonid Yuriev, 'ReOpen' initiative <https://github.com/ReOpen>.
  *	Howard Chu, Symas Corp. All rights reserved.
  *
- *	@copyright 2015,2016 Leonid Yuriev <leo@yuriev.ru>.
- *	2011-2016 Howard Chu, Symas Corp. All rights reserved.
+ *	@copyright 2015-2017 Leonid Yuriev <leo@yuriev.ru>.
+ *	2011-2017 Howard Chu, Symas Corp. All rights reserved.
  *
  * ---
  *
- * Copyright (c) 2015,2016 Leonid Yuriev <leo@yuriev.ru>.
- * Copyright (c) 2015,2016 Peter-Service R&D LLC.
+ * Copyright 2015-2017 Leonid Yuriev <leo@yuriev.ru>.
+ * Copyright 2015,2016 Peter-Service R&D LLC.
  *	@par Derived From:
  * This code is derived from LMDB engine written by Howard Chu, Symas Corporation.
  *
- * Copyright 2011-2016 Howard Chu, Symas Corp. All rights reserved.
+ * Copyright 2011-2017 Howard Chu, Symas Corp. All rights reserved.
  *
  * Redistribution and use in source and binary forms, with or without
  * modification, are permitted only as authorized by the OpenLDAP
@@ -204,7 +209,7 @@ typedef int mdb_filehandle_t;
 	MDB_VERINT(MDB_VERSION_MAJOR,MDB_VERSION_MINOR,MDB_VERSION_PATCH)
 
 /** The release date of this library version */
-#define MDB_VERSION_DATE	"2016-06-09"
+#define MDB_VERSION_DATE	"2017-02-17"
 
 /** A stringifier for the version info */
 #define MDB_VERSTR(a,b,c,d)	"MDBX " #a "." #b "." #c ": (" d ", https://github.com/ReOpen/libmdbx)"
@@ -349,7 +354,8 @@ typedef void (MDB_rel_func)(MDB_val *item, void *oldptr, void *newptr, void *rel
  * For mdb_cursor_del: remove all duplicate data items.
  */
 #define MDB_NODUPDATA	0x20
-/** For mdb_cursor_put: overwrite the current key/data pair */
+/** For mdb_cursor_put: overwrite the current key/data pair
+ *  MDBX allows this flag for mdb_put() for explicit overwrite/update without insertion. */
 #define MDB_CURRENT	0x40
 /** For put: Just reserve space for data, don't copy it. Return a
  * pointer to the reserved space.
@@ -1033,8 +1039,16 @@ size_t mdb_txn_id(MDB_txn *txn);
 	 *
 	 * The transaction handle is freed. It and its cursors must not be used
 	 * again after this call, except with #mdb_cursor_renew().
-	 * @note Earlier documentation incorrectly said all cursors would be freed.
+	 *
+	 * @note MDBX-mode:
+	 * A cursor must be closed explicitly always, before
+	 * or after its transaction ends. It can be reused with
+	 * #mdb_cursor_renew() before finally closing it.
+	 *
+	 * @note LMDB-compatible mode:
+	 * Earlier documentation incorrectly said all cursors would be freed.
 	 * Only write-transactions free cursors.
+	 *
 	 * @param[in] txn A transaction handle returned by #mdb_txn_begin()
 	 * @return A non-zero error value on failure and 0 on success. Some possible
 	 * errors are:
@@ -1051,8 +1065,16 @@ int  mdb_txn_commit(MDB_txn *txn);
 	 *
 	 * The transaction handle is freed. It and its cursors must not be used
 	 * again after this call, except with #mdb_cursor_renew().
-	 * @note Earlier documentation incorrectly said all cursors would be freed.
+	 *
+	 * @note MDBX-mode:
+	 * A cursor must be closed explicitly always, before
+	 * or after its transaction ends. It can be reused with
+	 * #mdb_cursor_renew() before finally closing it.
+	 *
+	 * @note LMDB-compatible mode:
+	 * Earlier documentation incorrectly said all cursors would be freed.
 	 * Only write-transactions free cursors.
+	 *
 	 * @param[in] txn A transaction handle returned by #mdb_txn_begin()
 	 */
 int mdb_txn_abort(MDB_txn *txn);
@@ -1144,8 +1166,9 @@ int  mdb_txn_renew(MDB_txn *txn);
 	 *		This flag may only be used in combination with #MDB_DUPSORT. This option
 	 *		tells the library that the data items for this database are all the same
 	 *		size, which allows further optimizations in storage and retrieval. When
-	 *		all data items are the same size, the #MDB_GET_MULTIPLE and #MDB_NEXT_MULTIPLE
-	 *		cursor operations may be used to retrieve multiple items at once.
+	 *		all data items are the same size, the #MDB_GET_MULTIPLE, #MDB_NEXT_MULTIPLE
+	 *		and #MDB_PREV_MULTIPLE cursor operations may be used to retrieve multiple
+	 *		items at once.
 	 *	<li>#MDB_INTEGERDUP
 	 *		This option specifies that duplicate data items are binary integers,
 	 *		similar to #MDB_INTEGERKEY keys.
@@ -1380,12 +1403,20 @@ int  mdb_put(MDB_txn *txn, MDB_dbi dbi, MDB_val *key, MDB_val *data,
 	/** @brief Delete items from a database.
 	 *
 	 * This function removes key/data pairs from the database.
+	 *
+	 * MDBX-mode:
+	 * The data parameter is NOT ignored regardless the database does
+	 * support sorted duplicate data items or not. If the data parameter
+	 * is non-NULL only the matching data item will be deleted.
+	 *
+	 * LMDB-compatible mode:
 	 * If the database does not support sorted duplicate data items
 	 * (#MDB_DUPSORT) the data parameter is ignored.
 	 * If the database supports sorted duplicates and the data parameter
 	 * is NULL, all of the duplicate data items for the key will be
 	 * deleted. Otherwise, if the data parameter is non-NULL
 	 * only the matching data item will be deleted.
+	 *
 	 * This function will return #MDB_NOTFOUND if the specified key/data
 	 * pair is not in the database.
 	 * @param[in] txn A transaction handle returned by #mdb_txn_begin()
@@ -1407,6 +1438,13 @@ int  mdb_del(MDB_txn *txn, MDB_dbi dbi, MDB_val *key, MDB_val *data);
 	 * A cursor cannot be used when its database handle is closed.  Nor
 	 * when its transaction has ended, except with #mdb_cursor_renew().
 	 * It can be discarded with #mdb_cursor_close().
+	 *
+	 * MDBX-mode:
+	 * A cursor must be closed explicitly always, before
+	 * or after its transaction ends. It can be reused with
+	 * #mdb_cursor_renew() before finally closing it.
+	 *
+	 * LMDB-compatible mode:
 	 * A cursor in a write-transaction can be closed before its transaction
 	 * ends, and will otherwise be closed when its transaction ends.
 	 * A cursor in a read-only transaction must be closed explicitly, before
@@ -1414,6 +1452,7 @@ int  mdb_del(MDB_txn *txn, MDB_dbi dbi, MDB_val *key, MDB_val *data);
 	 * #mdb_cursor_renew() before finally closing it.
 	 * @note Earlier documentation said that cursors in every transaction
 	 * were closed when the transaction committed or aborted.
+	 *
 	 * @param[in] txn A transaction handle returned by #mdb_txn_begin()
 	 * @param[in] dbi A database handle returned by #mdb_dbi_open()
 	 * @param[out] cursor Address where the new #MDB_cursor handle will be stored
diff --git a/mdb.c b/mdb.c
index e330d740..d9ee456d 100644
--- a/mdb.c
+++ b/mdb.c
@@ -6,9 +6,9 @@
  */
 
 /*
- * Copyright (c) 2015,2016 Leonid Yuriev <leo@yuriev.ru>.
- * Copyright (c) 2015,2016 Peter-Service R&D LLC.
- * Copyright 2011-2016 Howard Chu, Symas Corp.
+ * Copyright 2015-2017 Leonid Yuriev <leo@yuriev.ru>.
+ * Copyright 2011-2017 Howard Chu, Symas Corp.
+ * Copyright 2015,2016 Peter-Service R&D LLC.
  * All rights reserved.
  *
  * Redistribution and use in source and binary forms, with or without
@@ -70,6 +70,10 @@
 #	warning "ReOpenMDBX required at least GLIBC 2.12."
 #endif
 
+#if MDB_DEBUG
+#	undef NDEBUG
+#endif
+
 #include "./reopen.h"
 #include "./barriers.h"
 
@@ -431,8 +435,6 @@ typedef struct MDB_rxbody {
 	volatile pid_t	mrb_pid;
 	/** The thread ID of the thread owning this txn. */
 	volatile pthread_t	mrb_tid;
-	/** Pointer to the context for deferred cleanup reader thread. */
-	struct MDB_rthc *mrb_rthc;
 } MDB_rxbody;
 
 	/** The actual reader record, with cacheline padding. */
@@ -443,7 +445,6 @@ typedef struct MDB_reader {
 #define	mr_txnid	mru.mrx.mrb_txnid
 #define	mr_pid	mru.mrx.mrb_pid
 #define	mr_tid	mru.mrx.mrb_tid
-#define	mr_rthc	mru.mrx.mrb_rthc
 		/** cache line alignment */
 		char pad[(sizeof(MDB_rxbody)+CACHELINE_SIZE-1) & ~(CACHELINE_SIZE-1)];
 	} mru;
@@ -614,19 +615,26 @@ typedef struct MDB_page {
 	/** Header for a single key/data pair within a page.
 	 * Used in pages of type #P_BRANCH and #P_LEAF without #P_LEAF2.
 	 * We guarantee 2-byte alignment for 'MDB_node's.
+	 *
+	 * #mn_lo and #mn_hi are used for data size on leaf nodes, and for child
+	 * pgno on branch nodes.  On 64 bit platforms, #mn_flags is also used
+	 * for pgno.  (Branch nodes have no flags).  Lo and hi are in host byte
+	 * order in case some accesses can be optimized to 32-bit word access.
+	 *
+	 * Leaf node flags describe node contents.  #F_BIGDATA says the node's
+	 * data part is the page number of an overflow page with actual data.
+	 * #F_DUPDATA and #F_SUBDATA can be combined giving duplicate data in
+	 * a sub-page/sub-database, and named databases (just #F_SUBDATA).
 	 */
 typedef struct MDB_node {
-	/** lo and hi are used for data size on leaf nodes and for
-	 * child pgno on branch nodes. On 64 bit platforms, flags
-	 * is also used for pgno. (Branch nodes have no flags).
-	 * They are in host byte order in case that lets some
-	 * accesses be optimized into a 32-bit word access.
-	 */
+	/** part of data size or pgno
+	 *	@{ */
 #if BYTE_ORDER == LITTLE_ENDIAN
-	unsigned short	mn_lo, mn_hi;	/**< part of data size or pgno */
+	unsigned short	mn_lo, mn_hi;
 #else
 	unsigned short	mn_hi, mn_lo;
 #endif
+	/** @} */
 /** @defgroup mdb_node Node Flags
  *	@ingroup internal
  *	Flags for node headers.
@@ -778,6 +786,10 @@ typedef struct MDB_meta {
 	volatile uint64_t	mm_datasync_sign;
 #define META_IS_WEAK(meta) ((meta)->mm_datasync_sign == MDB_DATASIGN_WEAK)
 #define META_IS_STEADY(meta) ((meta)->mm_datasync_sign > MDB_DATASIGN_WEAK)
+
+#if MDBX_MODE_ENABLED
+	volatile mdbx_canary mm_canary;
+#endif
 } MDB_meta;
 
 	/** Buffer for a stack-allocated meta page.
@@ -815,7 +827,7 @@ typedef struct MDB_dbx {
 	 *	Every operation requires a transaction handle.
 	 */
 struct MDB_txn {
-#define MDBX_MT_SIGNATURE (0x706C553B^MDBX_MODE_SALT)
+#define MDBX_MT_SIGNATURE (0x93D53A31^MDBX_MODE_SALT)
 	unsigned	mt_signature;
 	MDB_txn		*mt_parent;		/**< parent of a nested txn */
 	/** Nested txn under this txn, set together with flag #MDB_TXN_HAS_CHILD */
@@ -859,11 +871,12 @@ struct MDB_txn {
  *	@ingroup internal
  * @{
  */
-#define DB_DIRTY	0x01		/**< DB was modified or is DUPSORT data */
+#define DB_DIRTY	0x01		/**< DB was written in this txn */
 #define DB_STALE	0x02		/**< Named-DB record is older than txnID */
 #define DB_NEW		0x04		/**< Named-DB handle opened in this txn */
 #define DB_VALID	0x08		/**< DB handle is valid, see also #MDB_VALID */
 #define DB_USRVALID	0x10		/**< As #DB_VALID, but not set for #FREE_DBI */
+#define DB_DUPDATA	0x20		/**< DB is #MDB_DUPSORT data */
 /** @} */
 	/** In write txns, array of cursors for each DB */
 	MDB_cursor	**mt_cursors;
@@ -901,6 +914,10 @@ struct MDB_txn {
 	 *	dirty_list into mt_parent after freeing hidden mt_parent pages.
 	 */
 	unsigned	mt_dirty_room;
+
+#if MDBX_MODE_ENABLED
+	mdbx_canary	mt_canary;
+#endif
 };
 
 /** Enough space for 2^32 nodes with minimum of 2 keys per node. I.e., plenty.
@@ -921,6 +938,8 @@ struct MDB_xcursor;
 	 */
 struct MDB_cursor {
 #define MDBX_MC_SIGNATURE (0xFE05D5B1^MDBX_MODE_SALT)
+#define MDBX_MC_READY4CLOSE (0x2817A047^MDBX_MODE_SALT)
+#define MDBX_MC_WAIT4EOT (0x90E297A7^MDBX_MODE_SALT)
 	unsigned	mc_signature;
 	/** Next cursor on this DB in this txn */
 	MDB_cursor	*mc_next;
@@ -973,6 +992,21 @@ typedef struct MDB_xcursor {
 	unsigned char mx_dbflag;
 } MDB_xcursor;
 
+	/** Check if there is an inited xcursor, so #XCURSOR_REFRESH() is proper */
+#define XCURSOR_INITED(mc) \
+	((mc)->mc_xcursor && ((mc)->mc_xcursor->mx_cursor.mc_flags & C_INITIALIZED))
+
+	/** Update sub-page pointer, if any, in \b mc->mc_xcursor.  Needed
+	 *	when the node which contains the sub-page may have moved.  Called
+	 *	with \b mp = mc->mc_pg[mc->mc_top], \b ki = mc->mc_ki[mc->mc_top].
+	 */
+#define XCURSOR_REFRESH(mc, mp, ki) do { \
+	MDB_page *xr_pg = (mp); \
+	MDB_node *xr_node = NODEPTR(xr_pg, ki); \
+	if ((xr_node->mn_flags & (F_DUPDATA|F_SUBDATA)) == F_DUPDATA) \
+		(mc)->mc_xcursor->mx_cursor.mc_pg[0] = NODEDATA(xr_node); \
+} while (0)
+
 	/** State of FreeDB old pages, stored in the MDB_env */
 typedef struct MDB_pgstate {
 	pgno_t		*mf_pghead;	/**< Reclaimed freeDB pages, or NULL before use */
@@ -981,9 +1015,14 @@ typedef struct MDB_pgstate {
 
 	/** Context for deferred cleanup of reader's threads.
 	 *  to avoid https://github.com/ReOpen/ReOpenLDAP/issues/48 */
-struct MDB_rthc {
+typedef struct MDBX_rthc {
+	struct MDBX_rthc *rc_next;
+	pthread_t rc_thread;
 	MDB_reader *rc_reader;
-};
+} MDBX_rthc;
+
+static MDBX_rthc* mdbx_rthc_get(pthread_key_t key);
+
 	/** The database environment. */
 struct MDB_env {
 #define MDBX_ME_SIGNATURE (0x9A899641^MDBX_MODE_SALT)
@@ -1076,10 +1115,10 @@ typedef struct MDB_ntxn {
 #define METAPAGE_2(env) \
 	(&((MDB_metabuf*) ((env)->me_map + env->me_psize))->mb_metabuf.mm_meta)
 
-static int  mdb_page_alloc(MDB_cursor *mc, int num, MDB_page **mp, int flags);
-static int  mdb_page_new(MDB_cursor *mc, uint32_t flags, int num, MDB_page **mp);
-static int  mdb_page_touch(MDB_cursor *mc);
-static int  mdb_cursor_touch(MDB_cursor *mc);
+static int	mdb_page_alloc(MDB_cursor *mc, int num, MDB_page **mp, int flags);
+static int	mdb_page_new(MDB_cursor *mc, uint32_t flags, int num, MDB_page **mp);
+static int	mdb_page_touch(MDB_cursor *mc);
+static int	mdb_cursor_touch(MDB_cursor *mc);
 
 #define MDB_END_NAMES {"committed", "empty-commit", "abort", "reset", \
 	"reset-tmp", "fail-begin", "fail-beginchild"}
@@ -1092,16 +1131,16 @@ enum {
 #define MDB_END_UPDATE	0x10	/**< update env state (DBIs) */
 #define MDB_END_FREE	0x20	/**< free txn unless it is #MDB_env.%me_txn0 */
 #define MDB_END_SLOT MDB_NOTLS	/**< release any reader slot if #MDB_NOTLS */
-static int mdb_txn_end(MDB_txn *txn, unsigned mode);
+static int	mdb_txn_end(MDB_txn *txn, unsigned mode);
 
-static int  mdb_page_get(MDB_txn *txn, pgno_t pgno, MDB_page **mp, int *lvl);
-static int  mdb_page_search_root(MDB_cursor *mc,
+static int	mdb_page_get(MDB_cursor *mc, pgno_t pgno, MDB_page **mp, int *lvl);
+static int	mdb_page_search_root(MDB_cursor *mc,
 				MDB_val *key, int modify);
 #define MDB_PS_MODIFY	1
 #define MDB_PS_ROOTONLY	2
 #define MDB_PS_FIRST	4
 #define MDB_PS_LAST		8
-static int  mdb_page_search(MDB_cursor *mc,
+static int	mdb_page_search(MDB_cursor *mc,
 				MDB_val *key, int flags);
 static int	mdb_page_merge(MDB_cursor *csrc, MDB_cursor *cdst);
 
@@ -1109,17 +1148,17 @@ static int	mdb_page_merge(MDB_cursor *csrc, MDB_cursor *cdst);
 static int	mdb_page_split(MDB_cursor *mc, MDB_val *newkey, MDB_val *newdata,
 				pgno_t newpgno, unsigned nflags);
 
-static int  mdb_env_read_header(MDB_env *env, MDB_meta *meta);
-static int mdb_env_sync0(MDB_env *env, unsigned flags, MDB_meta *pending);
-static void mdb_env_close0(MDB_env *env);
+static int	mdb_env_read_header(MDB_env *env, MDB_meta *meta);
+static int	mdb_env_sync0(MDB_env *env, unsigned flags, MDB_meta *pending);
+static void	mdb_env_close0(MDB_env *env);
 
-static MDB_node *mdb_node_search(MDB_cursor *mc, MDB_val *key, int *exactp);
-static int  mdb_node_add(MDB_cursor *mc, indx_t indx,
+static MDB_node	*mdb_node_search(MDB_cursor *mc, MDB_val *key, int *exactp);
+static int	mdb_node_add(MDB_cursor *mc, indx_t indx,
 				MDB_val *key, MDB_val *data, pgno_t pgno, unsigned flags);
-static void mdb_node_del(MDB_cursor *mc, int ksize);
-static void mdb_node_shrink(MDB_page *mp, indx_t indx);
+static void	mdb_node_del(MDB_cursor *mc, int ksize);
+static void	mdb_node_shrink(MDB_page *mp, indx_t indx);
 static int	mdb_node_move(MDB_cursor *csrc, MDB_cursor *cdst, int fromleft);
-static int  mdb_node_read(MDB_txn *txn, MDB_node *leaf, MDB_val *data);
+static int	mdb_node_read(MDB_cursor *mc, MDB_node *leaf, MDB_val *data);
 static size_t	mdb_leaf_size(MDB_env *env, MDB_val *key, MDB_val *data);
 static size_t	mdb_branch_size(MDB_env *env, MDB_val *key);
 
@@ -1145,8 +1184,7 @@ static void	mdb_xcursor_init1(MDB_cursor *mc, MDB_node *node);
 static void	mdb_xcursor_init2(MDB_cursor *mc, MDB_xcursor *src_mx, int force);
 
 static int	mdb_drop0(MDB_cursor *mc, int subs);
-static void mdb_default_cmp(MDB_txn *txn, MDB_dbi dbi);
-static int mdb_reader_check0(MDB_env *env, int rlocked, int *dead);
+static int	mdb_reader_check0(MDB_env *env, int rlocked, int *dead);
 
 /** @cond */
 static MDB_cmp_func	mdb_cmp_memn, mdb_cmp_memnr, mdb_cmp_int_ai, mdb_cmp_int_a2, mdb_cmp_int_ua;
@@ -1344,8 +1382,7 @@ mdb_dkey(MDB_val *key, char *buf)
 	if (key->mv_size > DKBUF_MAXKEYSIZE)
 		return "MDB_MAXKEYSIZE";
 	/* may want to make this a dynamic check: if the key is mostly
-	 * printable characters, print it as-is instead of converting to hex.
-	 */
+	 * printable characters, print it as-is instead of converting to hex. */
 #if 1
 	buf[0] = '\0';
 	for (i=0; i<key->mv_size; i++)
@@ -1445,7 +1482,7 @@ mdb_cursor_chk(MDB_cursor *mc)
 	}
 	if (unlikely(mc->mc_ki[i] >= NUMKEYS(mc->mc_pg[i])))
 		mdb_print("ack!\n");
-	if (mc->mc_xcursor && (mc->mc_xcursor->mx_cursor.mc_flags & C_INITIALIZED)) {
+	if (XCURSOR_INITED(mc)) {
 		node = NODEPTR(mc->mc_pg[mc->mc_top], mc->mc_ki[mc->mc_top]);
 		if (((node->mn_flags & (F_DUPDATA|F_SUBDATA)) == F_DUPDATA) &&
 			mc->mc_xcursor->mx_cursor.mc_pg[0] != NODEDATA(node)) {
@@ -1527,6 +1564,7 @@ mdb_dcmp(MDB_txn *txn, MDB_dbi dbi, const MDB_val *a, const MDB_val *b)
 
 /** Allocate memory for a page.
  * Re-use old malloc'd pages first for singletons, otherwise just malloc.
+ * Set #MDB_TXN_ERROR on failure.
  */
 static MDB_page *
 mdb_page_malloc(MDB_txn *txn, unsigned num)
@@ -1552,8 +1590,7 @@ mdb_page_malloc(MDB_txn *txn, unsigned num)
 	if ((env->me_flags & MDB_NOMEMINIT) == 0) {
 		/* For a single page alloc, we init everything after the page header.
 		 * For multi-page, we init the final page; if the caller needed that
-		 * many pages they will be filling in at least up to the last page.
-		 */
+		 * many pages they will be filling in at least up to the last page. */
 		size_t skip = PAGEHDRSZ;
 		if (num > 1)
 			skip += (num - 1) * env->me_psize;
@@ -1647,8 +1684,7 @@ mdb_page_loose(MDB_cursor *mc, MDB_page *mp)
 		if (txn->mt_parent) {
 			MDB_ID2 *dl = txn->mt_u.dirty_list;
 			/* If txn has a parent, make sure the page is in our
-			 * dirty list.
-			 */
+			 * dirty list. */
 			if (dl[0].mid) {
 				unsigned x = mdb_mid2l_search(dl, pgno);
 				if (x <= dl[0].mid && dl[x].mid == pgno) {
@@ -1699,20 +1735,16 @@ mdb_pages_xkeep(MDB_cursor *mc, unsigned pflags, int all)
 {
 	enum { Mask = P_SUBP|P_DIRTY|P_LOOSE|P_KEEP };
 	MDB_txn *txn = mc->mc_txn;
-	MDB_cursor *m3;
+	MDB_cursor *m3, *m0 = mc;
 	MDB_xcursor *mx;
 	MDB_page *dp, *mp;
 	MDB_node *leaf;
 	unsigned i, j;
 	int rc = MDB_SUCCESS, level;
 
-	/* Mark pages seen by cursors */
-	if (mc->mc_flags & C_UNTRACK)
-		mc = NULL;				/* will find mc in mt_cursors */
-	for (i = txn->mt_numdbs;; mc = txn->mt_cursors[--i]) {
-		for (; mc; mc=mc->mc_next) {
-			if (!(mc->mc_flags & C_INITIALIZED))
-				continue;
+	/* Mark pages seen by cursors: First m0, then tracked cursors */
+	for (i = txn->mt_numdbs;; ) {
+		if (mc->mc_flags & C_INITIALIZED) {
 			for (m3 = mc;; m3 = &mx->mx_cursor) {
 				mp = NULL;
 				for (j=0; j<m3->mc_snum; j++) {
@@ -1731,10 +1763,13 @@ mdb_pages_xkeep(MDB_cursor *mc, unsigned pflags, int all)
 					break;
 			}
 		}
-		if (i == 0)
-			break;
+		mc = mc->mc_next;
+		for (; !mc || mc == m0; mc = txn->mt_cursors[--i])
+			if (i == 0)
+				goto mark_done;
 	}
 
+mark_done:
 	if (all) {
 		/* Mark dirty root pages */
 		for (i=0; i<txn->mt_numdbs; i++) {
@@ -1742,7 +1777,7 @@ mdb_pages_xkeep(MDB_cursor *mc, unsigned pflags, int all)
 				pgno_t pgno = txn->mt_dbs[i].md_root;
 				if (pgno == P_INVALID)
 					continue;
-				if ((rc = mdb_page_get(txn, pgno, &dp, &level)) != MDB_SUCCESS)
+				if (unlikely((rc = mdb_page_get(m0, pgno, &dp, &level)) != MDB_SUCCESS))
 					break;
 				if ((dp->mp_flags & Mask) == pflags && level <= 1)
 					dp->mp_flags ^= P_KEEP;
@@ -1839,8 +1874,7 @@ mdb_page_spill(MDB_cursor *m0, MDB_val *key, MDB_val *data)
 	 * turns out to be a lot of wasted effort because in a large txn many
 	 * of those pages will need to be used again. So now we spill only 1/8th
 	 * of the dirty pages. Testing revealed this to be a good tradeoff,
-	 * better than 1/2, 1/4, or 1/10.
-	 */
+	 * better than 1/2, 1/4, or 1/10. */
 	if (need < MDB_IDL_UM_MAX / 8)
 		need = MDB_IDL_UM_MAX / 8;
 
@@ -1852,8 +1886,7 @@ mdb_page_spill(MDB_cursor *m0, MDB_val *key, MDB_val *data)
 		if (dp->mp_flags & (P_LOOSE|P_KEEP))
 			continue;
 		/* Can't spill twice, make sure it's not already in a parent's
-		 * spill list.
-		 */
+		 * spill list. */
 		if (txn->mt_parent) {
 			MDB_txn *tx2;
 			for (tx2 = txn->mt_parent; tx2; tx2 = tx2->mt_parent) {
@@ -2030,7 +2063,7 @@ mdb_page_dirty(MDB_txn *txn, MDB_page *mp)
 }
 
 /** Allocate page numbers and memory for writing.  Maintain me_pglast,
- * me_pghead and mt_next_pgno.
+ * me_pghead and mt_next_pgno.  Set #MDB_TXN_ERROR on failure.
  *
  * If there are free pages available from older transactions, they
  * are re-used first. Otherwise allocate a new page at mt_next_pgno.
@@ -2101,8 +2134,7 @@ mdb_page_alloc(MDB_cursor *mc, int num, MDB_page **mp, int flags)
 			pgno_t *idl;
 
 			/* Seek a big enough contiguous page range. Prefer
-			 * pages at the tail, just truncating the list.
-			 */
+			 * pages at the tail, just truncating the list. */
 			if (likely(flags & MDBX_ALLOC_CACHE)
 					&& mop_len > n2
 					&& ( !(flags & MDBX_COALESCE) || op == MDB_FIRST)) {
@@ -2198,7 +2230,7 @@ mdb_page_alloc(MDB_cursor *mc, int num, MDB_page **mp, int flags)
 
 			np = m2.mc_pg[m2.mc_top];
 			leaf = NODEPTR(np, m2.mc_ki[m2.mc_top]);
-			if (unlikely((rc = mdb_node_read(txn, leaf, &data)) != MDB_SUCCESS))
+			if (unlikely((rc = mdb_node_read(&m2, leaf, &data)) != MDB_SUCCESS))
 				goto fail;
 
 			if ((flags & MDBX_LIFORECLAIM) && !txn->mt_lifo_reclaimed) {
@@ -2382,8 +2414,7 @@ mdb_page_copy(MDB_page *dst, MDB_page *src, unsigned psize)
 	indx_t upper = src->mp_upper, lower = src->mp_lower, unused = upper-lower;
 
 	/* If page isn't full, just copy the used portion. Adjust
-	 * alignment so memcpy may copy words instead of bytes.
-	 */
+	 * alignment so memcpy may copy words instead of bytes. */
 	if ((unused &= -Align) && !IS_LEAF2(src)) {
 		upper = (upper + PAGEBASE) & -Align;
 		memcpy(dst, src, (lower + PAGEBASE + (Align-1)) & -Align);
@@ -2437,8 +2468,7 @@ mdb_page_unspill(MDB_txn *txn, MDB_page *mp, MDB_page **ret)
 			if (tx2 == txn) {
 				/* If in current txn, this page is no longer spilled.
 				 * If it happens to be the last page, truncate the spill list.
-				 * Otherwise mark it as deleted by setting the LSB.
-				 */
+				 * Otherwise mark it as deleted by setting the LSB. */
 				if (x == txn->mt_spill_pgs[0])
 					txn->mt_spill_pgs[0]--;
 				else
@@ -2457,6 +2487,7 @@ mdb_page_unspill(MDB_txn *txn, MDB_page *mp, MDB_page **ret)
 }
 
 /** Touch a page: make it dirty and re-insert into tree with updated pgno.
+ * Set #MDB_TXN_ERROR on failure.
  * @param[in] mc cursor pointing to the page to be touched
  * @return 0 on success, non-zero on failure.
  */
@@ -2497,8 +2528,7 @@ mdb_page_touch(MDB_cursor *mc)
 		MDB_ID2 mid, *dl = txn->mt_u.dirty_list;
 		pgno = mp->mp_pgno;
 		/* If txn has a parent, make sure the page is in our
-		 * dirty list.
-		 */
+		 * dirty list. */
 		if (dl[0].mid) {
 			unsigned x = mdb_mid2l_search(dl, pgno);
 			if (x <= dl[0].mid && dl[x].mid == pgno) {
@@ -2544,14 +2574,8 @@ done:
 			if (m2 == mc) continue;
 			if (m2->mc_pg[mc->mc_top] == mp) {
 				m2->mc_pg[mc->mc_top] = np;
-				if ((mc->mc_db->md_flags & MDB_DUPSORT) &&
-					IS_LEAF(np) &&
-					(m2->mc_xcursor->mx_cursor.mc_flags & C_INITIALIZED))
-				{
-					MDB_node *leaf = NODEPTR(np, m2->mc_ki[mc->mc_top]);
-					if ((leaf->mn_flags & (F_DUPDATA|F_SUBDATA)) == F_DUPDATA)
-						m2->mc_xcursor->mx_cursor.mc_pg[0] = NODEDATA(leaf);
-				}
+				if (XCURSOR_INITED(m2) && IS_LEAF(np))
+					XCURSOR_REFRESH(m2, np, m2->mc_ki[mc->mc_top]);
 			}
 		}
 	}
@@ -2647,8 +2671,7 @@ mdb_cursor_shadow(MDB_txn *src, MDB_txn *dst)
 				mc->mc_db = &dst->mt_dbs[i];
 				/* Kill pointers into src to reduce abuse: The
 				 * user may not use mc until dst ends. But we need a valid
-				 * txn pointer here for cursor fixups to keep working.
-				 */
+				 * txn pointer here for cursor fixups to keep working. */
 				mc->mc_txn    = dst;
 				mc->mc_dbflag = &dst->mt_dbflags[i];
 				if ((mx = mc->mc_xcursor) != NULL) {
@@ -2669,7 +2692,7 @@ mdb_cursor_shadow(MDB_txn *src, MDB_txn *dst)
  * @return 0 on success, non-zero on failure.
  */
 static void
-mdb_cursors_close(MDB_txn *txn, unsigned merge)
+mdb_cursors_eot(MDB_txn *txn, unsigned merge)
 {
 	MDB_cursor **cursors = txn->mt_cursors, *mc, *next, *bk;
 	MDB_xcursor *mx;
@@ -2677,6 +2700,9 @@ mdb_cursors_close(MDB_txn *txn, unsigned merge)
 
 	for (i = txn->mt_numdbs; --i >= 0; ) {
 		for (mc = cursors[i]; mc; mc = next) {
+			unsigned stage = mc->mc_signature;
+			mdb_ensure(NULL, stage == MDBX_MC_SIGNATURE
+				|| stage == MDBX_MC_WAIT4EOT);
 			next = mc->mc_next;
 			if ((bk = mc->mc_backup) != NULL) {
 				if (merge) {
@@ -2694,11 +2720,24 @@ mdb_cursors_close(MDB_txn *txn, unsigned merge)
 					if ((mx = mc->mc_xcursor) != NULL)
 						*mx = *(MDB_xcursor *)(bk+1);
 				}
+#if MDBX_MODE_ENABLED
+				bk->mc_signature = 0;
+				free(bk);
+			}
+			if (stage == MDBX_MC_WAIT4EOT) {
+				mc->mc_signature = 0;
+				free(mc);
+			} else {
+				mc->mc_signature = MDBX_MC_READY4CLOSE;
+				mc->mc_flags = 0 /* reset C_UNTRACK */;
+			}
+#else
 				mc = bk;
 			}
 			/* Only malloced cursors are permanently tracked. */
 			mc->mc_signature = 0;
 			free(mc);
+#endif
 		}
 		cursors[i] = NULL;
 	}
@@ -2746,28 +2785,19 @@ mdb_txn_renew0(MDB_txn *txn, unsigned flags)
 	}
 
 	if (flags & MDB_TXN_RDONLY) {
-		struct MDB_rthc *rthc = NULL;
+		MDBX_rthc *rthc = NULL;
 		MDB_reader *r = NULL;
 
 		txn->mt_flags = MDB_TXN_RDONLY;
 		if (likely(env->me_flags & MDB_ENV_TXKEY)) {
 			mdb_assert(env, !(env->me_flags & MDB_NOTLS));
-			rthc = pthread_getspecific(env->me_txkey);
-			if (unlikely(! rthc)) {
-				rthc = calloc(1, sizeof(struct MDB_rthc));
-				if (unlikely(! rthc))
-					return ENOMEM;
-				rc = pthread_setspecific(env->me_txkey, rthc);
-				if (unlikely(rc)) {
-					free(rthc);
-					return rc;
-				}
-			}
-			r = rthc->rc_reader;
-			if (r) {
+			rthc = mdbx_rthc_get(env->me_txkey);
+			if (unlikely(! rthc))
+				return ENOMEM;
+			if (likely(rthc->rc_reader)) {
+				r = rthc->rc_reader;
 				mdb_assert(env, r->mr_pid == env->me_pid);
 				mdb_assert(env, r->mr_tid == pthread_self());
-				mdb_assert(env, r->mr_rthc == rthc);
 			}
 		} else {
 			mdb_assert(env, env->me_flags & MDB_NOTLS);
@@ -2808,8 +2838,7 @@ mdb_txn_renew0(MDB_txn *txn, unsigned flags)
 			 * uses the reader table un-mutexed: First reset the
 			 * slot, next publish it in mti_numreaders.  After
 			 * that, it is safe for mdb_env_close() to touch it.
-			 * When it will be closed, we can finally claim it.
-			 */
+			 * When it will be closed, we can finally claim it. */
 			r->mr_pid = 0;
 			r->mr_txnid = ~(txnid_t)0;
 			r->mr_tid = tid;
@@ -2830,7 +2859,6 @@ mdb_txn_renew0(MDB_txn *txn, unsigned flags)
 			new_notls = MDB_END_SLOT;
 			if (likely(rthc)) {
 				rthc->rc_reader = r;
-				r->mr_rthc = rthc;
 				new_notls = 0;
 			}
 		}
@@ -2848,6 +2876,9 @@ mdb_txn_renew0(MDB_txn *txn, unsigned flags)
 				txn->mt_next_pgno = meta->mm_last_pg+1;
 				/* Copy the DB info and flags */
 				memcpy(txn->mt_dbs, meta->mm_dbs, CORE_DBS * sizeof(MDB_db));
+#if MDBX_MODE_ENABLED
+				txn->mt_canary = meta->mm_canary;
+#endif
 				break;
 			}
 		}
@@ -2864,6 +2895,9 @@ mdb_txn_renew0(MDB_txn *txn, unsigned flags)
 		pthread_mutex_lock(&tsan_mutex);
 #endif
 		MDB_meta *meta = mdb_meta_head_w(env);
+#if MDBX_MODE_ENABLED
+		txn->mt_canary = meta->mm_canary;
+#endif
 		txn->mt_txnid = meta->mm_txnid + 1;
 		txn->mt_flags = flags;
 #ifdef __SANITIZE_THREAD__
@@ -2984,8 +3018,7 @@ mdb_txn_begin(MDB_env *env, MDB_txn *parent, unsigned flags, MDB_txn **ret)
 		size += tsize = sizeof(MDB_txn);
 	} else {
 		/* Reuse preallocated write txn. However, do not touch it until
-		 * mdb_txn_renew0() succeeds, since it currently may be active.
-		 */
+		 * mdb_txn_renew0() succeeds, since it currently may be active. */
 		txn = env->me_txn0;
 		goto renew;
 	}
@@ -3151,7 +3184,7 @@ mdb_txn_end(MDB_txn *txn, unsigned mode)
 		pgno_t *pghead = env->me_pghead;
 
 		if (!(mode & MDB_END_UPDATE)) /* !(already closed cursors) */
-			mdb_cursors_close(txn, 0);
+			mdb_cursors_eot(txn, 0);
 		if (!(env->me_flags & MDB_WRITEMAP)) {
 			mdb_dlist_free(txn);
 		}
@@ -3211,7 +3244,12 @@ mdb_txn_reset(MDB_txn *txn)
 	if (unlikely(!(txn->mt_flags & MDB_TXN_RDONLY)))
 		return EINVAL;
 
+#if MDBX_MODE_ENABLED
+	/* LY: don't close DBI-handles in MDBX mode */
+	return mdb_txn_end(txn, MDB_END_RESET|MDB_END_UPDATE);
+#else
 	return mdb_txn_end(txn, MDB_END_RESET);
+#endif /* MDBX_MODE_ENABLED */
 }
 
 int
@@ -3223,6 +3261,12 @@ mdb_txn_abort(MDB_txn *txn)
 	if(unlikely(txn->mt_signature != MDBX_MT_SIGNATURE))
 		return MDB_VERSION_MISMATCH;
 
+#if MDBX_MODE_ENABLED
+	if (F_ISSET(txn->mt_flags, MDB_TXN_RDONLY))
+		/* LY: don't close DBI-handles in MDBX mode */
+		return mdb_txn_end(txn, MDB_END_ABORT|MDB_END_UPDATE|MDB_END_SLOT|MDB_END_FREE);
+#endif /* MDBX_MODE_ENABLED */
+
 	if (txn->mt_child)
 		mdb_txn_abort(txn->mt_child);
 
@@ -3271,8 +3315,7 @@ mdb_freelist_save(MDB_txn *txn)
 {
 	/* env->me_pghead[] can grow and shrink during this call.
 	 * env->me_pglast and txn->mt_free_pgs[] can only grow.
-	 * Page numbers cannot disappear from txn->mt_free_pgs[].
-	 */
+	 * Page numbers cannot disappear from txn->mt_free_pgs[]. */
 	MDB_cursor mc;
 	MDB_env	*env = txn->mt_env;
 	int rc, maxfree_1pg = env->me_maxfree_1pg, more = 1;
@@ -3297,8 +3340,7 @@ again:
 
 		if (! lifo) {
 			/* If using records from freeDB which we have not yet
-			 * deleted, delete them and any we reserved for me_pghead.
-			 */
+			 * deleted, delete them and any we reserved for me_pghead. */
 			while (pglast < env->me_pglast) {
 				rc = mdb_cursor_first(&mc, &key, NULL);
 				if (unlikely(rc))
@@ -3340,8 +3382,7 @@ again:
 
 		if (unlikely(!env->me_pghead) && txn->mt_loose_pgs) {
 			/* Put loose page numbers in mt_free_pgs, since
-			 * we may be unable to return them to me_pghead.
-			 */
+			 * we may be unable to return them to me_pghead. */
 			MDB_page *mp = txn->mt_loose_pgs;
 			if (unlikely((rc = mdb_midl_need(&txn->mt_free_pgs, txn->mt_loose_count)) != 0))
 				return rc;
@@ -3395,8 +3436,7 @@ again:
 
 		/* Reserve records for me_pghead[]. Split it if multi-page,
 		 * to avoid searching freeDB for a page range. Use keys in
-		 * range [1,me_pglast]: Smaller than txnid of oldest reader.
-		 */
+		 * range [1,me_pglast]: Smaller than txnid of oldest reader. */
 		if (total_room >= mop_len) {
 			if (total_room == mop_len || --more < 0)
 				break;
@@ -3473,8 +3513,7 @@ again:
 	mdb_tassert(txn, cleanup_idx == (txn->mt_lifo_reclaimed ? txn->mt_lifo_reclaimed[0] : 0));
 
 	/* Return loose page numbers to me_pghead, though usually none are
-	 * left at this point.  The pages themselves remain in dirty_list.
-	 */
+	 * left at this point.  The pages themselves remain in dirty_list. */
 	if (txn->mt_loose_pgs) {
 		MDB_page *mp = txn->mt_loose_pgs;
 		unsigned count = txn->mt_loose_count;
@@ -3748,14 +3787,13 @@ mdb_txn_commit(MDB_txn *txn)
 			goto fail;
 		mdb_midl_free(txn->mt_free_pgs);
 		/* Failures after this must either undo the changes
-		 * to the parent or set MDB_TXN_ERROR in the parent.
-		 */
+		 * to the parent or set MDB_TXN_ERROR in the parent. */
 
 		parent->mt_next_pgno = txn->mt_next_pgno;
 		parent->mt_flags = txn->mt_flags;
 
 		/* Merge our cursors into parent's and close them */
-		mdb_cursors_close(txn, 1);
+		mdb_cursors_eot(txn, 1);
 
 		/* Update parent's DB table. */
 		memcpy(parent->mt_dbs, txn->mt_dbs, txn->mt_numdbs * sizeof(MDB_db));
@@ -3874,7 +3912,7 @@ mdb_txn_commit(MDB_txn *txn)
 		goto fail;
 	}
 
-	mdb_cursors_close(txn, 0);
+	mdb_cursors_eot(txn, 0);
 
 	if (!txn->mt_u.dirty_list[0].mid &&
 		!(txn->mt_flags & (MDB_TXN_DIRTY|MDB_TXN_SPILLS)))
@@ -3925,6 +3963,9 @@ mdb_txn_commit(MDB_txn *txn)
 		meta.mm_dbs[MAIN_DBI] = txn->mt_dbs[MAIN_DBI];
 		meta.mm_last_pg = txn->mt_next_pgno - 1;
 		meta.mm_txnid = txn->mt_txnid;
+#if MDBX_MODE_ENABLED
+		meta.mm_canary = txn->mt_canary;
+#endif
 
 		rc = mdb_env_sync0(env, env->me_flags | txn->mt_flags, &meta);
 	}
@@ -4161,6 +4202,9 @@ mdb_env_sync0(MDB_env *env, unsigned flags, MDB_meta *pending)
 		target->mm_dbs[FREE_DBI] = pending->mm_dbs[FREE_DBI];
 		target->mm_dbs[MAIN_DBI] = pending->mm_dbs[MAIN_DBI];
 		target->mm_last_pg = pending->mm_last_pg;
+#if MDBX_MODE_ENABLED
+		target->mm_canary = pending->mm_canary;
+#endif
 		/* LY: 'commit' the meta */
 		target->mm_txnid = pending->mm_txnid;
 		target->mm_datasync_sign = pending->mm_datasync_sign;
@@ -4505,38 +4549,230 @@ mdb_env_open2(MDB_env *env, MDB_meta *meta)
 	return MDB_SUCCESS;
 }
 
-static pthread_mutex_t mdb_rthc_lock = PTHREAD_MUTEX_INITIALIZER;
+/****************************************************************************/
+
+#ifndef MDBX_USE_THREAD_ATEXIT
+#	if __GLIBC_PREREQ(2,18)
+#		define MDBX_USE_THREAD_ATEXIT 1
+#	else
+#		define MDBX_USE_THREAD_ATEXIT 0
+#	endif
+#endif
+
+static pthread_mutex_t mdbx_rthc_mutex = PTHREAD_MUTEX_INITIALIZER;
+static MDBX_rthc *mdbx_rthc_list;
+static pthread_key_t mdbx_pthread_crutch_key;
+
+static __inline
+void mdbx_rthc_lock(void) {
+	mdb_ensure(NULL, pthread_mutex_lock(&mdbx_rthc_mutex) == 0);
+}
+
+static __inline
+void mdbx_rthc_unlock(void) {
+	mdb_ensure(NULL, pthread_mutex_unlock(&mdbx_rthc_mutex) == 0);
+}
 
 /** Release a reader thread's slot in the reader lock table.
  *	This function is called automatically when a thread exits.
  * @param[in] ptr This points to the MDB_rthc of a slot in the reader lock table.
  */
-
-/* LY: TODO: Yet another problem is here - segfault in case if a DSO will
- * be unloaded before a thread would been finished. */
-static ATTRIBUTE_NO_SANITIZE_THREAD
-void mdb_env_reader_destr(void *ptr)
+static __cold
+void mdbx_rthc_dtor(void)
 {
-	struct MDB_rthc* rthc = ptr;
-	MDB_reader *reader;
+	/* LY: Основная задача этого деструктора была и есть в освобождении
+	 * слота таблицы читателей при завершении треда, но тут есть пара
+	 * не очевидных сложностей:
+	 *  - Таблица читателей располагается в разделяемой памяти, поэтому
+	 *    во избежание segfault деструктор не должен что-либо делать после
+	 *    или одновременно с mdb_env_close().
+	 *  - Действительно, mdb_env_close() вызовет pthread_key_delete() и
+	 *    после этого glibc не будет вызывать деструктор.
+	 *  - ОДНАКО, это никак не решает проблему гонок между mdb_env_close()
+	 *    и завершающимися тредами. Грубо говоря, при старте mdb_env_close()
+	 *    деструктор уже может выполняться в некоторых тредах, и завершиться
+	 *    эти выполнения могут во время или после окончания mdb_env_close().
+	 *  - БОЛЕЕ ТОГО, схожая проблема возникает при выгрузке dso/dll,
+	 *    так как в текущей glibc (2.24) подсистема ld.so ничего не знает о
+	 *    TSD-деструкторах и поэтому может выгрузить lib.so до того как
+	 *    отработали все деструкторы.
+	 *  - Исходное проявление проблемы было зафиксировано
+	 *    в https://github.com/ReOpen/ReOpenLDAP/issues/48
+	 *
+	 * Предыдущее решение посредством выделяемого динамически MDB_rthc
+	 * было не удачным, так как порождало либо утечку памяти,
+	 * либо вероятностное обращение к уже освобожденной памяти
+	 * из этого деструктора.
+	 *
+	 * Текущее решение достаточно "развесисто", но решает все описанные выше
+	 * проблемы без пенальти по производительности.
+	 */
 
-	mdb_ensure(NULL, pthread_mutex_lock(&mdb_rthc_lock) == 0);
-	reader = rthc->rc_reader;
-	if (reader && reader->mr_pid == getpid()) {
-		mdb_ensure(NULL, reader->mr_rthc == rthc);
-		rthc->rc_reader = NULL;
-		reader->mr_rthc = NULL;
-		mdbx_compiler_barrier();
-		reader->mr_pid = 0;
-		mdbx_coherent_barrier();
+	mdbx_rthc_lock();
+
+	pid_t pid = getpid();
+	pthread_t thread = pthread_self();
+	for (MDBX_rthc** ref = &mdbx_rthc_list; *ref; ) {
+		MDBX_rthc* rthc = *ref;
+		if (rthc->rc_thread == thread) {
+			if (rthc->rc_reader && rthc->rc_reader->mr_pid == pid) {
+				rthc->rc_reader->mr_pid = 0;
+				mdbx_coherent_barrier();
+			}
+			*ref = rthc->rc_next;
+			free(rthc);
+		} else {
+			ref = &(*ref)->rc_next;
+		}
 	}
-	mdb_ensure(NULL, pthread_mutex_unlock(&mdb_rthc_lock) == 0);
-	free(rthc);
+
+	mdbx_rthc_unlock();
 }
 
+#if MDBX_USE_THREAD_ATEXIT
+
+extern void *__dso_handle __attribute__ ((__weak__));
+extern int __cxa_thread_atexit_impl(void (*dtor)(void*), void *obj, void *dso_symbol);
+
+static __cold
+void mdbx_rthc__thread_atexit(void *ptr) {
+	mdb_ensure(NULL, ptr == pthread_getspecific(mdbx_pthread_crutch_key));
+	mdb_ensure(NULL, pthread_setspecific(mdbx_pthread_crutch_key, NULL) == 0);
+	mdbx_rthc_dtor();
+}
+
+static __attribute__((constructor)) __cold
+void mdbx_pthread_crutch_ctor(void) {
+	mdb_ensure(NULL, pthread_key_create(
+		&mdbx_pthread_crutch_key, NULL) == 0);
+}
+
+#else /* MDBX_USE_THREAD_ATEXIT */
+
+static __cold
+void mdbx_rthc__thread_key_dtor(void *ptr) {
+	(void) ptr;
+	if (mdbx_pthread_crutch_key != (pthread_key_t) -1)
+		mdbx_rthc_dtor();
+}
+
+static __attribute__((constructor)) __cold
+void mdbx_pthread_crutch_ctor(void) {
+	mdb_ensure(NULL, pthread_key_create(
+		&mdbx_pthread_crutch_key, mdbx_rthc__thread_key_dtor) == 0);
+}
+
+static __attribute__((destructor)) __cold
+void mdbx_pthread_crutch_dtor(void)
+{
+	pthread_key_delete(mdbx_pthread_crutch_key);
+	mdbx_pthread_crutch_key = -1;
+
+	/* LY: Из-за race condition в pthread_key_delete()
+	 * деструкторы уже могли начать выполняться.
+	 * Уступая квант времени сразу после удаления ключа
+	 * мы даем им шанс завершиться. */
+	pthread_yield();
+
+	mdbx_rthc_lock();
+	pid_t pid = getpid();
+	while (mdbx_rthc_list != NULL) {
+		MDBX_rthc* rthc = mdbx_rthc_list;
+		mdbx_rthc_list = mdbx_rthc_list->rc_next;
+		if (rthc->rc_reader && rthc->rc_reader->mr_pid == pid) {
+			rthc->rc_reader->mr_pid = 0;
+			mdbx_coherent_barrier();
+		}
+		free(rthc);
+
+		/* LY: Каждый неудаленный элемент списка - это один
+		 * не отработавший деструктор и потенциальный
+		 * шанс получить segfault после выгрузки lib.so
+		 * Поэтому на каждой итерации уступаем квант времени,
+		 * в надежде что деструкторы успеют отработать. */
+		mdbx_rthc_unlock();
+		pthread_yield();
+		mdbx_rthc_lock();
+	}
+	mdbx_rthc_unlock();
+	pthread_yield();
+}
+#endif /* MDBX_USE_THREAD_ATEXIT */
+
+static __cold
+MDBX_rthc* mdbx_rthc_add(pthread_key_t key)
+{
+	MDBX_rthc *rthc = malloc(sizeof(MDBX_rthc));
+	if (unlikely(rthc == NULL))
+		goto bailout;
+
+	rthc->rc_next = NULL;
+	rthc->rc_reader = NULL;
+	rthc->rc_thread = pthread_self();
+	if (unlikely(pthread_setspecific(key, rthc) != 0))
+		goto bailout_free;
+
+	mdbx_rthc_lock();
+	if (pthread_getspecific(mdbx_pthread_crutch_key) == NULL) {
+#if MDBX_USE_THREAD_ATEXIT
+		void *dso_anchor = (&__dso_handle && __dso_handle)
+			? __dso_handle : (void *)mdb_version;
+		if (unlikely(__cxa_thread_atexit_impl(mdbx_rthc__thread_atexit, rthc, dso_anchor) != 0)) {
+			mdbx_rthc_unlock();
+			goto bailout_free;
+		}
+#endif /* MDBX_USE_THREAD_ATEXIT */
+		mdb_ensure(NULL, pthread_setspecific(mdbx_pthread_crutch_key, rthc) == 0);
+	}
+	rthc->rc_next = mdbx_rthc_list;
+	mdbx_rthc_list = rthc;
+	mdbx_rthc_unlock();
+	return rthc;
+
+bailout_free:
+	free(rthc);
+bailout:
+	return NULL;
+}
+
+static __inline
+MDBX_rthc* mdbx_rthc_get(pthread_key_t key)
+{
+	MDBX_rthc *rthc = pthread_getspecific(key);
+	if (likely(rthc != NULL))
+		return rthc;
+	return mdbx_rthc_add(key);
+}
+
+static __cold
+void mdbx_rthc_cleanup(MDB_env *env)
+{
+	mdbx_rthc_lock();
+
+	MDB_reader *begin = env->me_txns->mti_readers;
+	MDB_reader *end = begin + env->me_close_readers;
+	for (MDBX_rthc** ref = &mdbx_rthc_list; *ref; ) {
+		MDBX_rthc* rthc = *ref;
+		if (rthc->rc_reader >= begin && rthc->rc_reader < end) {
+			if (rthc->rc_reader->mr_pid == env->me_pid) {
+				rthc->rc_reader->mr_pid = 0;
+				mdbx_coherent_barrier();
+			}
+			*ref = rthc->rc_next;
+			free(rthc);
+		} else {
+			ref = &(*ref)->rc_next;
+		}
+	}
+
+	mdbx_rthc_unlock();
+}
+
+/****************************************************************************/
+
 /** Downgrade the exclusive lock on the region back to shared */
-static int __cold
-mdb_env_share_locks(MDB_env *env, int *excl)
+static  __cold
+int mdb_env_share_locks(MDB_env *env, int *excl)
 {
 	struct flock lock_info;
 	int rc = 0;
@@ -4703,7 +4939,7 @@ mdb_env_setup_locks(MDB_env *env, char *lpath, int mode, int *excl)
 		fcntl(env->me_lfd, F_SETFD, fdflags);
 
 	if (!(env->me_flags & MDB_NOTLS)) {
-		rc = pthread_key_create(&env->me_txkey, mdb_env_reader_destr);
+		rc = pthread_key_create(&env->me_txkey, NULL);
 		if (rc)
 			return rc;
 		env->me_flags |= MDB_ENV_TXKEY;
@@ -4991,11 +5227,7 @@ mdb_env_close0(MDB_env *env)
 	mdb_midl_free(env->me_free_pgs);
 
 	if (env->me_flags & MDB_ENV_TXKEY) {
-		struct MDB_rthc *rthc = pthread_getspecific(env->me_txkey);
-		if (rthc && pthread_setspecific(env->me_txkey, NULL) == 0) {
-			mdb_env_reader_destr(rthc);
-		}
-		pthread_key_delete(env->me_txkey);
+		mdb_ensure(env, pthread_key_delete(env->me_txkey) == 0);
 		env->me_flags &= ~MDB_ENV_TXKEY;
 	}
 
@@ -5009,7 +5241,6 @@ mdb_env_close0(MDB_env *env)
 	if (env->me_fd != INVALID_HANDLE_VALUE)
 		(void) close(env->me_fd);
 
-	pid_t pid = env->me_pid;
 	/* Clearing readers is done in this function because
 	 * me_txkey with its destructor must be disabled first.
 	 *
@@ -5017,26 +5248,12 @@ mdb_env_close0(MDB_env *env)
 	 * data owned by this process (me_close_readers and
 	 * our readers), and clear each reader atomically.
 	 */
-	if (pid == getpid()) {
-		mdb_ensure(env, pthread_mutex_lock(&mdb_rthc_lock) == 0);
-		for (i = env->me_close_readers; --i >= 0; ) {
-			MDB_reader *reader = &env->me_txns->mti_readers[i];
-			if (reader->mr_pid == pid) {
-				struct MDB_rthc *rthc = reader->mr_rthc;
-				if (rthc) {
-					mdb_ensure(env, rthc->rc_reader == reader);
-					rthc->rc_reader = NULL;
-					reader->mr_rthc = NULL;
-				}
-				reader->mr_pid = 0;
-			}
-		}
-		mdbx_coherent_barrier();
-		mdb_ensure(env, pthread_mutex_unlock(&mdb_rthc_lock) == 0);
-	}
+	if (env->me_pid == getpid())
+		mdbx_rthc_cleanup(env);
 
 	munmap((void *)env->me_txns, (env->me_maxreaders-1)*sizeof(MDB_reader)+sizeof(MDB_txninfo));
 	env->me_txns = NULL;
+	env->me_pid = 0;
 
 	if (env->me_lfd != INVALID_HANDLE_VALUE) {
 		(void) close(env->me_lfd);
@@ -5172,7 +5389,7 @@ mdb_cmp_int_ua(const MDB_val *a, const MDB_val *b)
 
 		do {
 			diff = *--pa - *--pb;
-			if (likely(diff)) break;
+			if (likely(diff != 0)) break;
 		} while(pa != a->mv_data);
 		return diff;
 	}
@@ -5346,7 +5563,9 @@ mdb_cursor_pop(MDB_cursor *mc)
 	}
 }
 
-/** Push a page onto the top of the cursor's stack. */
+/** Push a page onto the top of the cursor's stack.
+ * Set #MDB_TXN_ERROR on failure.
+ */
 static int
 mdb_cursor_push(MDB_cursor *mc, MDB_page *mp)
 {
@@ -5366,15 +5585,17 @@ mdb_cursor_push(MDB_cursor *mc, MDB_page *mp)
 }
 
 /** Find the address of the page corresponding to a given page number.
- * @param[in] txn the transaction for this access.
+ * Set #MDB_TXN_ERROR on failure.
+ * @param[in] mc the cursor accessing the page.
  * @param[in] pgno the page number for the page to retrieve.
  * @param[out] ret address of a pointer where the page's address will be stored.
  * @param[out] lvl dirty_list inheritance level of found page. 1=current txn, 0=mapped page.
  * @return 0 on success, non-zero on failure.
  */
 static int
-mdb_page_get(MDB_txn *txn, pgno_t pgno, MDB_page **ret, int *lvl)
+mdb_page_get(MDB_cursor *mc, pgno_t pgno, MDB_page **ret, int *lvl)
 {
+	MDB_txn *txn = mc->mc_txn;
 	MDB_env *env = txn->mt_env;
 	MDB_page *p = NULL;
 	int level;
@@ -5388,8 +5609,7 @@ mdb_page_get(MDB_txn *txn, pgno_t pgno, MDB_page **ret, int *lvl)
 			/* Spilled pages were dirtied in this txn and flushed
 			 * because the dirty list got full. Bring this page
 			 * back in from the map (but don't unspill it here,
-			 * leave that unless page_touch happens again).
-			 */
+			 * leave that unless page_touch happens again). */
 			if (tx2->mt_spill_pgs) {
 				MDB_ID pn = pgno << 1;
 				x = mdb_midl_search(tx2->mt_spill_pgs, pn);
@@ -5448,8 +5668,17 @@ mdb_page_search_root(MDB_cursor *mc, MDB_val *key, int flags)
 
 		if (flags & (MDB_PS_FIRST|MDB_PS_LAST)) {
 			i = 0;
-			if (flags & MDB_PS_LAST)
+			if (flags & MDB_PS_LAST) {
 				i = NUMKEYS(mp) - 1;
+				/* if already init'd, see if we're already in right place */
+				if (mc->mc_flags & C_INITIALIZED) {
+					if (mc->mc_ki[mc->mc_top] == i) {
+						mc->mc_top = mc->mc_snum++;
+						mp = mc->mc_pg[mc->mc_top];
+						goto ready;
+					}
+				}
+			}
 		} else {
 			int	 exact;
 			node = mdb_node_search(mc, key, &exact);
@@ -5468,13 +5697,14 @@ mdb_page_search_root(MDB_cursor *mc, MDB_val *key, int flags)
 		mdb_cassert(mc, i < NUMKEYS(mp));
 		node = NODEPTR(mp, i);
 
-		if (unlikely((rc = mdb_page_get(mc->mc_txn, NODEPGNO(node), &mp, NULL)) != 0))
+		if (unlikely((rc = mdb_page_get(mc, NODEPGNO(node), &mp, NULL)) != 0))
 			return rc;
 
 		mc->mc_ki[mc->mc_top] = i;
 		if (unlikely(rc = mdb_cursor_push(mc, mp)))
 			return rc;
 
+ready:
 		if (flags & MDB_PS_MODIFY) {
 			if (unlikely((rc = mdb_page_touch(mc)) != 0))
 				return rc;
@@ -5510,7 +5740,7 @@ mdb_page_search_lowest(MDB_cursor *mc)
 	MDB_node	*node = NODEPTR(mp, 0);
 	int rc;
 
-	if (unlikely((rc = mdb_page_get(mc->mc_txn, NODEPGNO(node), &mp, NULL)) != 0))
+	if (unlikely((rc = mdb_page_get(mc, NODEPGNO(node), &mp, NULL)) != 0))
 		return rc;
 
 	mc->mc_ki[mc->mc_top] = 0;
@@ -5544,7 +5774,7 @@ mdb_page_search(MDB_cursor *mc, MDB_val *key, int flags)
 		return MDB_BAD_TXN;
 	} else {
 		/* Make sure we're using an up-to-date root */
-		if (*mc->mc_dbflag & DB_STALE) {
+		if (unlikely(*mc->mc_dbflag & DB_STALE)) {
 				MDB_cursor mc2;
 				if (unlikely(TXN_DBI_CHANGED(mc->mc_txn, mc->mc_dbi)))
 					return MDB_BAD_DBI;
@@ -5562,7 +5792,7 @@ mdb_page_search(MDB_cursor *mc, MDB_val *key, int flags)
 						return MDB_NOTFOUND;
 					if (unlikely((leaf->mn_flags & (F_DUPDATA|F_SUBDATA)) != F_SUBDATA))
 						return MDB_INCOMPATIBLE; /* not a named DB */
-					rc = mdb_node_read(mc->mc_txn, leaf, &data);
+					rc = mdb_node_read(&mc2, leaf, &data);
 					if (rc)
 						return rc;
 					memcpy(&flags, ((char *) data.mv_data + offsetof(MDB_db, md_flags)),
@@ -5586,7 +5816,7 @@ mdb_page_search(MDB_cursor *mc, MDB_val *key, int flags)
 
 	mdb_cassert(mc, root > 1);
 	if (!mc->mc_pg[0] || mc->mc_pg[0]->mp_pgno != root)
-		if (unlikely((rc = mdb_page_get(mc->mc_txn, root, &mc->mc_pg[0], NULL)) != 0))
+		if (unlikely((rc = mdb_page_get(mc, root, &mc->mc_pg[0], NULL)) != 0))
 			return rc;
 
 	mc->mc_snum = 1;
@@ -5683,13 +5913,13 @@ release:
 }
 
 /** Return the data associated with a given node.
- * @param[in] txn The transaction for this operation.
+ * @param[in] mc The cursor for this operation.
  * @param[in] leaf The node being read.
  * @param[out] data Updated to point to the node's data.
  * @return 0 on success, non-zero on failure.
  */
 static MDBX_INLINE int
-mdb_node_read(MDB_txn *txn, MDB_node *leaf, MDB_val *data)
+mdb_node_read(MDB_cursor *mc, MDB_node *leaf, MDB_val *data)
 {
 	MDB_page	*omp;		/* overflow page */
 	pgno_t		 pgno;
@@ -5705,7 +5935,7 @@ mdb_node_read(MDB_txn *txn, MDB_node *leaf, MDB_val *data)
 	 */
 	data->mv_size = NODEDSZ(leaf);
 	memcpy(&pgno, NODEDATA(leaf), sizeof(pgno));
-	if (unlikely((rc = mdb_page_get(txn, pgno, &omp, NULL)) != 0)) {
+	if (unlikely((rc = mdb_page_get(mc, pgno, &omp, NULL)) != 0)) {
 		mdb_debug("read overflow page %zu failed", pgno);
 		return rc;
 	}
@@ -5786,7 +6016,7 @@ mdb_cursor_sibling(MDB_cursor *mc, int move_right)
 	mdb_cassert(mc, IS_BRANCH(mc->mc_pg[mc->mc_top]));
 
 	indx = NODEPTR(mc->mc_pg[mc->mc_top], mc->mc_ki[mc->mc_top]);
-	if (unlikely((rc = mdb_page_get(mc->mc_txn, NODEPGNO(indx), &mp, NULL)) != 0)) {
+	if (unlikely((rc = mdb_page_get(mc, NODEPGNO(indx), &mp, NULL)) != 0)) {
 		/* mc will be inconsistent if caller does mc_snum++ as above */
 		mc->mc_flags &= ~(C_INITIALIZED|C_EOF);
 		return rc;
@@ -5807,15 +6037,20 @@ mdb_cursor_next(MDB_cursor *mc, MDB_val *key, MDB_val *data, MDB_cursor_op op)
 	MDB_node	*leaf;
 	int rc;
 
-	if ((mc->mc_flags & C_EOF) ||
-		((mc->mc_flags & C_DEL) && op == MDB_NEXT_DUP)) {
+	if ((mc->mc_flags & C_DEL) && op == MDB_NEXT_DUP)
 		return MDB_NOTFOUND;
-	}
+
 	if (!(mc->mc_flags & C_INITIALIZED))
 		return mdb_cursor_first(mc, key, data);
 
 	mp = mc->mc_pg[mc->mc_top];
 
+	if (mc->mc_flags & C_EOF) {
+		if (mc->mc_ki[mc->mc_top] >= NUMKEYS(mp)-1)
+			return MDB_NOTFOUND;
+		mc->mc_flags ^= C_EOF;
+	}
+
 	if (mc->mc_db->md_flags & MDB_DUPSORT) {
 		leaf = NODEPTR(mp, mc->mc_ki[mc->mc_top]);
 		if (F_ISSET(leaf->mn_flags, F_DUPDATA)) {
@@ -5869,7 +6104,7 @@ skip:
 		mdb_xcursor_init1(mc, leaf);
 	}
 	if (data) {
-		if (unlikely((rc = mdb_node_read(mc->mc_txn, leaf, data)) != MDB_SUCCESS))
+		if (unlikely((rc = mdb_node_read(mc, leaf, data)) != MDB_SUCCESS))
 			return rc;
 
 		if (F_ISSET(leaf->mn_flags, F_DUPDATA)) {
@@ -5952,7 +6187,7 @@ mdb_cursor_prev(MDB_cursor *mc, MDB_val *key, MDB_val *data, MDB_cursor_op op)
 		mdb_xcursor_init1(mc, leaf);
 	}
 	if (data) {
-		if (unlikely((rc = mdb_node_read(mc->mc_txn, leaf, data)) != MDB_SUCCESS))
+		if (unlikely((rc = mdb_node_read(mc, leaf, data)) != MDB_SUCCESS))
 			return rc;
 
 		if (F_ISSET(leaf->mn_flags, F_DUPDATA)) {
@@ -5976,9 +6211,6 @@ mdb_cursor_set(MDB_cursor *mc, MDB_val *key, MDB_val *data,
 	MDB_node	*leaf = NULL;
 	DKBUF;
 
-	if (unlikely(key->mv_size == 0))
-		return MDB_BAD_VALSIZE;
-
 	if ( (mc->mc_db->md_flags & MDB_INTEGERKEY)
 		&& unlikely( key->mv_size != sizeof(unsigned)
 		&& key->mv_size != sizeof(size_t) )) {
@@ -6058,8 +6290,7 @@ mdb_cursor_set(MDB_cursor *mc, MDB_val *key, MDB_val *data,
 				}
 			}
 			/* If any parents have right-sibs, search.
-			 * Otherwise, there's nothing further.
-			 */
+			 * Otherwise, there's nothing further. */
 			for (i=0; i<mc->mc_top; i++)
 				if (mc->mc_ki[i] <
 					NUMKEYS(mc->mc_pg[i])-1)
@@ -6141,7 +6372,7 @@ set1:
 			}
 		} else if (op == MDB_GET_BOTH || op == MDB_GET_BOTH_RANGE) {
 			MDB_val olddata;
-			if (unlikely((rc = mdb_node_read(mc->mc_txn, leaf, &olddata)) != MDB_SUCCESS))
+			if (unlikely((rc = mdb_node_read(mc, leaf, &olddata)) != MDB_SUCCESS))
 				return rc;
 			rc = mc->mc_dbx->md_dcmp(data, &olddata);
 			if (rc) {
@@ -6150,11 +6381,10 @@ set1:
 				rc = 0;
 			}
 			*data = olddata;
-
 		} else {
 			if (mc->mc_xcursor)
 				mc->mc_xcursor->mx_cursor.mc_flags &= ~(C_INITIALIZED|C_EOF);
-			if (unlikely((rc = mdb_node_read(mc->mc_txn, leaf, data)) != MDB_SUCCESS))
+			if (unlikely((rc = mdb_node_read(mc, leaf, data)) != MDB_SUCCESS))
 				return rc;
 		}
 	}
@@ -6203,7 +6433,7 @@ mdb_cursor_first(MDB_cursor *mc, MDB_val *key, MDB_val *data)
 			if (unlikely(rc))
 				return rc;
 		} else {
-			if (unlikely((rc = mdb_node_read(mc->mc_txn, leaf, data)) != MDB_SUCCESS))
+			if (unlikely((rc = mdb_node_read(mc, leaf, data)) != MDB_SUCCESS))
 				return rc;
 		}
 	}
@@ -6222,15 +6452,14 @@ mdb_cursor_last(MDB_cursor *mc, MDB_val *key, MDB_val *data)
 		mc->mc_xcursor->mx_cursor.mc_flags &= ~(C_INITIALIZED|C_EOF);
 
 	if (likely(!(mc->mc_flags & C_EOF))) {
-
 		if (!(mc->mc_flags & C_INITIALIZED) || mc->mc_top) {
 			rc = mdb_page_search(mc, NULL, MDB_PS_LAST);
 			if (unlikely(rc != MDB_SUCCESS))
 				return rc;
 		}
 		mdb_cassert(mc, IS_LEAF(mc->mc_pg[mc->mc_top]));
-
 	}
+
 	mc->mc_ki[mc->mc_top] = NUMKEYS(mc->mc_pg[mc->mc_top]) - 1;
 	mc->mc_flags |= C_INITIALIZED|C_EOF;
 	leaf = NODEPTR(mc->mc_pg[mc->mc_top], mc->mc_ki[mc->mc_top]);
@@ -6248,7 +6477,7 @@ mdb_cursor_last(MDB_cursor *mc, MDB_val *key, MDB_val *data)
 			if (unlikely(rc))
 				return rc;
 		} else {
-			if (unlikely((rc = mdb_node_read(mc->mc_txn, leaf, data)) != MDB_SUCCESS))
+			if (unlikely((rc = mdb_node_read(mc, leaf, data)) != MDB_SUCCESS))
 				return rc;
 		}
 	}
@@ -6295,9 +6524,15 @@ mdb_cursor_get(MDB_cursor *mc, MDB_val *key, MDB_val *data,
 				MDB_GET_KEY(leaf, key);
 				if (data) {
 					if (F_ISSET(leaf->mn_flags, F_DUPDATA)) {
+						if (unlikely(!(mc->mc_xcursor->mx_cursor.mc_flags & C_INITIALIZED))) {
+							mdb_xcursor_init1(mc, leaf);
+							rc = mdb_cursor_first(&mc->mc_xcursor->mx_cursor, data, NULL);
+							if (unlikely(rc))
+								break;
+						}
 						rc = mdb_cursor_get(&mc->mc_xcursor->mx_cursor, data, NULL, MDB_GET_CURRENT);
 					} else {
-						rc = mdb_node_read(mc->mc_txn, leaf, data);
+						rc = mdb_node_read(mc, leaf, data);
 					}
 				}
 			}
@@ -6414,7 +6649,7 @@ fetchm:
 			MDB_node *leaf = NODEPTR(mc->mc_pg[mc->mc_top], mc->mc_ki[mc->mc_top]);
 			if (!F_ISSET(leaf->mn_flags, F_DUPDATA)) {
 				MDB_GET_KEY(leaf, key);
-				rc = mdb_node_read(mc->mc_txn, leaf, data);
+				rc = mdb_node_read(mc, leaf, data);
 				break;
 			}
 		}
@@ -6451,7 +6686,8 @@ mdb_cursor_touch(MDB_cursor *mc)
 {
 	int rc = MDB_SUCCESS;
 
-	if (mc->mc_dbi >= CORE_DBS && !(*mc->mc_dbflag & DB_DIRTY)) {
+	if (mc->mc_dbi >= CORE_DBS && !(*mc->mc_dbflag & (DB_DIRTY|DB_DUPDATA))) {
+		/* Touch DB record of named DB */
 		MDB_cursor mc2;
 		MDB_xcursor mcx;
 		if (TXN_DBI_CHANGED(mc->mc_txn, mc->mc_dbi))
@@ -6521,7 +6757,7 @@ mdb_cursor_put(MDB_cursor *mc, MDB_val *key, MDB_val *data,
 	if (unlikely(mc->mc_txn->mt_flags & (MDB_TXN_RDONLY|MDB_TXN_BLOCKED)))
 		return (mc->mc_txn->mt_flags & MDB_TXN_RDONLY) ? EACCES : MDB_BAD_TXN;
 
-	if (unlikely(key->mv_size-1 >= ENV_MAXKEY(env)))
+	if (unlikely(key->mv_size > ENV_MAXKEY(env)))
 		return MDB_BAD_VALSIZE;
 
 #if SIZE_MAX > MAXDATASIZE
@@ -6549,11 +6785,25 @@ mdb_cursor_put(MDB_cursor *mc, MDB_val *key, MDB_val *data,
 	mdb_debug("==> put db %d key [%s], size %zu, data size %zu",
 		DDBI(mc), DKEY(key), key ? key->mv_size : 0, data->mv_size);
 
-	dkey.mv_size = 0;
-
-	if (flags == MDB_CURRENT) {
+	int dupdata_flag = 0;
+	if (flags & MDB_CURRENT) {
 		if (unlikely(!(mc->mc_flags & C_INITIALIZED)))
 			return EINVAL;
+#if MDBX_MODE_ENABLED
+		if (F_ISSET(mc->mc_db->md_flags, MDB_DUPSORT)) {
+			MDB_node *leaf = NODEPTR(mc->mc_pg[mc->mc_top], mc->mc_ki[mc->mc_top]);
+			if (F_ISSET(leaf->mn_flags, F_DUPDATA)) {
+				mdb_cassert(mc, mc->mc_xcursor != NULL
+					&& (mc->mc_xcursor->mx_cursor.mc_flags & C_INITIALIZED));
+				if (mc->mc_xcursor->mx_db.md_entries > 1) {
+					rc = mdbx_cursor_del(mc, 0);
+					if (rc != MDB_SUCCESS)
+						return rc;
+					flags -= MDB_CURRENT;
+				}
+			}
+		}
+#endif /* MDBX_MODE_ENABLED */
 		rc = MDB_SUCCESS;
 	} else if (mc->mc_db->md_root == P_INVALID) {
 		/* new database, cursor has nothing to point to */
@@ -6693,8 +6943,11 @@ more:
 			/* Was a single item before, must convert now */
 			if (!F_ISSET(leaf->mn_flags, F_DUPDATA)) {
 				/* Just overwrite the current item */
-				if (flags == MDB_CURRENT)
+				if (flags & MDB_CURRENT) {
+					if ((flags & MDB_NODUPDATA) && !mc->mc_dbx->md_dcmp(data, &olddata))
+						return MDB_KEYEXIST;
 					goto current;
+				}
 
 				/* does data match? */
 				if (!mc->mc_dbx->md_dcmp(data, &olddata)) {
@@ -6705,6 +6958,7 @@ more:
 				}
 
 				/* Back up original data item */
+				dupdata_flag = 1;
 				dkey.mv_size = olddata.mv_size;
 				dkey.mv_data = memcpy(fp+1, olddata.mv_data, olddata.mv_size);
 
@@ -6742,6 +6996,7 @@ more:
 						break;
 					}
 					/* FALLTHRU: Big enough MDB_DUPFIXED sub-page */
+				case MDB_CURRENT | MDB_NODUPDATA:
 				case MDB_CURRENT:
 					fp->mp_flags |= P_DIRTY;
 					COPY_PGNO(fp->mp_pgno, mp->mp_pgno);
@@ -6814,7 +7069,7 @@ current:
 			int level, ovpages, dpages = OVPAGES(data->mv_size, env->me_psize);
 
 			memcpy(&pg, olddata.mv_data, sizeof(pg));
-			if (unlikely((rc2 = mdb_page_get(mc->mc_txn, pg, &omp, &level)) != 0))
+			if (unlikely((rc2 = mdb_page_get(mc, pg, &omp, &level)) != 0))
 				return rc2;
 			ovpages = omp->mp_pages;
 
@@ -6848,13 +7103,8 @@ current:
 						 * parent txn, in case the user peeks at MDB_RESERVEd
 						 * or unused parts. Some users treat ovpages specially.
 						 */
-#if MDBX_MODE_ENABLED
-						/* LY: New page will contain only header from origin,
-						 * but no any payload */
-						memcpy(np, omp, PAGEHDRSZ);
-#else
 						size_t sz = (size_t) env->me_psize * ovpages, off;
-						if (!(flags & MDB_RESERVE)) {
+						if (MDBX_MODE_ENABLED || !(flags & MDB_RESERVE)) {
 							/* Skip the part where LMDB will put *data.
 							 * Copy end of page, adjusting alignment so
 							 * compiler may copy words instead of bytes.
@@ -6865,7 +7115,6 @@ current:
 							sz = PAGEHDRSZ;
 						}
 						memcpy(np, omp, sz); /* Copy whole or header of page */
-#endif /* MDBX_MODE_ENABLED */
 						omp = np;
 					}
 					SETDSZ(leaf, data->mv_size);
@@ -6926,11 +7175,8 @@ new_sub:
 				if (m3->mc_ki[i] >= mc->mc_ki[i] && insert_key) {
 					m3->mc_ki[i]++;
 				}
-				if (m3->mc_xcursor && (m3->mc_xcursor->mx_cursor.mc_flags & C_INITIALIZED)) {
-					MDB_node *n2 = NODEPTR(mp, m3->mc_ki[i]);
-					if ((n2->mn_flags & (F_SUBDATA|F_DUPDATA)) == F_DUPDATA)
-						m3->mc_xcursor->mx_cursor.mc_pg[0] = NODEDATA(n2);
-				}
+				if (XCURSOR_INITED(m3))
+					XCURSOR_REFRESH(m3, mp, m3->mc_ki[i]);
 			}
 		}
 	}
@@ -6939,17 +7185,17 @@ new_sub:
 		/* Now store the actual data in the child DB. Note that we're
 		 * storing the user data in the keys field, so there are strict
 		 * size limits on dupdata. The actual data fields of the child
-		 * DB are all zero size.
-		 */
+		 * DB are all zero size. */
 		if (do_sub) {
-			int xflags, new_dupdata;
+			int xflags;
 			size_t ecount;
 put_sub:
 			xdata.mv_size = 0;
 			xdata.mv_data = "";
 			leaf = NODEPTR(mc->mc_pg[mc->mc_top], mc->mc_ki[mc->mc_top]);
 			if (flags & MDB_CURRENT) {
-				xflags = MDB_CURRENT|MDB_NOSPILL;
+				xflags = (flags & MDB_NODUPDATA) ?
+					MDB_CURRENT|MDB_NOOVERWRITE|MDB_NOSPILL : MDB_CURRENT|MDB_NOSPILL;
 			} else {
 				mdb_xcursor_init1(mc, leaf);
 				xflags = (flags & MDB_NODUPDATA) ?
@@ -6957,9 +7203,8 @@ put_sub:
 			}
 			if (sub_root)
 				mc->mc_xcursor->mx_cursor.mc_pg[0] = sub_root;
-			new_dupdata = (int)dkey.mv_size;
 			/* converted, write the original data first */
-			if (dkey.mv_size) {
+			if (dupdata_flag) {
 				rc = mdb_cursor_put(&mc->mc_xcursor->mx_cursor, &dkey, &xdata, xflags);
 				if (unlikely(rc))
 					goto bad_sub;
@@ -6979,11 +7224,9 @@ put_sub:
 					if (!(m2->mc_flags & C_INITIALIZED)) continue;
 					if (m2->mc_pg[i] == mp) {
 						if (m2->mc_ki[i] == mc->mc_ki[i]) {
-							mdb_xcursor_init2(m2, mx, new_dupdata);
+							mdb_xcursor_init2(m2, mx, dupdata_flag);
 						} else if (!insert_key && m2->mc_ki[i] < nkeys) {
-							MDB_node *n2 = NODEPTR(mp, m2->mc_ki[i]);
-							if ((n2->mn_flags & (F_SUBDATA|F_DUPDATA)) == F_DUPDATA)
-								m2->mc_xcursor->mx_cursor.mc_pg[0] = NODEDATA(n2);
+							XCURSOR_REFRESH(m2, mp, m2->mc_ki[i]);
 						}
 					}
 				}
@@ -7006,8 +7249,7 @@ put_sub:
 			if (unlikely(rc))
 				goto bad_sub;
 			/* If we succeeded and the key didn't exist before,
-			 * make sure the cursor is marked valid.
-			 */
+			 * make sure the cursor is marked valid. */
 			mc->mc_flags |= C_INITIALIZED;
 		}
 		if (flags & MDB_MULTIPLE) {
@@ -7094,13 +7336,12 @@ mdb_cursor_del(MDB_cursor *mc, unsigned flags)
 						if (m2 == mc || m2->mc_snum < mc->mc_snum) continue;
 						if (!(m2->mc_flags & C_INITIALIZED)) continue;
 						if (m2->mc_pg[mc->mc_top] == mp) {
-							if (m2->mc_ki[mc->mc_top] == mc->mc_ki[mc->mc_top]) {
-								m2->mc_xcursor->mx_cursor.mc_pg[0] = NODEDATA(leaf);
-							} else {
-								MDB_node *n2 = NODEPTR(mp, m2->mc_ki[mc->mc_top]);
-								if (!(n2->mn_flags & F_SUBDATA))
-									m2->mc_xcursor->mx_cursor.mc_pg[0] = NODEDATA(n2);
+							MDB_node *n2 = leaf;
+							if (m2->mc_ki[mc->mc_top] != mc->mc_ki[mc->mc_top]) {
+								n2 = NODEPTR(mp, m2->mc_ki[mc->mc_top]);
+								if (n2->mn_flags & F_SUBDATA) continue;
 							}
+							m2->mc_xcursor->mx_cursor.mc_pg[0] = NODEDATA(n2);
 						}
 					}
 				}
@@ -7131,7 +7372,7 @@ mdb_cursor_del(MDB_cursor *mc, unsigned flags)
 		pgno_t pg;
 
 		memcpy(&pg, NODEDATA(leaf), sizeof(pg));
-		if (unlikely((rc = mdb_page_get(mc->mc_txn, pg, &omp, NULL)) ||
+		if (unlikely((rc = mdb_page_get(mc, pg, &omp, NULL)) ||
 			(rc = mdb_ovpage_free(mc, omp))))
 			goto fail;
 	}
@@ -7145,6 +7386,7 @@ fail:
 }
 
 /** Allocate and initialize new pages for a database.
+ * Set #MDB_TXN_ERROR on failure.
  * @param[in] mc a cursor on the database being added to.
  * @param[in] flags flags defining what type of page is being allocated.
  * @param[in] num the number of pages to allocate. This is usually 1,
@@ -7220,16 +7462,18 @@ mdb_branch_size(MDB_env *env, MDB_val *key)
 	size_t		 sz;
 
 	sz = INDXSIZE(key);
-	if (sz > env->me_nodemax) {
+	if (unlikely(sz > env->me_nodemax)) {
 		/* put on overflow page */
 		/* not implemented */
-		/* sz -= key->size - sizeof(pgno_t); */
+		mdb_assert_fail(env, "INDXSIZE(key) <= env->me_nodemax", __FUNCTION__, __LINE__);
+		sz -= key->mv_size - sizeof(pgno_t);
 	}
 
 	return sz + sizeof(indx_t);
 }
 
 /** Add a node to the page pointed to by the cursor.
+ * Set #MDB_TXN_ERROR on failure.
  * @param[in] mc The cursor for this operation.
  * @param[in] indx The index on the page where the new node should be added.
  * @param[in] key The key for the new node.
@@ -7540,15 +7784,13 @@ mdb_xcursor_init1(MDB_cursor *mc, MDB_node *node)
 	}
 	mdb_debug("Sub-db -%u root page %zu", mx->mx_cursor.mc_dbi,
 		mx->mx_db.md_root);
-	mx->mx_dbflag = DB_VALID|DB_USRVALID|DB_DIRTY; /* DB_DIRTY guides mdb_cursor_touch */
+	mx->mx_dbflag = DB_VALID|DB_USRVALID|DB_DUPDATA;
 /* #if UINT_MAX < SIZE_MAX
 	if (mx->mx_dbx.md_cmp == mdb_cmp_int && mx->mx_db.md_pad == sizeof(size_t))
 		mx->mx_dbx.md_cmp = mdb_cmp_clong;
 #endif */
-	mc->mc_signature = MDBX_MC_SIGNATURE;
 }
 
-
 /** Fixup a sorted-dups cursor due to underlying update.
  *	Sets up some fields that depend on the data from the main cursor.
  *	Almost the same as init1, but skips initialization steps if the
@@ -7567,10 +7809,8 @@ mdb_xcursor_init2(MDB_cursor *mc, MDB_xcursor *src_mx, int new_dupdata)
 		mx->mx_cursor.mc_top = 0;
 		mx->mx_cursor.mc_flags |= C_INITIALIZED;
 		mx->mx_cursor.mc_ki[0] = 0;
-		mx->mx_dbflag = DB_VALID|DB_USRVALID|DB_DIRTY; /* DB_DIRTY guides mdb_cursor_touch */
-#if UINT_MAX < SIZE_MAX
+		mx->mx_dbflag = DB_VALID|DB_USRVALID|DB_DUPDATA;
 		mx->mx_dbx.md_cmp = src_mx->mx_dbx.md_cmp;
-#endif
 	} else if (!(mx->mx_cursor.mc_flags & C_INITIALIZED)) {
 		return;
 	}
@@ -7584,6 +7824,7 @@ mdb_xcursor_init2(MDB_cursor *mc, MDB_xcursor *src_mx, int new_dupdata)
 static void
 mdb_cursor_init(MDB_cursor *mc, MDB_txn *txn, MDB_dbi dbi, MDB_xcursor *mx)
 {
+	mc->mc_signature = MDBX_MC_SIGNATURE;
 	mc->mc_next = NULL;
 	mc->mc_backup = NULL;
 	mc->mc_dbi = dbi;
@@ -7596,18 +7837,16 @@ mdb_cursor_init(MDB_cursor *mc, MDB_txn *txn, MDB_dbi dbi, MDB_xcursor *mx)
 	mc->mc_pg[0] = 0;
 	mc->mc_flags = 0;
 	mc->mc_ki[0] = 0;
+	mc->mc_xcursor = NULL;
 	if (txn->mt_dbs[dbi].md_flags & MDB_DUPSORT) {
 		mdb_tassert(txn, mx != NULL);
 		mx->mx_cursor.mc_signature = MDBX_MC_SIGNATURE;
 		mc->mc_xcursor = mx;
 		mdb_xcursor_init0(mc);
-	} else {
-		mc->mc_xcursor = NULL;
 	}
-	if (*mc->mc_dbflag & DB_STALE) {
+	if (unlikely(*mc->mc_dbflag & DB_STALE)) {
 		mdb_page_search(mc, NULL, MDB_PS_ROOTONLY);
 	}
-	mc->mc_signature = MDBX_MC_SIGNATURE;
 }
 
 int
@@ -7656,16 +7895,31 @@ mdb_cursor_renew(MDB_txn *txn, MDB_cursor *mc)
 	if (unlikely(!mc || !txn))
 		return EINVAL;
 
-	if (unlikely(txn->mt_signature != MDBX_MT_SIGNATURE
-			|| mc->mc_signature != MDBX_MC_SIGNATURE))
+	if (unlikely(txn->mt_signature != MDBX_MT_SIGNATURE))
 		return MDB_VERSION_MISMATCH;
 
+	if (unlikely(mc->mc_signature != MDBX_MC_SIGNATURE
+			&& mc->mc_signature != MDBX_MC_READY4CLOSE))
+		return EINVAL;
+
 	if (unlikely(!TXN_DBI_EXIST(txn, mc->mc_dbi, DB_VALID)))
 		return EINVAL;
 
-	if (unlikely((mc->mc_flags & C_UNTRACK) || txn->mt_cursors))
+	if (unlikely(mc->mc_backup))
 		return EINVAL;
 
+	if (unlikely((mc->mc_flags & C_UNTRACK) || txn->mt_cursors)) {
+#if MDBX_MODE_ENABLED
+		MDB_cursor **prev = &mc->mc_txn->mt_cursors[mc->mc_dbi];
+		while (*prev && *prev != mc) prev = &(*prev)->mc_next;
+		if (*prev == mc)
+			*prev = mc->mc_next;
+		mc->mc_signature = MDBX_MC_READY4CLOSE;
+#else
+		return EINVAL;
+#endif
+	}
+
 	if (unlikely(txn->mt_flags & MDB_TXN_BLOCKED))
 		return MDB_BAD_TXN;
 
@@ -7677,35 +7931,58 @@ mdb_cursor_renew(MDB_txn *txn, MDB_cursor *mc)
 int
 mdb_cursor_count(MDB_cursor *mc, size_t *countp)
 {
-	MDB_node	*leaf;
-
 	if (unlikely(mc == NULL || countp == NULL))
 		return EINVAL;
 
 	if (unlikely(mc->mc_signature != MDBX_MC_SIGNATURE))
 		return MDB_VERSION_MISMATCH;
 
-	if (unlikely(mc->mc_xcursor == NULL))
-		return MDB_INCOMPATIBLE;
-
 	if (unlikely(mc->mc_txn->mt_flags & MDB_TXN_BLOCKED))
 		return MDB_BAD_TXN;
 
 	if (unlikely(!(mc->mc_flags & C_INITIALIZED)))
 		return EINVAL;
 
-	if (unlikely(!mc->mc_snum || (mc->mc_flags & C_EOF)))
+#if MDBX_MODE_ENABLED
+	if (!mc->mc_snum) {
+		*countp = 0;
+		return MDB_NOTFOUND;
+	}
+
+	MDB_page *mp = mc->mc_pg[mc->mc_top];
+	if ((mc->mc_flags & C_EOF) && mc->mc_ki[mc->mc_top] >= NUMKEYS(mp)) {
+		*countp = 0;
+		return MDB_NOTFOUND;
+	}
+
+	*countp = 1;
+	if (mc->mc_xcursor != NULL) {
+		MDB_node *leaf = NODEPTR(mp, mc->mc_ki[mc->mc_top]);
+		if (F_ISSET(leaf->mn_flags, F_DUPDATA)) {
+			mdb_cassert(mc, mc->mc_xcursor && (mc->mc_xcursor->mx_cursor.mc_flags & C_INITIALIZED));
+			*countp = mc->mc_xcursor->mx_db.md_entries;
+		}
+	}
+#else
+	if (unlikely(mc->mc_xcursor == NULL))
+		return MDB_INCOMPATIBLE;
+
+	if (!mc->mc_snum)
 		return MDB_NOTFOUND;
 
-	leaf = NODEPTR(mc->mc_pg[mc->mc_top], mc->mc_ki[mc->mc_top]);
+	MDB_page *mp = mc->mc_pg[mc->mc_top];
+	if ((mc->mc_flags & C_EOF) && mc->mc_ki[mc->mc_top] >= NUMKEYS(mp))
+		return MDB_NOTFOUND;
+
+	MDB_node *leaf = NODEPTR(mp, mc->mc_ki[mc->mc_top]);
 	if (!F_ISSET(leaf->mn_flags, F_DUPDATA)) {
 		*countp = 1;
 	} else {
 		if (unlikely(!(mc->mc_xcursor->mx_cursor.mc_flags & C_INITIALIZED)))
 			return EINVAL;
-
 		*countp = mc->mc_xcursor->mx_db.md_entries;
 	}
+#endif /* MDBX_MODE_ENABLED */
 	return MDB_SUCCESS;
 }
 
@@ -7713,9 +7990,12 @@ void
 mdb_cursor_close(MDB_cursor *mc)
 {
 	if (mc) {
-		mdb_ensure(NULL, mc->mc_signature == MDBX_MC_SIGNATURE);
+		mdb_ensure(NULL, mc->mc_signature == MDBX_MC_SIGNATURE
+			|| mc->mc_signature == MDBX_MC_READY4CLOSE);
 		if (!mc->mc_backup) {
-			/* remove from txn, if tracked */
+			/* Remove from txn, if tracked.
+			 * A read-only txn (!C_UNTRACK) may have been freed already,
+			 * so do not peek inside it.  Only write txns track cursors. */
 			if ((mc->mc_flags & C_UNTRACK) && mc->mc_txn->mt_cursors) {
 				MDB_cursor **prev = &mc->mc_txn->mt_cursors[mc->mc_dbi];
 				while (*prev && *prev != mc) prev = &(*prev)->mc_next;
@@ -7724,6 +8004,10 @@ mdb_cursor_close(MDB_cursor *mc)
 			}
 			mc->mc_signature = 0;
 			free(mc);
+		} else {
+			/* cursor closed before nested txn ends */
+			mdb_cassert(mc, mc->mc_signature == MDBX_MC_SIGNATURE);
+			mc->mc_signature = MDBX_MC_WAIT4EOT;
 		}
 	}
 }
@@ -7745,6 +8029,7 @@ mdb_cursor_dbi(MDB_cursor *mc)
 }
 
 /** Replace the key for a branch node with a new key.
+ * Set #MDB_TXN_ERROR on failure.
  * @param[in] mc Cursor pointing to the node to operate on.
  * @param[in] key The new key to use.
  * @return 0 on success, non-zero on failure.
@@ -7923,14 +8208,12 @@ mdb_node_move(MDB_cursor *csrc, MDB_cursor *cdst, int fromleft)
 		csrc->mc_pg[csrc->mc_top]->mp_pgno,
 		cdst->mc_ki[cdst->mc_top], cdst->mc_pg[cdst->mc_top]->mp_pgno);
 
-	/* Add the node to the destination page.
-	 */
+	/* Add the node to the destination page. */
 	rc = mdb_node_add(cdst, cdst->mc_ki[cdst->mc_top], &key, &data, srcpg, flags);
 	if (unlikely(rc != MDB_SUCCESS))
 		return rc;
 
-	/* Delete the node from the source page.
-	 */
+	/* Delete the node from the source page. */
 	mdb_node_del(csrc, key.mv_size);
 
 	{
@@ -7962,12 +8245,8 @@ mdb_node_move(MDB_cursor *csrc, MDB_cursor *cdst, int fromleft)
 					m3->mc_ki[csrc->mc_top] = cdst->mc_ki[cdst->mc_top];
 					m3->mc_ki[csrc->mc_top-1]++;
 				}
-				if (m3->mc_xcursor && (m3->mc_xcursor->mx_cursor.mc_flags & C_INITIALIZED) &&
-					IS_LEAF(mps)) {
-					MDB_node *node = NODEPTR(m3->mc_pg[csrc->mc_top], m3->mc_ki[csrc->mc_top]);
-					if ((node->mn_flags & (F_DUPDATA|F_SUBDATA)) == F_DUPDATA)
-						m3->mc_xcursor->mx_cursor.mc_pg[0] = NODEDATA(node);
-				}
+				if (XCURSOR_INITED(m3) && IS_LEAF(mps))
+					XCURSOR_REFRESH(m3, m3->mc_pg[csrc->mc_top], m3->mc_ki[csrc->mc_top]);
 			}
 		} else
 		/* Adding on the right, bump others down */
@@ -7988,19 +8267,14 @@ mdb_node_move(MDB_cursor *csrc, MDB_cursor *cdst, int fromleft)
 					} else {
 						m3->mc_ki[csrc->mc_top]--;
 					}
-					if (m3->mc_xcursor && (m3->mc_xcursor->mx_cursor.mc_flags & C_INITIALIZED) &&
-						IS_LEAF(mps)) {
-						MDB_node *node = NODEPTR(m3->mc_pg[csrc->mc_top], m3->mc_ki[csrc->mc_top]);
-						if ((node->mn_flags & (F_DUPDATA|F_SUBDATA)) == F_DUPDATA)
-							m3->mc_xcursor->mx_cursor.mc_pg[0] = NODEDATA(node);
-					}
+					if (XCURSOR_INITED(m3) && IS_LEAF(mps))
+						XCURSOR_REFRESH(m3, m3->mc_pg[csrc->mc_top], m3->mc_ki[csrc->mc_top]);
 				}
 			}
 		}
 	}
 
-	/* Update the parent separators.
-	 */
+	/* Update the parent separators. */
 	if (csrc->mc_ki[csrc->mc_top] == 0) {
 		if (csrc->mc_ki[csrc->mc_top-1] != 0) {
 			if (IS_LEAF2(csrc->mc_pg[csrc->mc_top])) {
@@ -8192,12 +8466,8 @@ mdb_page_merge(MDB_cursor *csrc, MDB_cursor *cdst)
 				m3->mc_ki[top-1] > csrc->mc_ki[top-1]) {
 				m3->mc_ki[top-1]--;
 			}
-			if (m3->mc_xcursor && (m3->mc_xcursor->mx_cursor.mc_flags & C_INITIALIZED) &&
-				IS_LEAF(psrc)) {
-				MDB_node *node = NODEPTR(m3->mc_pg[top], m3->mc_ki[top]);
-				if ((node->mn_flags & (F_DUPDATA|F_SUBDATA)) == F_DUPDATA)
-					m3->mc_xcursor->mx_cursor.mc_pg[0] = NODEDATA(node);
-			}
+			if (XCURSOR_INITED(m3) && IS_LEAF(psrc))
+				XCURSOR_REFRESH(m3, m3->mc_pg[top], m3->mc_ki[top]);
 		}
 	}
 	{
@@ -8313,7 +8583,7 @@ mdb_rebalance(MDB_cursor *mc)
 			if (unlikely(rc))
 				return rc;
 			mc->mc_db->md_root = NODEPGNO(NODEPTR(mp, 0));
-			rc = mdb_page_get(mc->mc_txn,mc->mc_db->md_root,&mc->mc_pg[0],NULL);
+			rc = mdb_page_get(mc, mc->mc_db->md_root, &mc->mc_pg[0], NULL);
 			if (unlikely(rc))
 				return rc;
 			mc->mc_db->md_depth--;
@@ -8374,7 +8644,7 @@ mdb_rebalance(MDB_cursor *mc)
 		mdb_debug("reading right neighbor");
 		mn.mc_ki[ptop]++;
 		node = NODEPTR(mc->mc_pg[ptop], mn.mc_ki[ptop]);
-		rc = mdb_page_get(mc->mc_txn,NODEPGNO(node),&mn.mc_pg[mn.mc_top],NULL);
+		rc = mdb_page_get(mc, NODEPGNO(node), &mn.mc_pg[mn.mc_top], NULL);
 		if (unlikely(rc))
 			return rc;
 		mn.mc_ki[mn.mc_top] = 0;
@@ -8386,7 +8656,7 @@ mdb_rebalance(MDB_cursor *mc)
 		mdb_debug("reading left neighbor");
 		mn.mc_ki[ptop]--;
 		node = NODEPTR(mc->mc_pg[ptop], mn.mc_ki[ptop]);
-		rc = mdb_page_get(mc->mc_txn,NODEPGNO(node),&mn.mc_pg[mn.mc_top],NULL);
+		rc = mdb_page_get(mc, NODEPGNO(node), &mn.mc_pg[mn.mc_top], NULL);
 		if (unlikely(rc))
 			return rc;
 		mn.mc_ki[mn.mc_top] = NUMKEYS(mn.mc_pg[mn.mc_top]) - 1;
@@ -8451,14 +8721,16 @@ mdb_cursor_del0(MDB_cursor *mc)
 			if (m3->mc_pg[mc->mc_top] == mp) {
 				if (m3->mc_ki[mc->mc_top] == ki) {
 					m3->mc_flags |= C_DEL;
+					if (mc->mc_db->md_flags & MDB_DUPSORT) {
+						/* Sub-cursor referred into dataset which is gone */
+						m3->mc_xcursor->mx_cursor.mc_flags &= ~(C_INITIALIZED|C_EOF);
+					}
+					continue;
 				} else if (m3->mc_ki[mc->mc_top] > ki) {
 					m3->mc_ki[mc->mc_top]--;
 				}
-				if (m3->mc_xcursor && (m3->mc_xcursor->mx_cursor.mc_flags & C_INITIALIZED)) {
-					MDB_node *node = NODEPTR(m3->mc_pg[mc->mc_top], m3->mc_ki[mc->mc_top]);
-					if ((node->mn_flags & (F_DUPDATA|F_SUBDATA)) == F_DUPDATA)
-						m3->mc_xcursor->mx_cursor.mc_pg[0] = NODEDATA(node);
-				}
+				if (XCURSOR_INITED(m3))
+					XCURSOR_REFRESH(m3, m3->mc_pg[mc->mc_top], m3->mc_ki[mc->mc_top]);
 			}
 		}
 	}
@@ -8496,10 +8768,14 @@ mdb_cursor_del0(MDB_cursor *mc)
 					if (mc->mc_db->md_flags & MDB_DUPSORT) {
 						MDB_node *node = NODEPTR(m3->mc_pg[m3->mc_top], m3->mc_ki[m3->mc_top]);
 						/* If this node is a fake page, it needs to be reinited
-						 * because its data has moved.
+						 * because its data has moved. But just reset mc_pg[0]
+						 * if the xcursor is already live.
 						 */
 						if ((node->mn_flags & (F_DUPDATA|F_SUBDATA)) == F_DUPDATA) {
-							mdb_xcursor_init1(m3, node);
+							if (m3->mc_xcursor->mx_cursor.mc_flags & C_INITIALIZED)
+								m3->mc_xcursor->mx_cursor.mc_pg[0] = NODEDATA(node);
+							else
+								mdb_xcursor_init1(m3, node);
 						}
 					}
 				}
@@ -8529,10 +8805,12 @@ mdb_del(MDB_txn *txn, MDB_dbi dbi,
 	if (unlikely(txn->mt_flags & (MDB_TXN_RDONLY|MDB_TXN_BLOCKED)))
 		return (txn->mt_flags & MDB_TXN_RDONLY) ? EACCES : MDB_BAD_TXN;
 
+#if ! MDBX_MODE_ENABLED
 	if (!F_ISSET(txn->mt_dbs[dbi].md_flags, MDB_DUPSORT)) {
 		/* must ignore any data */
 		data = NULL;
 	}
+#endif
 
 	return mdb_del0(txn, dbi, key, data, 0);
 }
@@ -8544,7 +8822,7 @@ mdb_del0(MDB_txn *txn, MDB_dbi dbi,
 	MDB_cursor mc;
 	MDB_xcursor mx;
 	MDB_cursor_op op;
-	MDB_val rdata, *xdata;
+	MDB_val rdata;
 	int	rc, exact = 0;
 	DKBUF;
 
@@ -8555,13 +8833,12 @@ mdb_del0(MDB_txn *txn, MDB_dbi dbi,
 	if (data) {
 		op = MDB_GET_BOTH;
 		rdata = *data;
-		xdata = &rdata;
+		data = &rdata;
 	} else {
 		op = MDB_SET;
-		xdata = NULL;
 		flags |= MDB_NODUPDATA;
 	}
-	rc = mdb_cursor_set(&mc, key, xdata, op, &exact);
+	rc = mdb_cursor_set(&mc, key, data, op, &exact);
 	if (likely(rc == 0)) {
 		/* let mdb_page_split know about this cursor if needed:
 		 * delete will trigger a rebalance; if it needs to move
@@ -8571,7 +8848,6 @@ mdb_del0(MDB_txn *txn, MDB_dbi dbi,
 		 * run out of space, triggering a split. We need this
 		 * cursor to be consistent until the end of the rebalance.
 		 */
-		mc.mc_flags |= C_UNTRACK;
 		mc.mc_next = txn->mt_cursors[dbi];
 		txn->mt_cursors[dbi] = &mc;
 		rc = mdb_cursor_del(&mc, flags);
@@ -8581,6 +8857,7 @@ mdb_del0(MDB_txn *txn, MDB_dbi dbi,
 }
 
 /** Split a page and insert a new node.
+ * Set #MDB_TXN_ERROR on failure.
  * @param[in,out] mc Cursor pointing to the page and desired insertion index.
  * The cursor will be updated to point to the actual page and index where
  * the node got inserted after the split.
@@ -8669,7 +8946,6 @@ mdb_page_split(MDB_cursor *mc, MDB_val *newkey, MDB_val *newdata, pgno_t newpgno
 		split_indx = newindx;
 		nkeys = 0;
 	} else {
-
 		split_indx = (nkeys+1) / 2;
 
 		if (IS_LEAF2(rp)) {
@@ -8798,8 +9074,7 @@ mdb_page_split(MDB_cursor *mc, MDB_val *newkey, MDB_val *newdata, pgno_t newpgno
 
 	mdb_debug("separator is %d [%s]", split_indx, DKEY(&sepkey));
 
-	/* Copy separator key to the parent.
-	 */
+	/* Copy separator key to the parent. */
 	if (SIZELEFT(mn.mc_pg[ptop]) < mdb_branch_size(env, &sepkey)) {
 		int snum = mc->mc_snum;
 		mn.mc_snum--;
@@ -8829,7 +9104,7 @@ mdb_page_split(MDB_cursor *mc, MDB_val *newkey, MDB_val *newdata, pgno_t newpgno
 			} else {
 				/* find right page's left sibling */
 				mc->mc_ki[ptop] = mn.mc_ki[ptop];
-				mdb_cursor_sibling(mc, 0);
+				rc = mdb_cursor_sibling(mc, 0);
 			}
 		}
 	} else {
@@ -8837,8 +9112,11 @@ mdb_page_split(MDB_cursor *mc, MDB_val *newkey, MDB_val *newdata, pgno_t newpgno
 		rc = mdb_node_add(&mn, mn.mc_ki[ptop], &sepkey, NULL, rp->mp_pgno, 0);
 		mn.mc_top++;
 	}
-	if (unlikely(rc != MDB_SUCCESS))
+	if (unlikely(rc != MDB_SUCCESS)) {
+		if (rc == MDB_NOTFOUND) /* improper mdb_cursor_sibling() result */
+			rc = MDB_PROBLEM;
 		goto done;
+	}
 	if (nflags & MDB_APPEND) {
 		mc->mc_pg[mc->mc_top] = rp;
 		mc->mc_ki[mc->mc_top] = 0;
@@ -8988,12 +9266,8 @@ mdb_page_split(MDB_cursor *mc, MDB_val *newkey, MDB_val *newdata, pgno_t newpgno
 				m3->mc_ki[ptop] >= mc->mc_ki[ptop]) {
 				m3->mc_ki[ptop]++;
 			}
-			if (m3->mc_xcursor && (m3->mc_xcursor->mx_cursor.mc_flags & C_INITIALIZED) &&
-				IS_LEAF(mp)) {
-				MDB_node *node = NODEPTR(m3->mc_pg[mc->mc_top], m3->mc_ki[mc->mc_top]);
-				if ((node->mn_flags & (F_DUPDATA|F_SUBDATA)) == F_DUPDATA)
-					m3->mc_xcursor->mx_cursor.mc_pg[0] = NODEDATA(node);
-			}
+			if (XCURSOR_INITED(m3) && IS_LEAF(mp))
+				XCURSOR_REFRESH(m3, m3->mc_pg[mc->mc_top], m3->mc_ki[mc->mc_top]);
 		}
 	}
 	mdb_debug("mp left: %d, rp left: %d", SIZELEFT(mp), SIZELEFT(rp));
@@ -9012,7 +9286,6 @@ mdb_put(MDB_txn *txn, MDB_dbi dbi,
 {
 	MDB_cursor mc;
 	MDB_xcursor mx;
-	int rc;
 
 	if (unlikely(!key || !data || !txn))
 		return EINVAL;
@@ -9023,7 +9296,9 @@ mdb_put(MDB_txn *txn, MDB_dbi dbi,
 	if (unlikely(!TXN_DBI_EXIST(txn, dbi, DB_USRVALID)))
 		return EINVAL;
 
-	if (unlikely(flags & ~(MDB_NOOVERWRITE|MDB_NODUPDATA|MDB_RESERVE|MDB_APPEND|MDB_APPENDDUP)))
+	if (unlikely(flags & ~(MDB_NOOVERWRITE|MDB_NODUPDATA|MDB_RESERVE|MDB_APPEND|MDB_APPENDDUP
+			/* LY: MDB_CURRENT indicates explicit overwrite (update) for MDBX */
+			| (MDBX_MODE_ENABLED ? MDB_CURRENT : 0))))
 		return EINVAL;
 
 	if (unlikely(txn->mt_flags & (MDB_TXN_RDONLY|MDB_TXN_BLOCKED)))
@@ -9032,8 +9307,25 @@ mdb_put(MDB_txn *txn, MDB_dbi dbi,
 	mdb_cursor_init(&mc, txn, dbi, &mx);
 	mc.mc_next = txn->mt_cursors[dbi];
 	txn->mt_cursors[dbi] = &mc;
-	rc = mdb_cursor_put(&mc, key, data, flags);
+	int rc = MDB_SUCCESS;
+#if MDBX_MODE_ENABLED
+	/* LY: support for update (explicit overwrite) */
+	if (flags & MDB_CURRENT) {
+		rc = mdb_cursor_get(&mc, key, NULL, MDB_SET);
+		if (likely(rc == MDB_SUCCESS) && (txn->mt_dbs[dbi].md_flags & MDB_DUPSORT)) {
+			/* LY: allows update (explicit overwrite) only for unique keys */
+			MDB_node *leaf = NODEPTR(mc.mc_pg[mc.mc_top], mc.mc_ki[mc.mc_top]);
+			if (F_ISSET(leaf->mn_flags, F_DUPDATA)) {
+				mdb_tassert(txn, XCURSOR_INITED(&mc) && mc.mc_xcursor->mx_db.md_entries > 1);
+				rc = MDBX_EMULTIVAL;
+			}
+		}
+	}
+#endif /* MDBX_MODE_ENABLED */
+	if (likely(rc == MDB_SUCCESS))
+		rc = mdb_cursor_put(&mc, key, data, flags);
 	txn->mt_cursors[dbi] = mc.mc_next;
+
 	return rc;
 }
 
@@ -9056,7 +9348,10 @@ typedef struct mdb_copy {
 	HANDLE mc_fd;
 	int mc_toggle;			/**< Buffer number in provider */
 	int mc_new;				/**< (0-2 buffers to write) | (#MDB_EOF at end) */
-	volatile int mc_error;	/**< Error code, never cleared if set */
+	/** Error code.  Never cleared if set.  Both threads can set nonzero
+	 *	to fail the copy.  Not mutex-protected, LMDB expects atomic int.
+	 */
+	volatile int mc_error;
 } mdb_copy;
 
 	/** Dedicated writer thread for compacting copy. */
@@ -9068,6 +9363,14 @@ mdb_env_copythr(void *arg)
 	int toggle = 0, wsize, rc = 0;
 	int len;
 
+#ifdef SIGPIPE
+	sigset_t set;
+	sigemptyset(&set);
+	sigaddset(&set, SIGPIPE);
+	if ((rc = pthread_sigmask(SIG_BLOCK, &set, NULL)) != 0)
+		my->mc_error = rc;
+#endif
+
 	pthread_mutex_lock(&my->mc_mutex);
 	for(;;) {
 		while (!my->mc_new)
@@ -9082,6 +9385,15 @@ again:
 			len = write(my->mc_fd, ptr, wsize);
 			if (len < 0) {
 				rc = errno;
+#ifdef SIGPIPE
+				if (rc == EPIPE) {
+					/* Collect the pending SIGPIPE, otherwise at least OS X
+					 * gives it to the process on thread-exit (ITS#8504).
+					 */
+					int tmp;
+					sigwait(&set, &tmp);
+				}
+#endif
 				break;
 			} else if (len > 0) {
 				rc = MDB_SUCCESS;
@@ -9134,12 +9446,15 @@ mdb_env_cthr_toggle(mdb_copy *my, int adjust)
 	return my->mc_error;
 }
 
-	/** Depth-first tree traversal for compacting copy. */
+	/** Depth-first tree traversal for compacting copy.
+	 * @param[in] my control structure.
+	 * @param[in,out] pg database root.
+	 * @param[in] flags includes #F_DUPDATA if it is a sorted-duplicate sub-DB.
+	 */
 static int __cold
 mdb_env_cwalk(mdb_copy *my, pgno_t *pg, int flags)
 {
 	MDB_cursor mc;
-	MDB_txn *txn = my->mc_txn;
 	MDB_node *ni;
 	MDB_page *mo, *mp, *leaf;
 	char *buf, *ptr;
@@ -9152,9 +9467,9 @@ mdb_env_cwalk(mdb_copy *my, pgno_t *pg, int flags)
 
 	memset(&mc, 0, sizeof(mc));
 	mc.mc_snum = 1;
-	mc.mc_txn = txn;
+	mc.mc_txn = my->mc_txn;
 
-	rc = mdb_page_get(txn, *pg, &mc.mc_pg[0], NULL);
+	rc = mdb_page_get(&mc, *pg, &mc.mc_pg[0], NULL);
 	if (rc)
 		return rc;
 	rc = mdb_page_search_root(&mc, NULL, MDB_PS_FIRST);
@@ -9199,7 +9514,7 @@ mdb_env_cwalk(mdb_copy *my, pgno_t *pg, int flags)
 
 						memcpy(&pg, NODEDATA(ni), sizeof(pg));
 						memcpy(NODEDATA(ni), &my->mc_next_pgno, sizeof(pgno_t));
-						rc = mdb_page_get(txn, pg, &omp, NULL);
+						rc = mdb_page_get(&mc, pg, &omp, NULL);
 						if (rc)
 							goto done;
 						if (my->mc_wlen[toggle] >= MDB_WBUF) {
@@ -9249,7 +9564,7 @@ mdb_env_cwalk(mdb_copy *my, pgno_t *pg, int flags)
 again:
 				ni = NODEPTR(mp, mc.mc_ki[mc.mc_top]);
 				pg = NODEPGNO(ni);
-				rc = mdb_page_get(txn, pg, &mp, NULL);
+				rc = mdb_page_get(&mc, pg, &mp, NULL);
 				if (rc)
 					goto done;
 				mc.mc_top++;
@@ -9750,6 +10065,21 @@ mdb_env_info(MDB_env *env, MDB_envinfo *arg)
 	return mdbx_env_info(env, (MDBX_envinfo*) arg, sizeof(MDB_envinfo));
 }
 
+static MDB_cmp_func*
+mdbx_default_keycmp(unsigned flags)
+{
+	return	(flags & MDB_REVERSEKEY) ? mdb_cmp_memnr :
+		(flags & MDB_INTEGERKEY) ? mdb_cmp_int_a2 : mdb_cmp_memn;
+}
+
+static MDB_cmp_func*
+mdbx_default_datacmp(unsigned flags)
+{
+	return	!(flags & MDB_DUPSORT) ? 0 :
+		((flags & MDB_INTEGERDUP) ? mdb_cmp_int_ua :
+		((flags & MDB_REVERSEDUP) ? mdb_cmp_memnr : mdb_cmp_memn));
+}
+
 /** Set the default comparison functions for a database.
  * Called immediately after a database is opened to set the defaults.
  * The user can then override them with #mdb_set_compare() or
@@ -9760,16 +10090,9 @@ mdb_env_info(MDB_env *env, MDB_envinfo *arg)
 static void
 mdb_default_cmp(MDB_txn *txn, MDB_dbi dbi)
 {
-	unsigned f = txn->mt_dbs[dbi].md_flags;
-
-	txn->mt_dbxs[dbi].md_cmp =
-		(f & MDB_REVERSEKEY) ? mdb_cmp_memnr :
-		(f & MDB_INTEGERKEY) ? mdb_cmp_int_a2 : mdb_cmp_memn;
-
-	txn->mt_dbxs[dbi].md_dcmp =
-		!(f & MDB_DUPSORT) ? 0 :
-		((f & MDB_INTEGERDUP) ? mdb_cmp_int_ua :
-		((f & MDB_REVERSEDUP) ? mdb_cmp_memnr : mdb_cmp_memn));
+	unsigned flags = txn->mt_dbs[dbi].md_flags;
+	txn->mt_dbxs[dbi].md_cmp = mdbx_default_keycmp(flags);
+	txn->mt_dbxs[dbi].md_dcmp = mdbx_default_datacmp(flags);
 }
 
 int mdb_dbi_open(MDB_txn *txn, const char *name, unsigned flags, MDB_dbi *dbi)
@@ -9864,7 +10187,8 @@ int mdb_dbi_open(MDB_txn *txn, const char *name, unsigned flags, MDB_dbi *dbi)
 		memset(&dummy, 0, sizeof(dummy));
 		dummy.md_root = P_INVALID;
 		dummy.md_flags = flags & PERSISTENT_FLAGS;
-		rc = mdb_cursor_put(&mc, &key, &data, F_SUBDATA);
+		WITH_CURSOR_TRACKING(mc,
+			rc = mdb_cursor_put(&mc, &key, &data, F_SUBDATA));
 		dbflag |= DB_DIRTY;
 	}
 
@@ -9912,7 +10236,7 @@ mdbx_stat(MDB_txn *txn, MDB_dbi dbi, MDBX_stat *arg, size_t bytes)
 	if (unlikely(txn->mt_flags & MDB_TXN_BLOCKED))
 		return MDB_BAD_TXN;
 
-	if (txn->mt_dbflags[dbi] & DB_STALE) {
+	if (unlikely(txn->mt_dbflags[dbi] & DB_STALE)) {
 		MDB_cursor mc;
 		MDB_xcursor mx;
 		/* Stale, must read the DB's root. cursor_init does it for us. */
@@ -9995,7 +10319,7 @@ mdb_drop0(MDB_cursor *mc, int subs)
 						MDB_page *omp;
 						pgno_t pg;
 						memcpy(&pg, NODEDATA(ni), sizeof(pg));
-						rc = mdb_page_get(txn, pg, &omp, NULL);
+						rc = mdb_page_get(mc, pg, &omp, NULL);
 						if (unlikely(rc))
 							goto done;
 						mdb_cassert(mc, IS_OVERFLOW(omp));
@@ -10244,11 +10568,9 @@ mdb_pid_insert(pid_t *ids, pid_t pid)
 
 		if( val < 0 ) {
 			n = pivot;
-
 		} else if ( val > 0 ) {
 			base = cursor;
 			n -= pivot + 1;
-
 		} else {
 			/* found, so it's a duplicate */
 			return -1;
@@ -10275,7 +10597,7 @@ mdb_reader_check(MDB_env *env, int *dead)
 	return mdb_reader_check0(env, 0, dead);
 }
 
-/** As #mdb_reader_check(). rlocked = <caller locked the reader mutex>. */
+/** As #mdb_reader_check(). \b rlocked is set if caller locked #me_rmutex. */
 static int __cold
 mdb_reader_check0(MDB_env *env, int rlocked, int *dead)
 {
@@ -10314,15 +10636,14 @@ mdb_reader_check0(MDB_env *env, int rlocked, int *dead)
 								j = rdrs;
 						}
 					}
-					for (; j<rdrs; j++)
-							if (mr[j].mr_pid == pid) {
-								mdb_debug("clear stale reader pid %u txn %zd",
-									(unsigned) pid, mr[j].mr_txnid);
-								mr[j].mr_rthc = NULL;
-								mdbx_compiler_barrier();
-								mr[j].mr_pid = 0;
-								count++;
-							}
+					for (; j < rdrs; j++) {
+						if (mr[j].mr_pid == pid) {
+							mdb_debug("clear stale reader pid %u txn %zd",
+								(unsigned) pid, mr[j].mr_txnid);
+							mr[j].mr_pid = 0;
+							count++;
+						}
+					}
 					if (rmutex)
 						mdb_mutex_unlock(env, rmutex);
 				}
diff --git a/mdb_chk.c b/mdb_chk.c
index 4fe83ff0..1422eea1 100644
--- a/mdb_chk.c
+++ b/mdb_chk.c
@@ -1,8 +1,8 @@
 /* mdbx_chk.c - memory-mapped database check tool */
 
 /*
- * Copyright (c) 2015,2016 Leonid Yuriev <leo@yuriev.ru>.
- * Copyright (c) 2015,2016 Peter-Service R&D LLC.
+ * Copyright 2015-2017 Leonid Yuriev <leo@yuriev.ru>.
+ * Copyright 2015,2016 Peter-Service R&D LLC.
  *
  * This file is part of libmdbx.
  *
@@ -52,7 +52,7 @@ flagbit dbflags[] = {
 
 static volatile sig_atomic_t gotsignal;
 
-static void signal_hanlder( int sig ) {
+static void signal_handler( int sig ) {
 	(void) sig;
 	gotsignal = 1;
 }
@@ -264,7 +264,7 @@ static int pgvisitor(size_t pgno, unsigned pgnumber, void* ctx, const char* dbi,
 			problem_add("page", pgno, "illegal header-length", "%zu < %i < %zu",
 				sizeof(long), header_bytes, stat.base.ms_psize - sizeof(long));
 		if (payload_bytes < 1) {
-			if (nentries > 0) {
+			if (nentries > 1) {
 				problem_add("page", pgno, "zero size-of-entry", "payload %i bytes, %i entries",
 							payload_bytes, nentries);
 				if ((size_t) header_bytes + unused_bytes < page_size) {
@@ -432,7 +432,6 @@ static int process_db(MDB_dbi dbi, char *name, visitor *handler, int silent)
 			fflush(NULL);
 		}
 		skipped_subdb++;
-		mdbx_dbi_close(env, dbi);
 		return MDB_SUCCESS;
 	}
 
@@ -444,14 +443,12 @@ static int process_db(MDB_dbi dbi, char *name, visitor *handler, int silent)
 	rc = mdbx_dbi_flags(txn, dbi, &flags);
 	if (rc) {
 		error(" - mdbx_dbi_flags failed, error %d %s\n", rc, mdbx_strerror(rc));
-		mdbx_dbi_close(env, dbi);
 		return rc;
 	}
 
 	rc = mdbx_stat(txn, dbi, &ms, sizeof(ms));
 	if (rc) {
 		error(" - mdbx_stat failed, error %d %s\n", rc, mdbx_strerror(rc));
-		mdbx_dbi_close(env, dbi);
 		return rc;
 	}
 
@@ -475,7 +472,6 @@ static int process_db(MDB_dbi dbi, char *name, visitor *handler, int silent)
 	rc = mdbx_cursor_open(txn, dbi, &mc);
 	if (rc) {
 		error(" - mdbx_cursor_open failed, error %d %s\n", rc, mdbx_strerror(rc));
-		mdbx_dbi_close(env, dbi);
 		return rc;
 	}
 
@@ -491,9 +487,7 @@ static int process_db(MDB_dbi dbi, char *name, visitor *handler, int silent)
 			goto bailout;
 		}
 
-		if (key.mv_size == 0) {
-			problem_add("entry", record_count, "key with zero length", NULL);
-		} else if (key.mv_size > maxkeysize) {
+		if (key.mv_size > maxkeysize) {
 			problem_add("entry", record_count, "key length exceeds max-key-size",
 						"%zu > %zu", key.mv_size, maxkeysize);
 		} else if ((flags & MDB_INTEGERKEY)
@@ -565,7 +559,6 @@ bailout:
 	}
 
 	mdbx_cursor_close(mc);
-	mdbx_dbi_close(env, dbi);
 	return rc || problems_count;
 }
 
@@ -660,13 +653,13 @@ int main(int argc, char *argv[])
 		usage(prog);
 
 #ifdef SIGPIPE
-	signal(SIGPIPE, signal_hanlder);
+	signal(SIGPIPE, signal_handler);
 #endif
 #ifdef SIGHUP
-	signal(SIGHUP, signal_hanlder);
+	signal(SIGHUP, signal_handler);
 #endif
-	signal(SIGINT, signal_hanlder);
-	signal(SIGTERM, signal_hanlder);
+	signal(SIGINT, signal_handler);
+	signal(SIGTERM, signal_handler);
 
 	envname = argv[optind];
 	print("Running mdbx_chk for '%s' in %s mode...\n",
@@ -686,7 +679,11 @@ int main(int argc, char *argv[])
 	}
 	maxkeysize = rc;
 
-	mdbx_env_set_maxdbs(env, 3);
+	rc = mdbx_env_set_maxdbs(env, MAX_DBI);
+	if (rc < 0) {
+		error("mdbx_env_set_maxdbs failed, error %d %s\n", rc, mdbx_strerror(rc));
+		goto bailout;
+	}
 
 	rc = mdbx_env_open_ex(env, envname, envflags, 0664, &exclusive);
 	if (rc) {
@@ -747,7 +744,7 @@ int main(int argc, char *argv[])
 			   meta_lt(info.me_meta1_txnid, info.me_meta1_sign,
 					   info.me_meta2_txnid, info.me_meta2_sign) ? "tail" : "head");
 		if (info.me_meta1_txnid > info.base.me_last_txnid)
-			print(", rolled-back %zu (%zu >>> %zu)\n",
+			print(", rolled-back %zu (%zu >>> %zu)",
 				info.me_meta1_txnid - info.base.me_last_txnid,
 				info.me_meta1_txnid, info.base.me_last_txnid);
 		print("\n");
@@ -757,7 +754,7 @@ int main(int argc, char *argv[])
 			   meta_lt(info.me_meta2_txnid, info.me_meta2_sign,
 					   info.me_meta1_txnid, info.me_meta1_sign) ? "tail" : "head");
 		if (info.me_meta2_txnid > info.base.me_last_txnid)
-			print(", rolled-back %zu (%zu >>> %zu)\n",
+			print(", rolled-back %zu (%zu >>> %zu)",
 				info.me_meta2_txnid - info.base.me_last_txnid,
 				info.me_meta2_txnid, info.base.me_last_txnid);
 		print("\n");
diff --git a/mdb_copy.1 b/mdb_copy.1
index 4e9ed7eb..157e741d 100644
--- a/mdb_copy.1
+++ b/mdb_copy.1
@@ -1,4 +1,6 @@
-.\" Copyright 2012-2016 Howard Chu, Symas Corp. All Rights Reserved.
+.\" Copyright 2015-2017 Leonid Yuriev <leo@yuriev.ru>.
+.\" Copyright 2012-2017 Howard Chu, Symas Corp. All Rights Reserved.
+.\" Copyright 2015,2016 Peter-Service R&D LLC <http://billing.ru/>.
 .\" Copying restrictions apply.  See COPYRIGHT/LICENSE.
 .TH MDB_COPY 1 "2014/06/20" "LMDB 0.9.14"
 .SH NAME
diff --git a/mdb_copy.c b/mdb_copy.c
index 6c898ac5..43bee869 100644
--- a/mdb_copy.c
+++ b/mdb_copy.c
@@ -1,9 +1,9 @@
 /* mdb_copy.c - memory-mapped database backup tool */
 
 /*
- * Copyright (c) 2015,2016 Leonid Yuriev <leo@yuriev.ru>.
- * Copyright (c) 2015,2016 Peter-Service R&D LLC.
- * Copyright 2012-2016 Howard Chu, Symas Corp.
+ * Copyright 2015-2017 Leonid Yuriev <leo@yuriev.ru>.
+ * Copyright 2012-2017 Howard Chu, Symas Corp.
+ * Copyright 2015,2016 Peter-Service R&D LLC.
  * All rights reserved.
  *
  * Redistribution and use in source and binary forms, with or without
diff --git a/mdb_dump.1 b/mdb_dump.1
index 4efebdf2..4c4553ce 100644
--- a/mdb_dump.1
+++ b/mdb_dump.1
@@ -1,6 +1,6 @@
-.\" Copyright (c) 2015,2016 Leonid Yuriev <leo@yuriev.ru>.
-.\" Copyright (c) 2015,2016 Peter-Service R&D LLC <http://billing.ru/>.
-.\" Copyright 2014-2016 Howard Chu, Symas Corp. All Rights Reserved.
+.\" Copyright 2015-2017 Leonid Yuriev <leo@yuriev.ru>.
+.\" Copyright 2014-2017 Howard Chu, Symas Corp. All Rights Reserved.
+.\" Copyright 2015,2016 Peter-Service R&D LLC <http://billing.ru/>.
 .\" Copying restrictions apply.  See COPYRIGHT/LICENSE.
 .TH MDB_DUMP 1 "2014/06/20" "LMDB 0.9.14"
 .SH NAME
diff --git a/mdb_dump.c b/mdb_dump.c
index c27419f3..0b5db58e 100644
--- a/mdb_dump.c
+++ b/mdb_dump.c
@@ -1,9 +1,9 @@
 /* mdb_dump.c - memory-mapped database dump tool */
 
 /*
- * Copyright (c) 2015,2016 Leonid Yuriev <leo@yuriev.ru>.
- * Copyright (c) 2015,2016 Peter-Service R&D LLC.
- * Copyright 2011-2016 Howard Chu, Symas Corp.
+ * Copyright 2015-2017 Leonid Yuriev <leo@yuriev.ru>.
+ * Copyright 2011-2017 Howard Chu, Symas Corp.
+ * Copyright 2015,2016 Peter-Service R&D LLC.
  * All rights reserved.
  *
  * Redistribution and use in source and binary forms, with or without
diff --git a/mdb_load.1 b/mdb_load.1
index 7b353e75..5e082f67 100644
--- a/mdb_load.1
+++ b/mdb_load.1
@@ -1,6 +1,8 @@
-.TH MDB_LOAD 1 "2014/06/20" "LMDB 0.9.14"
-.\" Copyright 2014-2016 Howard Chu, Symas Corp. All Rights Reserved.
+.\" Copyright 2015-2017 Leonid Yuriev <leo@yuriev.ru>.
+.\" Copyright 2014-2017 Howard Chu, Symas Corp. All Rights Reserved.
+.\" Copyright 2015,2016 Peter-Service R&D LLC <http://billing.ru/>.
 .\" Copying restrictions apply.  See COPYRIGHT/LICENSE.
+.TH MDB_LOAD 1 "2014/06/20" "LMDB 0.9.14"
 .SH NAME
 mdb_load \- LMDB environment import tool
 .SH SYNOPSIS
diff --git a/mdb_load.c b/mdb_load.c
index 1e5378fd..e2cddd53 100644
--- a/mdb_load.c
+++ b/mdb_load.c
@@ -1,9 +1,9 @@
 /* mdb_load.c - memory-mapped database load tool */
 
 /*
- * Copyright (c) 2015,2016 Leonid Yuriev <leo@yuriev.ru>.
- * Copyright (c) 2015,2016 Peter-Service R&D LLC.
- * Copyright 2011-2016 Howard Chu, Symas Corp.
+ * Copyright 2015-2017 Leonid Yuriev <leo@yuriev.ru>.
+ * Copyright 2011-2017 Howard Chu, Symas Corp.
+ * Copyright 2015,2016 Peter-Service R&D LLC.
  * All rights reserved.
  *
  * Redistribution and use in source and binary forms, with or without
@@ -252,7 +252,8 @@ badend:
 					c2 += 2;
 				}
 			} else {
-				c1++; c2++;
+				/* copies are redundant when no escapes were used */
+				*c1++ = *c2++;
 			}
 		}
 	} else {
diff --git a/mdb_stat.1 b/mdb_stat.1
index 2e054600..bb659744 100644
--- a/mdb_stat.1
+++ b/mdb_stat.1
@@ -1,6 +1,6 @@
-.\" Copyright (c) 2015,2016 Leonid Yuriev <leo@yuriev.ru>.
-.\" Copyright (c) 2015,2016 Peter-Service R&D LLC <http://billing.ru/>.
-.\" Copyright 2012-2016 Howard Chu, Symas Corp. All Rights Reserved.
+.\" Copyright 2015-2017 Leonid Yuriev <leo@yuriev.ru>.
+.\" Copyright 2012-2017 Howard Chu, Symas Corp. All Rights Reserved.
+.\" Copyright 2015,2016 Peter-Service R&D LLC <http://billing.ru/>.
 .\" Copying restrictions apply.  See COPYRIGHT/LICENSE.
 .TH MDB_STAT 1 "2014/06/20" "LMDB 0.9.14"
 .SH NAME
diff --git a/mdb_stat.c b/mdb_stat.c
index 4c3c5453..d47ffe9e 100644
--- a/mdb_stat.c
+++ b/mdb_stat.c
@@ -1,9 +1,9 @@
 /* mdb_stat.c - memory-mapped database status tool */
 
 /*
- * Copyright (c) 2015,2016 Leonid Yuriev <leo@yuriev.ru>.
- * Copyright (c) 2015,2016 Peter-Service R&D LLC.
- * Copyright 2011-2016 Howard Chu, Symas Corp.
+ * Copyright 2015-2017 Leonid Yuriev <leo@yuriev.ru>.
+ * Copyright 2011-2017 Howard Chu, Symas Corp.
+ * Copyright 2015,2016 Peter-Service R&D LLC.
  * All rights reserved.
  *
  * Redistribution and use in source and binary forms, with or without
diff --git a/mdbx.c b/mdbx.c
index 9f92fb08..78bd1584 100644
--- a/mdbx.c
+++ b/mdbx.c
@@ -1,6 +1,6 @@
 /*
- * Copyright (c) 2015,2016 Leonid Yuriev <leo@yuriev.ru>.
- * Copyright (c) 2015,2016 Peter-Service R&D LLC.
+ * Copyright 2015-2017 Leonid Yuriev <leo@yuriev.ru>.
+ * Copyright 2015,2016 Peter-Service R&D LLC.
  * All rights reserved.
  *
  * Redistribution and use in source and binary forms, with or without
@@ -118,7 +118,7 @@ mdbx_env_set_syncbytes(MDB_env *env, size_t bytes)
 		return MDB_VERSION_MISMATCH;
 
 	env->me_sync_threshold = bytes;
-	return env->me_map ? mdb_env_sync(env, 0) : 0;
+	return env->me_map ? mdb_env_sync(env, 0) : MDB_SUCCESS;
 }
 
 void __cold
@@ -172,7 +172,7 @@ typedef struct mdb_walk_ctx {
 
 /** Depth-first tree traversal. */
 static int __cold
-mdb_env_walk(mdb_walk_ctx_t *ctx, const char* dbi, pgno_t pg, int flags, int deep)
+mdb_env_walk(mdb_walk_ctx_t *ctx, const char* dbi, pgno_t pg, int deep)
 {
 	MDB_page *mp;
 	int rc, i, nkeys;
@@ -182,7 +182,12 @@ mdb_env_walk(mdb_walk_ctx_t *ctx, const char* dbi, pgno_t pg, int flags, int dee
 	if (pg == P_INVALID)
 		return MDB_SUCCESS; /* empty db */
 
-	rc = mdb_page_get(ctx->mw_txn, pg, &mp, NULL);
+	MDB_cursor mc;
+	memset(&mc, 0, sizeof(mc));
+	mc.mc_snum = 1;
+	mc.mc_txn = ctx->mw_txn;
+
+	rc = mdb_page_get(&mc, pg, &mp, NULL);
 	if (rc)
 		return rc;
 	if (pg != mp->mp_p.p_pgno)
@@ -220,7 +225,7 @@ mdb_env_walk(mdb_walk_ctx_t *ctx, const char* dbi, pgno_t pg, int flags, int dee
 	}
 
 	for (align_bytes = i = 0; i < nkeys;
-		 align_bytes += ((payload_size + align_bytes) & 1), i++) {
+		align_bytes += ((payload_size + align_bytes) & 1), i++) {
 		MDB_node *node;
 
 		if (IS_LEAF2(mp)) {
@@ -233,15 +238,13 @@ mdb_env_walk(mdb_walk_ctx_t *ctx, const char* dbi, pgno_t pg, int flags, int dee
 		payload_size += NODESIZE + node->mn_ksize;
 
 		if (IS_BRANCH(mp)) {
-			rc = mdb_env_walk(ctx, dbi, NODEPGNO(node), flags, deep);
+			rc = mdb_env_walk(ctx, dbi, NODEPGNO(node), deep);
 			if (rc)
 				return rc;
 			continue;
 		}
 
 		assert(IS_LEAF(mp));
-		if (node->mn_ksize < 1)
-			return MDB_CORRUPTED;
 		if (node->mn_flags & F_BIGDATA) {
 			MDB_page *omp;
 			pgno_t *opg;
@@ -249,7 +252,7 @@ mdb_env_walk(mdb_walk_ctx_t *ctx, const char* dbi, pgno_t pg, int flags, int dee
 
 			payload_size += sizeof(pgno_t);
 			opg = NODEDATA(node);
-			rc = mdb_page_get(ctx->mw_txn, *opg, &omp, NULL);
+			rc = mdb_page_get(&mc, *opg, &omp, NULL);
 			if (rc)
 				return rc;
 			if (*opg != omp->mp_p.p_pgno)
@@ -276,8 +279,6 @@ mdb_env_walk(mdb_walk_ctx_t *ctx, const char* dbi, pgno_t pg, int flags, int dee
 			MDB_db *db = NODEDATA(node);
 			char* name = NULL;
 
-			if (NODEDSZ(node) < 1)
-				return MDB_CORRUPTED;
 			if (! (node->mn_flags & F_DUPDATA)) {
 				name = NODEKEY(node);
 				int namelen = (char*) db - name;
@@ -285,7 +286,7 @@ mdb_env_walk(mdb_walk_ctx_t *ctx, const char* dbi, pgno_t pg, int flags, int dee
 				name[namelen] = 0;
 			}
 			rc = mdb_env_walk(ctx, (name && name[0]) ? name : dbi,
-					db->md_root, node->mn_flags & F_DUPDATA, deep + 1);
+					db->md_root, deep + 1);
 			if (rc)
 				return rc;
 		}
@@ -313,14 +314,430 @@ mdbx_env_pgwalk(MDB_txn *txn, MDBX_pgvisitor_func* visitor, void* user)
 	rc = visitor(0, 2, user, "lmdb", "meta", 2, sizeof(MDB_meta)*2, PAGEHDRSZ*2,
 				 (txn->mt_env->me_psize - sizeof(MDB_meta) - PAGEHDRSZ) *2);
 	if (! rc)
-		rc = mdb_env_walk(&ctx, "free", txn->mt_dbs[FREE_DBI].md_root, 0, 0);
+		rc = mdb_env_walk(&ctx, "free", txn->mt_dbs[FREE_DBI].md_root, 0);
 	if (! rc)
-		rc = mdb_env_walk(&ctx, "main", txn->mt_dbs[MAIN_DBI].md_root, 0, 0);
+		rc = mdb_env_walk(&ctx, "main", txn->mt_dbs[MAIN_DBI].md_root, 0);
 	if (! rc)
 		rc = visitor(P_INVALID, 0, user, NULL, NULL, 0, 0, 0, 0);
 	return rc;
 }
 
+int mdbx_canary_put(MDB_txn *txn, const mdbx_canary* canary)
+{
+	if (unlikely(!txn))
+		return EINVAL;
+
+	if (unlikely(txn->mt_signature != MDBX_MT_SIGNATURE))
+		return MDB_VERSION_MISMATCH;
+
+	if (unlikely(F_ISSET(txn->mt_flags, MDB_TXN_RDONLY)))
+		return EACCES;
+
+	if (likely(canary)) {
+		txn->mt_canary.x = canary->x;
+		txn->mt_canary.y = canary->y;
+		txn->mt_canary.z = canary->z;
+	}
+	txn->mt_canary.v = txn->mt_txnid;
+
+	return MDB_SUCCESS;
+}
+
+size_t mdbx_canary_get(MDB_txn *txn, mdbx_canary* canary)
+{
+	if(unlikely(!txn || txn->mt_signature != MDBX_MT_SIGNATURE))
+		return 0;
+
+	if (likely(canary))
+		*canary = txn->mt_canary;
+
+	return txn->mt_txnid;
+}
+
+int mdbx_cursor_on_first(MDB_cursor *mc)
+{
+	if (unlikely(mc == NULL))
+		return EINVAL;
+
+	if (unlikely(mc->mc_signature != MDBX_MC_SIGNATURE))
+		return MDB_VERSION_MISMATCH;
+
+	if (!(mc->mc_flags & C_INITIALIZED))
+		return MDBX_RESULT_FALSE;
+
+	unsigned i;
+	for(i = 0; i < mc->mc_snum; ++i) {
+		if (mc->mc_ki[i])
+			return MDBX_RESULT_FALSE;
+	}
+
+	return MDBX_RESULT_TRUE;
+}
+
+int mdbx_cursor_on_last(MDB_cursor *mc)
+{
+	if (unlikely(mc == NULL))
+		return EINVAL;
+
+	if (unlikely(mc->mc_signature != MDBX_MC_SIGNATURE))
+		return MDB_VERSION_MISMATCH;
+
+	if (!(mc->mc_flags & C_INITIALIZED))
+		return MDBX_RESULT_FALSE;
+
+	unsigned i;
+	for(i = 0; i < mc->mc_snum; ++i) {
+		unsigned nkeys = NUMKEYS(mc->mc_pg[i]);
+		if (mc->mc_ki[i] < nkeys - 1)
+			return MDBX_RESULT_FALSE;
+	}
+
+	return MDBX_RESULT_TRUE;
+}
+
+int mdbx_cursor_eof(MDB_cursor *mc)
+{
+	if (unlikely(mc == NULL))
+		return EINVAL;
+
+	if (unlikely(mc->mc_signature != MDBX_MC_SIGNATURE))
+		return MDB_VERSION_MISMATCH;
+
+	if ((mc->mc_flags & C_INITIALIZED) == 0)
+		return MDBX_RESULT_TRUE;
+
+	if (mc->mc_snum == 0)
+		return MDBX_RESULT_TRUE;
+
+	if ((mc->mc_flags & C_EOF)
+			&& mc->mc_ki[mc->mc_top] >= NUMKEYS(mc->mc_pg[mc->mc_top]))
+		return MDBX_RESULT_TRUE;
+
+	return MDBX_RESULT_FALSE;
+}
+
+static int mdbx_is_samedata(const MDB_val* a, const MDB_val* b) {
+	return a->iov_len == b->iov_len
+		&& memcmp(a->iov_base, b->iov_base, a->iov_len) == 0;
+}
+
+/* Позволяет обновить или удалить существующую запись с получением
+ * в old_data предыдущего значения данных. При этом если new_data равен
+ * нулю, то выполняется удаление, иначе обновление/вставка.
+ *
+ * Текущее значение может находиться в уже измененной (грязной) странице.
+ * В этом случае страница будет перезаписана при обновлении, а само старое
+ * значение утрачено. Поэтому исходно в old_data должен быть передан
+ * дополнительный буфер для копирования старого значения.
+ * Если переданный буфер слишком мал, то функция вернет -1, установив
+ * old_data->iov_len в соответствующее значение.
+ *
+ * Для не-уникальных ключей также возможен второй сценарий использования,
+ * когда посредством old_data из записей с одинаковым ключом для
+ * удаления/обновления выбирается конкретная. Для выбора этого сценария
+ * во flags следует одновременно указать MDB_CURRENT и MDB_NOOVERWRITE.
+ * Именно эта комбинация выбрана, так как она лишена смысла, и этим позволяет
+ * идентифицировать запрос такого сценария.
+ *
+ * Функция может быть замещена соответствующими операциями с курсорами
+ * после двух доработок (TODO):
+ *  - внешняя аллокация курсоров, в том числе на стеке (без malloc).
+ *  - получения статуса страницы по адресу (знать о P_DIRTY).
+ */
+int mdbx_replace(MDB_txn *txn, MDB_dbi dbi,
+	MDB_val *key, MDB_val *new_data, MDB_val *old_data, unsigned flags)
+{
+	MDB_cursor mc;
+	MDB_xcursor mx;
+
+	if (unlikely(!key || !old_data || !txn || old_data == new_data))
+		return EINVAL;
+
+	if (unlikely(txn->mt_signature != MDBX_MT_SIGNATURE))
+		return MDB_VERSION_MISMATCH;
+
+	if (unlikely(old_data->iov_base == NULL && old_data->iov_len))
+		return EINVAL;
+
+	if (unlikely(new_data == NULL && !(flags & MDB_CURRENT)))
+		return EINVAL;
+
+	if (unlikely(!TXN_DBI_EXIST(txn, dbi, DB_USRVALID)))
+		return EINVAL;
+
+	if (unlikely(flags & ~(MDB_NOOVERWRITE|MDB_NODUPDATA|MDB_RESERVE|MDB_APPEND|MDB_APPENDDUP|MDB_CURRENT)))
+		return EINVAL;
+
+	if (unlikely(txn->mt_flags & (MDB_TXN_RDONLY|MDB_TXN_BLOCKED)))
+		return (txn->mt_flags & MDB_TXN_RDONLY) ? EACCES : MDB_BAD_TXN;
+
+	mdb_cursor_init(&mc, txn, dbi, &mx);
+	mc.mc_next = txn->mt_cursors[dbi];
+	txn->mt_cursors[dbi] = &mc;
+
+	int rc;
+	MDB_val present_key = *key;
+	if (F_ISSET(flags, MDB_CURRENT | MDB_NOOVERWRITE)) {
+		/* в old_data значение для выбора конкретного дубликата */
+		if (unlikely(!(txn->mt_dbs[dbi].md_flags & MDB_DUPSORT))) {
+			rc = EINVAL;
+			goto bailout;
+		}
+
+		/* убираем лишний бит, он был признаком запрошенного режима */
+		flags -= MDB_NOOVERWRITE;
+
+		rc = mdbx_cursor_get(&mc, &present_key, old_data, MDB_GET_BOTH);
+		if (rc != MDB_SUCCESS)
+			goto bailout;
+
+		if (new_data) {
+			/* обновление конкретного дубликата */
+			if (mdbx_is_samedata(old_data, new_data))
+				/* если данные совпадают, то ничего делать не надо */
+				goto bailout;
+#if 0 /* LY: исправлено в mdbx_cursor_put(), здесь в качестве памятки */
+			MDB_node *leaf = NODEPTR(mc.mc_pg[mc.mc_top], mc.mc_ki[mc.mc_top]);
+			if (F_ISSET(leaf->mn_flags, F_DUPDATA)
+					&& mc.mc_xcursor->mx_db.md_entries > 1) {
+				/* Если у ключа больше одного значения, то
+				 * сначала удаляем найденое "старое" значение.
+				 *
+				 * Этого можно не делать, так как MDBX уже
+				 * обучен корректно обрабатывать такие ситуации.
+				 *
+				 * Однако, следует помнить, что в LMDB при
+				 * совпадении размера данных, значение будет
+				 * просто перезаписано с нарушением
+				 * упорядоченности, что сломает поиск. */
+				rc = mdbx_cursor_del(&mc, 0);
+				if (rc != MDB_SUCCESS)
+					goto bailout;
+				flags -= MDB_CURRENT;
+			}
+#endif
+		}
+	} else {
+		/* в old_data буфер для сохранения предыдущего значения */
+		if (unlikely(new_data && old_data->iov_base == new_data->iov_base))
+			return EINVAL;
+		MDB_val present_data;
+		rc = mdbx_cursor_get(&mc, &present_key, &present_data, MDB_SET_KEY);
+		if (unlikely(rc != MDB_SUCCESS)) {
+			old_data->iov_base = NULL;
+			old_data->iov_len = rc;
+			if (rc != MDB_NOTFOUND || (flags & MDB_CURRENT))
+				goto bailout;
+		} else if (flags & MDB_NOOVERWRITE) {
+			rc = MDB_KEYEXIST;
+			*old_data = present_data;
+			goto bailout;
+		} else {
+			MDB_page *page = mc.mc_pg[mc.mc_top];
+			if (txn->mt_dbs[dbi].md_flags & MDB_DUPSORT) {
+				if (flags & MDB_CURRENT) {
+					/* для не-уникальных ключей позволяем update/delete только если ключ один */
+					MDB_node *leaf = NODEPTR(page, mc.mc_ki[mc.mc_top]);
+					if (F_ISSET(leaf->mn_flags, F_DUPDATA)) {
+						mdb_tassert(txn, XCURSOR_INITED(&mc) && mc.mc_xcursor->mx_db.md_entries > 1);
+						if (mc.mc_xcursor->mx_db.md_entries > 1) {
+							rc = MDBX_EMULTIVAL;
+							goto bailout;
+						}
+					}
+					/* если данные совпадают, то ничего делать не надо */
+					if (new_data && mdbx_is_samedata(&present_data, new_data)) {
+						*old_data = *new_data;
+						goto bailout;
+					}
+					/* В оригинальной LMDB фладок MDB_CURRENT здесь приведет
+					 * к замене данных без учета MDB_DUPSORT сортировки,
+					 * но здесь это в любом случае допустимо, так как мы
+					 * проверили что для ключа есть только одно значение. */
+				} else if ((flags & MDB_NODUPDATA) && mdbx_is_samedata(&present_data, new_data)) {
+					/* если данные совпадают и установлен MDB_NODUPDATA */
+					rc = MDB_KEYEXIST;
+					goto bailout;
+				}
+			} else {
+				/* если данные совпадают, то ничего делать не надо */
+				if (new_data && mdbx_is_samedata(&present_data, new_data)) {
+					*old_data = *new_data;
+					goto bailout;
+				}
+				flags |= MDB_CURRENT;
+			}
+
+			if (page->mp_flags & P_DIRTY) {
+				if (unlikely(old_data->iov_len < present_data.iov_len)) {
+					old_data->iov_base = NULL;
+					old_data->iov_len = present_data.iov_len;
+					rc = MDBX_RESULT_TRUE;
+					goto bailout;
+				}
+				memcpy(old_data->iov_base, present_data.iov_base, present_data.iov_len);
+				old_data->iov_len = present_data.iov_len;
+			} else {
+				*old_data = present_data;
+			}
+		}
+	}
+
+	if (likely(new_data))
+		rc = mdbx_cursor_put(&mc, key, new_data, flags);
+	else
+		rc = mdbx_cursor_del(&mc, 0);
+
+bailout:
+	txn->mt_cursors[dbi] = mc.mc_next;
+	return rc;
+}
+
+int
+mdbx_get_ex(MDB_txn *txn, MDB_dbi dbi,
+	MDB_val *key, MDB_val *data, int* values_count)
+{
+	DKBUF;
+	mdb_debug("===> get db %u key [%s]", dbi, DKEY(key));
+
+	if (unlikely(!key || !data || !txn))
+		return EINVAL;
+
+	if (unlikely(txn->mt_signature != MDBX_MT_SIGNATURE))
+		return MDB_VERSION_MISMATCH;
+
+	if (unlikely(!TXN_DBI_EXIST(txn, dbi, DB_USRVALID)))
+		return EINVAL;
+
+	if (unlikely(txn->mt_flags & MDB_TXN_BLOCKED))
+		return MDB_BAD_TXN;
+
+	MDB_cursor mc;
+	MDB_xcursor mx;
+	mdb_cursor_init(&mc, txn, dbi, &mx);
+
+	int exact = 0;
+	int rc = mdb_cursor_set(&mc, key, data, MDB_SET_KEY, &exact);
+	if (unlikely(rc != MDB_SUCCESS)) {
+		if (rc == MDB_NOTFOUND && values_count)
+			*values_count = 0;
+		return rc;
+	}
+
+	if (values_count) {
+		*values_count = 1;
+		if (mc.mc_xcursor != NULL) {
+			MDB_node *leaf = NODEPTR(mc.mc_pg[mc.mc_top], mc.mc_ki[mc.mc_top]);
+			if (F_ISSET(leaf->mn_flags, F_DUPDATA)) {
+				mdb_tassert(txn, mc.mc_xcursor == &mx
+					&& (mx.mx_cursor.mc_flags & C_INITIALIZED));
+				*values_count = mx.mx_db.md_entries;
+			}
+		}
+	}
+	return MDB_SUCCESS;
+}
+
+/* Функция сообщает находится ли указанный адрес в "грязной" странице у
+ * заданной пишущей транзакции. В конечном счете это позволяет избавиться от
+ * лишнего копирования данных из НЕ-грязных страниц.
+ *
+ * "Грязные" страницы - это те, которые уже были изменены в ходе пишущей
+ * транзакции. Соответственно, какие-либо дальнейшие изменения могут привести
+ * к перезаписи таких страниц. Поэтому все функции, выполняющие изменения, в
+ * качестве аргументов НЕ должны получать указатели на данные в таких
+ * страницах. В свою очередь "НЕ грязные" страницы перед модификацией будут
+ * скопированы.
+ *
+ * Другими словами, данные из "грязных" страниц должны быть либо скопированы
+ * перед передачей в качестве аргументов для дальнейших модификаций, либо
+ * отвергнуты на стадии проверки корректности аргументов.
+ *
+ * Таким образом, функция позволяет как избавится от лишнего копирования,
+ * так и выполнить более полную проверку аргументов.
+ *
+ * ВАЖНО: Передаваемый указатель должен указывать на начало данных. Только
+ * так гарантируется что актуальный заголовок страницы будет физически
+ * расположен в той-же странице памяти, в том числе для многостраничных
+ * P_OVERFLOW страниц с длинными данными. */
+int mdbx_is_dirty(const MDB_txn *txn, const void* ptr)
+{
+	if (unlikely(!txn))
+		return EINVAL;
+
+	if(unlikely(txn->mt_signature != MDBX_MT_SIGNATURE))
+		return MDB_VERSION_MISMATCH;
+
+	if (unlikely(txn->mt_flags & MDB_TXN_RDONLY))
+		return MDB_BAD_TXN;
+
+	const MDB_env *env = txn->mt_env;
+	const uintptr_t mask = ~(uintptr_t) (env->me_psize - 1);
+	const MDB_page *page = (const MDB_page *) ((uintptr_t) ptr & mask);
+
+	/* LY: Тут не всё хорошо с абсолютной достоверностью результата,
+	 * так как флажок P_DIRTY в LMDB может означать не совсем то,
+	 * что было исходно задумано, детали см в логике кода mdb_page_touch().
+	 *
+	 * Более того, в режиме БЕЗ WRITEMAP грязные страницы выделяются через
+	 * malloc(), т.е. находятся вне mmap-диаппазона.
+	 *
+	 * Тем не менее, однозначно страница "не грязная" если:
+	 *  - адрес находится внутри mmap-диаппазона и в заголовке страницы
+	 *    нет флажка P_DIRTY, то однозначно страница "не грязная".
+	 *  - адрес вне mmap-диаппазона и его нет среди списка "грязных" страниц.
+	 */
+	if (env->me_map < (char*) page) {
+		const size_t used_size = env->me_psize * txn->mt_next_pgno;
+		if (env->me_map + used_size > (char*) page) {
+			/* страница внутри диапазона */
+			if (page->mp_flags & P_DIRTY)
+				return MDBX_RESULT_TRUE;
+			return MDBX_RESULT_FALSE;
+		}
+		/* Гипотетически здесь возможна ситуация, когда указатель адресует что-то
+		 * в пределах mmap, но за границей распределенных страниц. Это тяжелая
+		 * ошибка, которой не возможно добиться без каких-то мега-нарушений.
+		 * Поэтому не проверяем этот случай кроме как assert-ом, ибо бестолку. */
+		mdb_tassert(txn, env->me_map + env->me_mapsize > (char*) page);
+	}
+	/* Страница вне mmap-диаппазона */
+
+	if (env->me_flags & MDB_WRITEMAP)
+		/* Если MDB_WRITEMAP, то результат уже ясен. */
+		return MDBX_RESULT_FALSE;
+
+	/* Смотрим список грязных страниц у заданной транзакции. */
+	MDB_ID2 *list = txn->mt_u.dirty_list;
+	if (list) {
+		unsigned i, n = list[0].mid;
+		for (i = 1; i <= n; i++) {
+			const MDB_page *dirty = list[i].mptr;
+			if (dirty == page)
+				return MDBX_RESULT_TRUE;
+		}
+	}
+
+	/* При вложенных транзакциях, страница может быть в dirty-списке
+	 * родительской транзакции, но в этом случае она будет скопирована перед
+	 * изменением в текущей транзакции, т.е. относительно заданной транзакции
+	 * проверяемый адрес "не грязный". */
+	return MDBX_RESULT_FALSE;
+}
+
+int mdbx_dbi_open_ex(MDB_txn *txn, const char *name, unsigned flags,
+	MDB_dbi *pdbi, MDB_cmp_func *keycmp, MDB_cmp_func *datacmp)
+{
+	int rc = mdbx_dbi_open(txn, name, flags, pdbi);
+	if (likely(rc == MDB_SUCCESS)) {
+		MDB_dbi dbi = *pdbi;
+		unsigned flags = txn->mt_dbs[dbi].md_flags;
+		txn->mt_dbxs[dbi].md_cmp = keycmp ? keycmp : mdbx_default_keycmp(flags);
+		txn->mt_dbxs[dbi].md_dcmp = datacmp ? datacmp : mdbx_default_datacmp(flags);
+	}
+	return rc;
+}
+
 /* attribute support functions for Nexenta ***********************************/
 
 static __inline int
diff --git a/mdbx.h b/mdbx.h
index bcbd4f47..515e819e 100644
--- a/mdbx.h
+++ b/mdbx.h
@@ -1,6 +1,6 @@
 /*
- * Copyright (c) 2015,2016 Leonid Yuriev <leo@yuriev.ru>.
- * Copyright (c) 2015,2016 Peter-Service R&D LLC.
+ * Copyright 2015-2017 Leonid Yuriev <leo@yuriev.ru>.
+ * Copyright 2015,2016 Peter-Service R&D LLC.
  * All rights reserved.
  *
  * Redistribution and use in source and binary forms, with or without
@@ -211,6 +211,44 @@ typedef int MDBX_pgvisitor_func(size_t pgno, unsigned pgnumber, void* ctx,
 					const char* dbi, const char *type, int nentries,
 					int payload_bytes, int header_bytes, int unused_bytes);
 int mdbx_env_pgwalk(MDB_txn *txn, MDBX_pgvisitor_func* visitor, void* ctx);
+
+typedef struct mdbx_canary {
+	size_t x, y, z, v;
+} mdbx_canary;
+
+int mdbx_canary_put(MDB_txn *txn, const mdbx_canary* canary);
+size_t mdbx_canary_get(MDB_txn *txn, mdbx_canary* canary);
+
+/* Returns:
+ *	- MDBX_RESULT_TRUE	when no more data available
+ *				or cursor not positioned;
+ *	- MDBX_RESULT_FALSE	when data available;
+ *	- Otherwise the error code. */
+int mdbx_cursor_eof(MDB_cursor *mc);
+
+/* Returns: MDBX_RESULT_TRUE, MDBX_RESULT_FALSE or Error code. */
+int mdbx_cursor_on_first(MDB_cursor *mc);
+
+/* Returns: MDBX_RESULT_TRUE, MDBX_RESULT_FALSE or Error code. */
+int mdbx_cursor_on_last(MDB_cursor *mc);
+
+#define MDBX_EMULTIVAL (MDB_LAST_ERRCODE - 42)
+#define MDBX_RESULT_FALSE MDB_SUCCESS
+#define MDBX_RESULT_TRUE (-1)
+
+int mdbx_replace(MDB_txn *txn, MDB_dbi dbi,
+	MDB_val *key, MDB_val *new_data, MDB_val *old_data, unsigned flags);
+/* Same as mdbx_get(), but:
+ * 1) if values_count is not NULL, then returns the count
+ *    of multi-values/duplicates for a given key.
+ * 2) updates the key for pointing to the actual key's data inside DB. */
+int mdbx_get_ex(MDB_txn *txn, MDB_dbi dbi, MDB_val *key, MDB_val *data, int* values_count);
+
+int mdbx_is_dirty(const MDB_txn *txn, const void* ptr);
+
+int mdbx_dbi_open_ex(MDB_txn *txn, const char *name, unsigned flags,
+	MDB_dbi *dbi, MDB_cmp_func *keycmp, MDB_cmp_func *datacmp);
+
 /**	@} */
 
 #ifdef __cplusplus
diff --git a/midl.c b/midl.c
index c181f38c..6d2417ac 100644
--- a/midl.c
+++ b/midl.c
@@ -2,9 +2,9 @@
  *	@brief ldap bdb back-end ID List functions */
 
 /*
- * Copyright (c) 2015,2016 Leonid Yuriev <leo@yuriev.ru>.
- * Copyright (c) 2015,2016 Peter-Service R&D LLC.
- * Copyright 2000-2016 The OpenLDAP Foundation.
+ * Copyright 2015-2017 Leonid Yuriev <leo@yuriev.ru>.
+ * Copyright 2000-2017 The OpenLDAP Foundation.
+ * Copyright 2015,2016 Peter-Service R&D LLC.
  * All rights reserved.
  *
  * Redistribution and use in source and binary forms, with or without
diff --git a/midl.h b/midl.h
index 7cc3baeb..1bdffce1 100644
--- a/midl.h
+++ b/midl.h
@@ -10,9 +10,9 @@
  */
 
 /*
- * Copyright (c) 2015,2016 Leonid Yuriev <leo@yuriev.ru>.
- * Copyright (c) 2015,2016 Peter-Service R&D LLC.
- * Copyright 2000-2016 The OpenLDAP Foundation.
+ * Copyright 2015-2017 Leonid Yuriev <leo@yuriev.ru>.
+ * Copyright 2000-2017 The OpenLDAP Foundation.
+ * Copyright 2015,2016 Peter-Service R&D LLC.
  * All rights reserved.
  *
  * Redistribution and use in source and binary forms, with or without
diff --git a/mtest0.c b/mtest0.c
index 54b0d20c..c09019f1 100644
--- a/mtest0.c
+++ b/mtest0.c
@@ -1,9 +1,9 @@
 /* mtest.c - memory-mapped database tester/toy */
 
 /*
- * Copyright (c) 2015,2016 Leonid Yuriev <leo@yuriev.ru>.
- * Copyright (c) 2015,2016 Peter-Service R&D LLC.
- * Copyright 2011-2016 Howard Chu, Symas Corp.
+ * Copyright 2015-2017 Leonid Yuriev <leo@yuriev.ru>.
+ * Copyright 2011-2017 Howard Chu, Symas Corp.
+ * Copyright 2015,2016 Peter-Service R&D LLC.
  * All rights reserved.
  *
  * Redistribution and use in source and binary forms, with or without
@@ -23,6 +23,8 @@
 #include <sys/stat.h>
 #include "mdbx.h"
 
+#include <pthread.h>
+
 #define E(expr) CHECK((rc = (expr)) == MDB_SUCCESS, #expr)
 #define RES(err, expr) ((rc = expr) == (err) || (CHECK(!rc, #expr), 0))
 #define CHECK(test, msg) ((test) ? (void)0 : ((void)fprintf(stderr, \
@@ -32,6 +34,18 @@
 #	define DBPATH "./testdb"
 #endif
 
+void* thread_entry(void *ctx)
+{
+	MDB_env *env = ctx;
+	MDB_txn *txn;
+	int rc;
+
+	E(mdb_txn_begin(env, NULL, MDB_RDONLY, &txn));
+	mdb_txn_abort(txn);
+
+	return NULL;
+}
+
 int main(int argc,char * argv[])
 {
 	int i = 0, j = 0, rc;
@@ -60,7 +74,7 @@ int main(int argc,char * argv[])
 	}
 
 	E(mdb_env_create(&env));
-	E(mdb_env_set_maxreaders(env, 1));
+	E(mdb_env_set_maxreaders(env, 42));
 	E(mdb_env_set_mapsize(env, 10485760));
 
 	E(stat("/proc/self/exe", &exe_stat)?errno:0);
@@ -184,6 +198,11 @@ int main(int argc,char * argv[])
 	mdb_cursor_close(cur2);
 	E(mdb_txn_commit(txn));
 
+	for(i = 0; i < 41; ++i) {
+		pthread_t thread;
+		pthread_create(&thread, NULL, thread_entry, env);
+	}
+
 	printf("Restarting cursor outside txn\n");
 	E(mdb_txn_begin(env, NULL, 0, &txn));
 	E(mdb_cursor_open(txn, dbi, &cursor));
diff --git a/mtest1.c b/mtest1.c
index ff063198..ffe79123 100644
--- a/mtest1.c
+++ b/mtest1.c
@@ -1,6 +1,6 @@
 /*
- * Copyright (c) 2015,2016 Leonid Yuriev <leo@yuriev.ru>.
- * Copyright (c) 2015,2016 Peter-Service R&D LLC.
+ * Copyright 2015-2017 Leonid Yuriev <leo@yuriev.ru>.
+ * Copyright 2015,2016 Peter-Service R&D LLC.
  * All rights reserved.
  *
  * Redistribution and use in source and binary forms, with or without
diff --git a/mtest2.c b/mtest2.c
index 85f1576f..12b1e126 100644
--- a/mtest2.c
+++ b/mtest2.c
@@ -1,9 +1,9 @@
 /* mtest2.c - memory-mapped database tester/toy */
 
 /*
- * Copyright (c) 2015,2016 Leonid Yuriev <leo@yuriev.ru>.
- * Copyright (c) 2015,2016 Peter-Service R&D LLC.
- * Copyright 2011-2016 Howard Chu, Symas Corp.
+ * Copyright 2015-2017 Leonid Yuriev <leo@yuriev.ru>.
+ * Copyright 2011-2017 Howard Chu, Symas Corp.
+ * Copyright 2015,2016 Peter-Service R&D LLC.
  * All rights reserved.
  *
  * Redistribution and use in source and binary forms, with or without
diff --git a/mtest3.c b/mtest3.c
index 245fd071..a55ec604 100644
--- a/mtest3.c
+++ b/mtest3.c
@@ -1,9 +1,9 @@
 /* mtest3.c - memory-mapped database tester/toy */
 
 /*
- * Copyright (c) 2015,2016 Leonid Yuriev <leo@yuriev.ru>.
- * Copyright (c) 2015,2016 Peter-Service R&D LLC.
- * Copyright 2011-2016 Howard Chu, Symas Corp.
+ * Copyright 2015-2017 Leonid Yuriev <leo@yuriev.ru>.
+ * Copyright 2011-2017 Howard Chu, Symas Corp.
+ * Copyright 2015,2016 Peter-Service R&D LLC.
  * All rights reserved.
  *
  * Redistribution and use in source and binary forms, with or without
diff --git a/mtest4.c b/mtest4.c
index 56430876..3d67a0f9 100644
--- a/mtest4.c
+++ b/mtest4.c
@@ -1,9 +1,9 @@
 /* mtest4.c - memory-mapped database tester/toy */
 
 /*
- * Copyright (c) 2015,2016 Leonid Yuriev <leo@yuriev.ru>.
- * Copyright (c) 2015,2016 Peter-Service R&D LLC.
- * Copyright 2011-2016 Howard Chu, Symas Corp.
+ * Copyright 2015-2017 Leonid Yuriev <leo@yuriev.ru>.
+ * Copyright 2011-2017 Howard Chu, Symas Corp.
+ * Copyright 2015,2016 Peter-Service R&D LLC.
  * All rights reserved.
  *
  * Redistribution and use in source and binary forms, with or without
diff --git a/mtest5.c b/mtest5.c
index 66a176f7..ed19f412 100644
--- a/mtest5.c
+++ b/mtest5.c
@@ -1,9 +1,9 @@
 /* mtest5.c - memory-mapped database tester/toy */
 
 /*
- * Copyright (c) 2015,2016 Leonid Yuriev <leo@yuriev.ru>.
- * Copyright (c) 2015,2016 Peter-Service R&D LLC.
- * Copyright 2011-2016 Howard Chu, Symas Corp.
+ * Copyright 2015-2017 Leonid Yuriev <leo@yuriev.ru>.
+ * Copyright 2011-2017 Howard Chu, Symas Corp.
+ * Copyright 2015,2016 Peter-Service R&D LLC.
  * All rights reserved.
  *
  * Redistribution and use in source and binary forms, with or without
diff --git a/mtest6.c b/mtest6.c
index bae731c4..d988c93c 100644
--- a/mtest6.c
+++ b/mtest6.c
@@ -1,9 +1,9 @@
 /* mtest6.c - memory-mapped database tester/toy */
 
 /*
- * Copyright (c) 2015,2016 Leonid Yuriev <leo@yuriev.ru>.
- * Copyright (c) 2015,2016 Peter-Service R&D LLC.
- * Copyright 2011-2016 Howard Chu, Symas Corp.
+ * Copyright 2015-2017 Leonid Yuriev <leo@yuriev.ru>.
+ * Copyright 2011-2017 Howard Chu, Symas Corp.
+ * Copyright 2015,2016 Peter-Service R&D LLC.
  * All rights reserved.
  *
  * Redistribution and use in source and binary forms, with or without
diff --git a/reopen.h b/reopen.h
index b85acde4..dd214172 100644
--- a/reopen.h
+++ b/reopen.h
@@ -1,6 +1,6 @@
 /*
- * Copyright (c) 2015,2016 Leonid Yuriev <leo@yuriev.ru>.
- * Copyright (c) 2015,2016 Peter-Service R&D LLC.
+ * Copyright 2015-2017 Leonid Yuriev <leo@yuriev.ru>.
+ * Copyright 2015,2016 Peter-Service R&D LLC.
  * All rights reserved.
  *
  * Redistribution and use in source and binary forms, with or without
@@ -57,7 +57,7 @@
 #endif /* __must_check_result */
 
 #ifndef __hot
-#	if defined(NDEBUG) && (defined(__GNUC__) && !defined(__clang__))
+#	if defined(__OPTIMIZE__) && (defined(__GNUC__) && !defined(__clang__))
 #		define __hot __attribute__((hot, optimize("O3")))
 #	elif defined(__GNUC__)
 		/* cland case, just put frequently used functions in separate section */
@@ -68,7 +68,7 @@
 #endif /* __hot */
 
 #ifndef __cold
-#	if defined(NDEBUG) && (defined(__GNUC__) && !defined(__clang__))
+#	if defined(__OPTIMIZE__) && (defined(__GNUC__) && !defined(__clang__))
 #		define __cold __attribute__((cold, optimize("Os")))
 #	elif defined(__GNUC__)
 		/* cland case, just put infrequently used functions in separate section */
@@ -79,7 +79,7 @@
 #endif /* __cold */
 
 #ifndef __flatten
-#	if defined(NDEBUG) && (defined(__GNUC__) || defined(__clang__))
+#	if defined(__OPTIMIZE__) && (defined(__GNUC__) || defined(__clang__))
 #		define __flatten __attribute__((flatten))
 #	else
 #		define __flatten
diff --git a/sample-bdb.txt b/sample-bdb.txt
index 9be26713..c4343e9e 100644
--- a/sample-bdb.txt
+++ b/sample-bdb.txt
@@ -4,9 +4,9 @@
  */
 
 /*
- * Copyright (c) 2015,2016 Leonid Yuriev <leo@yuriev.ru>.
- * Copyright (c) 2015,2016 Peter-Service R&D LLC.
- * Copyright 2012-2016 Howard Chu, Symas Corp.
+ * Copyright 2015-2017 Leonid Yuriev <leo@yuriev.ru>.
+ * Copyright 2012-2017 Howard Chu, Symas Corp.
+ * Copyright 2015,2016 Peter-Service R&D LLC.
  * All rights reserved.
  *
  * Redistribution and use in source and binary forms, with or without
diff --git a/sample-mdb.txt b/sample-mdb.txt
index f605f67d..24fccdb9 100644
--- a/sample-mdb.txt
+++ b/sample-mdb.txt
@@ -4,9 +4,9 @@
  */
 
 /*
- * Copyright (c) 2015,2016 Leonid Yuriev <leo@yuriev.ru>.
- * Copyright (c) 2015,2016 Peter-Service R&D LLC.
- * Copyright 2012-2016 Howard Chu, Symas Corp.
+ * Copyright 2015-2017 Leonid Yuriev <leo@yuriev.ru>.
+ * Copyright 2012-2017 Howard Chu, Symas Corp.
+ * Copyright 2015,2016 Peter-Service R&D LLC.
  * All rights reserved.
  *
  * Redistribution and use in source and binary forms, with or without
diff --git a/wbench.c b/wbench.c
index db3b8457..e5fdc64a 100644
--- a/wbench.c
+++ b/wbench.c
@@ -1,6 +1,6 @@
 /*
- * Copyright (c) 2015,2016 Leonid Yuriev <leo@yuriev.ru>.
- * Copyright (c) 2015,2016 Peter-Service R&D LLC.
+ * Copyright 2015-2017 Leonid Yuriev <leo@yuriev.ru>.
+ * Copyright 2015,2016 Peter-Service R&D LLC.
  * All rights reserved.
  *
  * Redistribution and use in source and binary forms, with or without
diff --git a/yota_test1.c b/yota_test1.c
index 178133f8..be727cbf 100644
--- a/yota_test1.c
+++ b/yota_test1.c
@@ -1,6 +1,6 @@
 /*
- * Copyright (c) 2016 Leonid Yuriev <leo@yuriev.ru>.
- * Copyright (c) 2015 Vladimir Romanov <https://www.linkedin.com/in/vladimirromanov>, Yota Lab.
+ * Copyright 2016-2017 Leonid Yuriev <leo@yuriev.ru>.
+ * Copyright 2015 Vladimir Romanov <https://www.linkedin.com/in/vladimirromanov>, Yota Lab.
  *
  * This file is part of libmdbx.
  *
@@ -16,7 +16,6 @@
  *
  * You should have received a copy of the GNU Affero General Public License
  * along with this program.  If not, see <http://www.gnu.org/licenses/>.
- *
  */
 
 #include <sys/time.h>
diff --git a/yota_test2.c b/yota_test2.c
index a8bd6e61..753bea2f 100644
--- a/yota_test2.c
+++ b/yota_test2.c
@@ -1,6 +1,6 @@
 /*
- * Copyright (c) 2016 Leonid Yuriev <leo@yuriev.ru>.
- * Copyright (c) 2015 Vladimir Romanov <https://www.linkedin.com/in/vladimirromanov>, Yota Lab.
+ * Copyright 2016-2017 Leonid Yuriev <leo@yuriev.ru>.
+ * Copyright 2015 Vladimir Romanov <https://www.linkedin.com/in/vladimirromanov>, Yota Lab.
  *
  * This file is part of libmdbx.
  *
@@ -16,7 +16,6 @@
  *
  * You should have received a copy of the GNU Affero General Public License
  * along with this program.  If not, see <http://www.gnu.org/licenses/>.
- *
  */
 
 #include <sys/time.h>