GitHub

参考资料 https://github.com/ytakano/radix_tree

radix_tree_node

核心数据结构
```
private:
	std::map<K, radix_tree_node<K, T, Compare>*, Compare> m_children; // 每个节点维护一个map
    radix_tree_node<K, T, Compare> *m_parent; // 父节点
    value_type *m_value; // pair<cosnt K, T> 类型的指针
    int m_depth; // 深度，该节点之前前缀的长度
    bool m_is_leaf; // 是不是叶子节点
    K m_key; // K 键
    Compare& m_pred; // map的比较函数
```
每一个节点记录了键值，键值对的指针，父节点，深度（对应前缀的长度）等。

节点有两类：叶子节点和非叶子节点
- 叶子节点
  
  对应m_is_leaf变量为true，m_deepth值等于对应字符串的长度，m_value指向目标元素，m_key为nil，m_children为空。
- 非叶子节点
  
  m_deepth存储的是这个节点之前的前缀字符串的长度，不包含自身key的长度；m_children内部保存了接下来的节点，如果一个非叶子节点的前缀加上自己的key后组成了一个对应的完整的字符串，那么这个节点的m_children[nil]将会存储一个叶子节点，该叶子节点指向对应的value。

radix_tree_it

核心数据结构

private:
    radix_tree_node<K, T, Compare> *m_pointee; // 指向节点的指针，核心成员变量

内部维护一个radix_tree_node *，这是一个前向迭代器，++iterator的做法是访问自己这个node的m_children，如果自己没有孩子，则访问自己的兄弟节点，如果还没有则访问叔叔节点......重写oprerator*和operator->，分别返回radix_tree_node::value_type ->seconde和维护的节点自身。

具体实现

下降到下一个(叶子)节点

// 从给定的节点node开始，下降到其第一个子节点（如果node不是叶子节点）。
// 如果node是叶子节点，则直接返回node。
// 否则，它获取node的第一个子节点，并递归地对那个子节点调用descend函数。
template <typename K, typename T, typename Compare>
radix_tree_node<K, T, Compare>* radix_tree_it<K, T, Compare>::descend(radix_tree_node<K, T, Compare>* node) const
{
    if (node->m_is_leaf) return node; // 遇到叶子节点直接返回
	typename radix_tree_node<K, T, Compare>::it_child it = node->m_children.begin();
 	assert(it != node->m_children.end());
	return descend(it->second);
}

移动到下一个(叶子)节点

// 这个函数试图找到给定节点node在基数树中的下一个节点。
// 它首先检查该节点是否有父节点，如果没有（即该节点是树的根节点），则返回NULL。
// 如果有父节点，它就在父节点的子节点集合中查找node，并尝试找到node之后的下一个子节点。
//  -->  如果找到了下一个子节点，就通过调用descend函数下降到那个子节点；
//  -->  如果没有找到（即node是其父节点的最后一个子节点），则递归地对父节点调用increment函数。
template <typename K, typename T, typename Compare>
radix_tree_node<K, T, Compare>* radix_tree_it<K, T, Compare>::increment(radix_tree_node<K, T, Compare>* node) const
{
	radix_tree_node<K, T, Compare>* parent = node->m_parent;
    if (parent == NULL) return NULL;
    typename radix_tree_node<K, T, Compare>::it_child it = parent->m_children.find(node->m_key);
    assert(it != parent->m_children.end()); // 如果找不到，直接终止，因为这个节点不存在
    ++it; // 我们的目的是找到下一个节点，所以 ++it
    if (it == parent->m_children.end())
        return increment(parent); // 递归的在父节点中查找
    else
        return descend(it->second);
}

重载operator++

template <typename K, typename T, typename Compare>
const radix_tree_it<K, T, Compare>& radix_tree_it<K, T, Compare>::operator++()
{
    if (m_pointee != NULL)
        m_pointee = increment(m_pointee);
    return *this;
}

radix_tree

核心数据结构

private:
    size_type m_size; // 节点的个数
    radix_tree_node<K, T, Compare>* m_root; // 根节点
	Compare m_predicate; // 比较函数

基数树存储值的规则是：如果到一个节点，组成的key是一个完整的key，也就是对应有value了，那么它会创建一个孩子，这个孩子节点的键是空(nil)，并将此孩子节点设置为叶子节点m_is_leaf = true，同时将此孩子的节点的m_value指向对应的键值对，并在自己的m_children[nil]插入这个叶子节点

template <typename K, typename T, typename Compare>
radix_tree_node<K, T, Compare>* radix_tree<K, T, Compare>::find_node(const K &key, radix_tree_node<K, T, Compare> *node, int depth)
{
    if (node->m_children.empty())
        return node;
    typename radix_tree_node<K, T, Compare>::it_child it;
    int len_key = radix_length(key) - depth; // 除去前面前缀的长度后剩下的长度

    for (it = node->m_children.begin(); it != node->m_children.end(); ++it) { // 从当前节点，开始寻找他的子节点，进行匹配
        if (len_key == 0) { // 前缀匹配完，还有两种情况，一种完全匹配，第二种是剩下的字符串超过了 key
            if (it->second->m_is_leaf) return it->second;
            else continue; // 如果一直找不到，最后循环结束返回 node
        }

        if (! it->second->m_is_leaf && key[depth] == it->first[0] ) { // 子节点的第一个字符匹配
            int len_node = radix_length(it->first);
            K   key_sub  = radix_substr(key, depth, len_node); // 继续判断这个子节点所有字符串是不是匹配目标对应部分

            if (key_sub == it->first) {
                return find_node(key, it->second, depth+len_node); // 匹配，继续向下寻找
            } else {
                return it->second; // 找不到了，返回最接近的节点
            }
        }
    }
    return node; 
}

查询最接近的节点，输入一个key，在基数树中查找一个和key最匹配的节点，也就是说也可能正好找到key，也可能找不到，但是返回一个最接近的，看看一个例子：

/*
(root)
|
|---------------
|       |      |
abcde   bcdef  c
|   |   |      |------
|   |   $3     |  |  |
f   ge         d  e  $6
|   |          |  |
$1  $2         $4 $5

find_node():
  bcdef  -> $3
  bcdefa -> bcdef
  c      -> $6
  cf     -> c
  abch   -> abcde
  abc    -> abcde
  abcde  -> abcde
  abcdef -> $1
  abcdeh -> abcde
  de     -> (root)
*/

接下来我们的前缀匹配，插入，删除都需要依赖这个函数。

// 前缀匹配
template <typename K, typename T, typename Compare>
void radix_tree<K, T, Compare>::prefix_match(const K &key, std::vector<iterator> &vec);

这里的key其实是我们的前缀。此函数内部调用find_node函数找到最接近的节点，然后判断这个最接近的节点的键值能否包含目标前缀，如果不能包含，则没有前缀匹配，否则继续调用greedy_match函数将符合的节点的迭代其放入参数vec中。

// 找到最匹配的节点，返回迭代器
template <typename K, typename T, typename Compare>
typename radix_tree<K, T, Compare>::iterator radix_tree<K, T, Compare>::longest_match(const K &key);

// 在 parent 节点之后添加键值对
template <typename K, typename T, typename Compare>
radix_tree_node<K, T, Compare>* radix_tree<K, T, Compare>::append(radix_tree_node<K, T, Compare> *parent, const value_type &val)；

这里分两种情况，一种是parent节点对应的键就是目标键值，那么在parent后加入一个为键位nil的孩子节点，并将键值对保存在这个孩子节点即可。第二种是parent节点所代表的键只是目标键值的前缀，那么需要再次添加一个键值的非空的孩子节点，然后再次添加一个键值为空的孙子节点来保存键值对。

// 在 node 前方插入键值对
template <typename K, typename T, typename Compare>
radix_tree_node<K, T, Compare>* radix_tree<K, T, Compare>::prepend(radix_tree_node<K, T, Compare> *node, const value_type &val);

我们首先需要找到插入键值对和node节点对应键的共同前缀，然后分别处理后面的部分。

// 删除一个键值对
template <typename K, typename T, typename Compare>
bool radix_tree<K, T, Compare>::erase(const K &key);

删除键值对的操作就是删除对应的键位nil的叶子节点。但是我们要考虑将一些节点合并来减少基数树的高度。一是如果删去这个叶子节点后他的父节点的孩子节点少于一个，那么可以考虑将这个父节点和剩下子节点（如果有）进行合并。同时，如果处理到最后发现祖父节点也只有一个孩子了（对应的叔叔节点）那么可以将叔叔节点和祖父节点合并。

Name		Name	Last commit message	Last commit date
Latest commit History 3 Commits
.gitignore		.gitignore
CMakeLists.txt		CMakeLists.txt
README.md		README.md
radix_tree.hpp		radix_tree.hpp
test.cpp		test.cpp

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

About

Releases

Packages

Languages

myc13381/radix_tree

Folders and files

Latest commit

History

Repository files navigation

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages