在计算机科学中,trie,又称前缀树或字典树,是一种有序树,用于保存关联数组,其中的键通常是字符串。与二叉查找树不同,键不是直接保存在节点中,而是由节点在树中的位置决定。一个节点的所有子孙都有相同的前缀,也就是这个节点对应的字符串,而根节点对应空字符串。一般情况下,不是所有的节点都有对应的值,只有叶子节点和部分内部节点所对应的键才有相关的值。
Trie可以看作是一个确定有限状态自动机,尽管边上的符号一般是隐含在分支的顺序中的
Trie的代码实现,一下代码摘自Trie树的Python实现,写的确实太好了,所以摘抄过来了
class Trie:
def __init__(self):
self.root = dict()
def insert(self, string):
index, node = self.findLastNode(string)
for char in string[index:]:
new_node = dict()
node[char] = new_node
node = new_node
def find(self, string):
index, node = self.findLastNode(string)
return (index == len(string))
def findLastNode(self, string):
'''
@param string: string to be searched
@return: (index, node).
index: int. first char(string[index]) of string not found in Trie tree. Otherwise, the length of string
node: dict. node doesn't have string[index].
'''
node = self.root
index = 0
while index < len(string):
char = string[index]
if char in node:
node = node[char]
else:
break
index += 1
return (index, node)
def printTree(self, node, layer):
if len(node) == 0:
return '\n'
rtns = []
items = sorted(node.items(), key=lambda x:x[0])
rtns.append(items[0][0])
rtns.append(self.printTree(items[0][1], layer+1))
for item in items[1:]:
rtns.append('.' * layer)
rtns.append(item[0])
rtns.append(self.printTree(item[1], layer+1))
return ''.join(rtns)
def __str__(self):
return self.printTree(self.root, 0)
[1]Trie树的Python实现
[2]Wiki:Trie