数学之美系列二十一—— 布隆过滤器(Bloom Filter)
2009年3月27日
2007年7月3日 上午 09:35:00
发表者:Google(谷歌)研究员 吴军
在 日常生活中,包括在设计计算机软件时,我们经常要判断一个元素是否在一个集合中。比如在字处理软件中,需要检查一个英语单词是否拼写正确(也就是要判断它 是否在已知的字典中);在 FBI,一个嫌疑人的名字是否已经在嫌疑名单上;在网络爬虫里,一个网址是否被访问过等等。最直接的方法就是将集合中全部的元素存在计算机中,遇到一个新 元素时,将它和集合中的元素直接比较即可。一般来讲,…



最新评论
这个错误应该是因为Java不支持命名组导致的,将(?.*)语 法改成(.*),然后后向引用的时候使用\1即可。 但是由于java还不支持平衡组,也就是压入弹出堆栈的操...
在Expresso工具上确实可以运行 ;我改成java正则表达式后(?s)<(?<Ht mlTag>[\\w]+)[^>]*\\s...
这得看具体场景,如果你的文件非常大,那么使用正则匹配可能效率 会明显不如自己写一个程序一行一行去统计来得高。但是至少这种方 式不用自己写代码。
支持喽!博客不错!
好办法,不过据说正则表达式性能不高