联系电话 400-123-4657
  • 栏目幻灯二
  • 栏目幻灯一
  • 最新公告:
    诚信为本,澳门·威尼斯人(中国)官方网站市场在变,诚信永远不变...
    新闻动态 NEWS 当前位置: 澳门威尼斯人首页 > 新闻动态
    澳门威尼斯人官网什么情况下需要布隆过滤器添加时间:2024-03-23

      澳门威尼斯人官网什么情况下需要布隆过滤器虽然上面描述的这几种数据结构配合常见的排序、二分搜索可以快速高效的处理绝大部分判断元素是否存在集合中的需求。但是当集合里面的元素数量足够大,如果有500万条记录甚至1亿条记录呢?这个时候常规的数据结构的问题就凸显出来了。数组、链表、树等数据结构会存储元素的内容,一旦数据量过大,消耗的内存也会呈现线性增长,最终达到瓶颈。有的同学可能会问,哈希表不是效率很高吗?查询效率可以达到O(1)。但是哈希表需要消耗的内存依然很高。使用哈希表存储一亿 个垃圾 em指纹;考虑到哈希表存储效率通常小于50%(哈希冲突);因此消耗的内存:8 * 2 * 1亿 字节 = 1.6G 内存,普通计算机是无法提供如此大的内存。这个时候,布隆过滤器(Bloom Fil

      哈希函数的概念是:将任意大小的数据转换成特定大小的数据的函数,转换后的数据称为哈希值或哈希编码。下面是一幅示意图:

    澳门威尼斯人官网什么情况下需要布隆过滤器(图1)

      什么是布隆过滤器?本质上布隆过滤器( BloomFilter )是一种数据结构,比较巧妙的概率型数据结构(probabilisticdata structure),特点是高效地插入和查询,可以用来告诉你 “某样东西一定不存在或者可能存在”。

      相比于传统的 Set、Map 等数据结构,它更高效、占用空间更少,但是缺点是其返回的结果是概率性的,而不是确切的。

      布隆过滤器内部维护一个bitArray(位数组), 开始所有数据全部置 0 。当一个元素过来时,能过多个哈希函数(hash1,hash2,hash3…)计算不同的在哈希值,并通过哈希值找到对应的bitArray下标处,将里面的值 0 置为 1 。需要说明的是,布隆过滤器有一个误判率的概念,误判率越低,则数组越长,所占空间越大。误判率越高则数组越小,所占的空间越小。

    澳门威尼斯人官网什么情况下需要布隆过滤器(图2)

      以上图为例,具体的操作流程:假设集合里面有3个元素{x, y, z},哈希函数的个数为3。首先将位数组进行初始化,将里面每个位都设置位0。对于集合里面的每一个元素澳门威尼斯人官方官网,将元素依次通过3个哈希函数进行映射,每次映射都会产生一个哈希值,这个值对应位数组上面的一个点,然后将位数组对应的位置标记为1。查询W元素是否存在集合中的时候,同样的方法将W通过哈希映射到位数组上的3个点。如果3个点的其中有一个点不为1,则可以判断该元素一定不存在集合中澳门威尼斯人官方官网。反之,如果3个点都为1,则该元素可能存在集合中。注意:此处不能判断该元素是否一定存在集合中,可能存在一定的误判率。可以从图中可以看到:假设某个元素通过映射对应下标为4,5,6这3个点。虽然这3个点都为1,但是很明显这3个点是不同元素经过哈希得到的位置,因此这种情况说明元素虽然不在集合中,也可能对应的都是1,这是误判率存在的原因。## 为什么不直接使用hashtable

      Hash table的存储效率一般只有50%,为了避免碰撞的问题,一般哈希存储到一半的时候都采取内存翻倍或者其他措施澳门威尼斯人官方官网,所以很耗费内存。

      Hash面临的问题就是冲突。假设 Hash 函数是良好的,如果我们的位阵列长度为 m个点,那么如果我们想将冲突率降低到例如 1%, 这个散列表就只能容纳 m/100 个元素。解决方法较简单, 使用k>

      1的布隆过滤器,即k个函数将每个元素改为对应于k个bits,因为误判度会降低很多,并且如果参数k和m选取得好,一半的m可被置为1。

      为每个URL分配两个字节就可以达到千分之几的冲突。比较保守的实现是,为每个URL分配4个字节,项目和位数比是1∶32,误判率是0.340。对于5000万数量级的URL,布隆过滤器只占用200MB的空间。

      根据传入的元素个数n和误差率p, 计算布隆滤波器的内存大小m bits和hash function个数k:

      }-->

      声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。举报投诉函数函数+关注

      FTK上的3轴加速度计的数据。我知道我必须使用一个MUX和Delsig ADC。在所有的3轴中,如何在这

      次阅读 --

      次阅读 --

      次阅读 --

      次阅读 --

      次阅读 --

      次阅读 --

      次阅读 --

      是保送介质管道上不可短少的一种安装,通常装置在减压阀、泄压阀、定水位阀或设备的进口端,用来消弭介质中的杂质,以维护阀门及设备的正常运用。 丝扣Y形

      次阅读 --

      是除去液体中少量固体颗粒的小型设备,可维护设备的正常工作,当流体进入置有   规格滤网的滤筒后,其杂质被阻挠,而清洁的滤液则由

      次阅读 --

      通常装置在减压阀、泄压阀、定水位阀或设备的进口端,用来   介质中的杂质,以维护阀门及设备的正常运用。Y型

      次阅读 --

      次阅读 --

      次阅读 --

      滤除率测试仪 /

      次阅读 --

      滤芯 /

      次阅读 --

      次阅读 --

      --

      AMD Versal AI Edge自适应计算加速平台之PL通过NoC读写DDR4实验(4)