Examples of org.apache.hadoop.util.bloom.BloomFilter

org.apache.hadoop.util.bloom.BloomFilter
ne-lab.org">European Commission One-Lab Project 034819. @see Filter The general behavior of a filter @see Space/Time Trade-Offs in Hash Coding with Allowable Errors

    }
    
    @Override
    public void initialize() {
      super.initialize();
      bloomFilter = new BloomFilter(vectorSize, nbHash, Hash.MURMUR_HASH);
      ptype.initialize(getConfiguration());
      keyToBytesFn = getKeyToBytesMapFn(ptype, getConfiguration());
    }

View Full Code Here

        iterable = bloomData.read(getContext());
      } catch (IOException e) {
        throw new CrunchRuntimeException("Error reading right-side of map side join: ", e);
      }


      bloomFilter = new BloomFilter(vectorSize, nbHash, Hash.MURMUR_HASH);
      for (BloomFilter subFilter : iterable) {
        bloomFilter.or(subFilter);
      }
    }

View Full Code Here

        }
        return list;
    }


    private void init() throws IOException {
        filter = new BloomFilter();
        String dcFile = "./" + getFilenameFromPath(bloomFile) +
            "/part-r-00000";
        filter.readFields(new DataInputStream(new FileInputStream(dcFile)));
    }

View Full Code Here

     * For testing only, do not use directly.
     */
    public void setFilter(DataByteArray dba) throws IOException {
        DataInputStream dis = new DataInputStream(new
            ByteArrayInputStream(dba.get()));
        filter = new BloomFilter();
        filter.readFields(dis);
    }

View Full Code Here

            byte[] b;
            if (t.size() == 1) b = DataType.toBytes(t.get(0));
            else b = DataType.toBytes(t, DataType.TUPLE);


            Key k = new Key(b);
            filter = new BloomFilter(vSize, numHash, hType);
            filter.add(k);


            return TupleFactory.getInstance().newTuple(bloomOut());
        }

View Full Code Here

        hType = convertHashType(hashType);
    }




    protected DataByteArray bloomOr(Tuple input) throws IOException {
        filter = new BloomFilter(vSize, numHash, hType);


        try {
            DataBag values = (DataBag)input.get(0);
            for (Iterator<Tuple> it = values.iterator(); it.hasNext();) {
                Tuple t = it.next();

View Full Code Here

    }


    protected BloomFilter bloomIn(DataByteArray b) throws IOException {
        DataInputStream dis = new DataInputStream(new
            ByteArrayInputStream(b.get()));
        BloomFilter f = new BloomFilter();
        f.readFields(dis);
        return f;
    }

View Full Code Here

    }
    assertEquals("Analyzer produced too few terms", expected.length, pos);
  }


  private static Filter getFilter(String[] tokens) throws IOException {
    Filter filter = new BloomFilter(100,50, Hash.JENKINS_HASH);
    Key k = new Key();
    for (String s: tokens) {
      setKey(k,s);
      filter.add(k);
    }
    return filter;
  }

View Full Code Here

    }
    
    @Override
    public void initialize() {
      super.initialize();
      bloomFilter = new BloomFilter(vectorSize, nbHash, Hash.MURMUR_HASH);
      ptype.initialize(getConfiguration());
      keyToBytesFn = getKeyToBytesMapFn(ptype, getConfiguration());
    }

View Full Code Here

        iterable = bloomData.read(getContext());
      } catch (IOException e) {
        throw new CrunchRuntimeException("Error reading right-side of map side join: ", e);
      }


      bloomFilter = new BloomFilter(vectorSize, nbHash, Hash.MURMUR_HASH);
      for (BloomFilter subFilter : iterable) {
        bloomFilter.or(subFilter);
      }
    }

View Full Code Here

0 1 2 3

TOP

Related Classes of org.apache.hadoop.util.bloom.BloomFilter

brickhouse.udf.bloom.BloomFactory

cc.bf.NgramsToBloomFilter$BFBase

cc.bf.ReadNgram

com.cloudera.util.bloom.BloomSet

com.manning.hip.ch7.bloom.BloomFilterDumper

com.ontology2.bakemono.bloom.BloomReducer

com.ontology2.bakemono.bloom.BloomReducerTest

mrdp.appendixA.BloomFilterDriver

org.apache.crunch.contrib.bloomfilter.BloomFilterFn

org.apache.crunch.contrib.bloomfilter.BloomFiltersIT

All source code are property of their respective owners. Java is a trademark of Sun Microsystems, Inc and owned by ORACLE Inc. Contact coftware#gmail.com.