Hash分批采样

2021-09-18 java hash, 采样 0 评论

由于实现比较简单, 这里直接上代码

package cn.idea360.mpdemo;

import java.util.ArrayList;
import java.util.List;
import java.util.Set;
import java.util.UUID;
import java.util.concurrent.atomic.AtomicInteger;
import java.util.stream.Collectors;

/**
 * 批量采样测试
 *
 * @author cuishiying
 * @date 2022-09-16
 */
public class SampleTest {

    private final AtomicInteger index = new AtomicInteger(0);

    private static final int MAX_BATCH = 10;

    private int getAndIncrementIndex() {
        if (index.get() == MAX_BATCH) {
            index.compareAndSet(MAX_BATCH, 0);
        }
        return index.getAndIncrement();
    }

    private int hash(String data) {
        return data.hashCode() & Integer.MAX_VALUE;
    }

    public static void main(String[] args) {
        int sampleCount = 10000;
        List<String> userIds = new ArrayList<>();
        for (int i = 0; i < sampleCount; i++) {
            userIds.add(UUID.randomUUID().toString().replace("-", ""));
        }

        int sum = 0;
        SampleTest sampleTest = new SampleTest();
        for (int i = 0; i < MAX_BATCH; i++) {
            int currentIndex = sampleTest.getAndIncrementIndex();
            Set<String> collect = userIds.stream().filter(userId -> sampleTest.hash(userId) % MAX_BATCH == currentIndex).collect(Collectors.toSet());
            sum += collect.size();
        }
        System.out.printf("样本数: [%d], 采样批次: [%d], 总采样数: [%d]%n", sampleCount, MAX_BATCH, sum);
    }
}

本文链接： https://idea360.cn/2021/09/18/hash-sample/

版权声明： 本博客所有文章除特别声明外，均采用 CC BY 4.0 CN协议许可协议。转载请注明出处！

当我遇上你

Hash分批采样

当我遇上你