- 解析参数
- 用解析的参数构建 local_privacy 的 mechanism
- 用解析的参数构建 central_privacy 的 mechanism
- 制作数据集(整个数据集在用户上的分布),分为两种:
- Artificial user Dataset(例如 cifar 10, cifar10-iid):
- 根据配置取用一个 sampler 函数,这个函数每调用一次会生成用户的样本数(constant 或者 poisson 分布)
- (optimal)可以使用 dirichlet 分布来划分 non-iid 数据集(alpha 通常设置为 0.1 表示大多数的样本是只来自于一个数据集)
- (optimal)如果生成 iid 的数据集,则每次都调用一次 sampler 函数,直到把所有的数据都消费完
- Real users Dataset(例如 femnist)
- Artificial user Dataset(例如 cifar 10, cifar10-iid):
- 通过 FederatedDataset 来构建 train 和 val 的联邦数据集,以及 val 的中心化数据集