「AI开发者成长计划」首期公开课由机器之心与微众银行联合开设,主题为《联邦学习FATE入门与应用实战》,特邀合作伙伴 VMware 也将参与分享。 公开课为期4周,共6期课程 ,设置主题分享、项目实践、在线答疑等环节,从零入门联邦学习。
整体学习计划与加入方式请查看:《联邦学习FATE入门与应用实战》公开课上线!
3 月 17 日,机器之心联合微众银行开设的公开课《联邦学习 FATE 入门与应用实战》第三讲结课,微众银行人工智能部算法研究员谭明超为我们分享了《联邦学习 FATE 算法模块梳理及建模演示》。
第三课精选问答
Q:请问稀疏数据input都有哪些?
我们现在主要支持的是两种,tag和tag:value,比如说我这个人是不是有车、有房、是男是女等等,tag:value就是说比如说年龄:40,身高:1.6米等等。
Q:union是做什么?针对横向联邦吗?
不是,union是一个单边的组件,它只是把两个组件输出的数据合并起来而已,就只干这一个事情。
Q:预测的结果在哪里看?仅guest方持有吗?
对,只有guest方持有,在纵向联邦当中是这样的。对于横向联邦,每一方都有自己的模型,一般来讲在横向的模块当中是不需要加密的,但是横向lr我们是提供了对host加密的模型计算方法。这种情况下,Host方是拿不到这个模型的。
Q:预处理及特征工程可以介绍一下么?
目前FATE实现的特征工程组件包括采样、联邦特征分箱,联邦特征选择、特征归一化、onehot编码等等。具体的内容,在github上有详细的文档介绍:https://github.com/FederatedAI/FATE/tree/master/federatedml/feature
Q:如何对数据质量进行评估?
在建模的时候,FATE提供了一个local_base的组件,可以使用本地的数据建模,从而和联邦以后的建模效果进行比对。除此以外,还可以看看交集的数量,求对方特征的iv值进行比较等等方式。
Q:如果没有同态加密的,联邦和分布式有什么区别?
这个区别还是挺大的。分布式是你自己的的集群,你自己可以随便访问数据,但联邦学习即使没有用到同态加密,比如说只用了安全聚合的方式,你也是access不到别人的数据的,对于arbiter来说,只能得到最终所有模型聚合的和。