京东数科推出自研联邦学习平台Fedlearn,助力数据安全保护并大幅提升学习效率

发布者/ 京东数科 时间:2020-10-14 浏览 1138次 技术
荟捧场导读:

伴随产业数字化发展及城市数字化建设,跨机构跨行业的合作越来越频繁、政府和企业面临的场景越来越复杂、数据挖掘的广度和深度也日益增长,因此机构间数据共享和数据融合的需求也越来越强烈。同时,互联网数据分散在不同企业或终端而形成“数据孤岛”现象也亟需破解,基于此背景,联邦学习应运而生。联邦学习定义了机器学习框架,在此框架下,通过设计虚拟模型解决不同数据拥有方在不交换数据的情况下进行协作的问题,可以做到在不泄露隐私数据的情况下实现企业间的数据融合建模。


伴随产业数字化发展及城市数字化建设,跨机构跨行业的合作越来越频繁、政府和企业面临的场景越来越复杂、数据挖掘的广度和深度也日益增长,因此机构间数据共享和数据融合的需求也越来越强烈。同时,互联网数据分散在不同企业或终端而形成“数据孤岛”现象也亟需破解,基于此背景,联邦学习应运而生。联邦学习定义了机器学习框架,在此框架下,通过设计虚拟模型解决不同数据拥有方在不交换数据的情况下进行协作的问题,可以做到在不泄露隐私数据的情况下实现企业间的数据融合建模。


近日,京东数字科技集团(简称:京东数科)正式推出自主研发的联邦学习平台——Fedlearn,旨在更好地挖掘数据价值,实现多方共赢的机器学习,在满足数据隐私安全和监管要求的前提下,让人工智能系统更加高效准确地共同使用各自数据的机器学习框架。


“最强大脑”打造的Fedlearn平台


联邦学习在产业应用方面此前曾面临一系列挑战——由于需要传递梯度信息,容易导致基于梯度信息的构造攻击;需要对梯度加密,虽然增加了安全性,但是也极大损失了算法的效率;传统联邦学习基于同步更新,浪费了大量的计算资源。如何设计既能保证安全性又具有高效率的联邦学习算法以满足产业AI应用需求,是业界面临的突出难题。


为解决这一问题,京东数科正式推出了自研的Fedlearn平台,该平台具有三大特点。第一,在数据和模型隐私方面,不同参与方之间没有直接交换本地数据和模型参数,而是交换更新参数所需的中间数值。同时,为了避免从这些中间数值中恢复数据信息,采用增加扰动对这些数值进行保护,确保了数据和模型的隐私安全。其次,在通讯方面,引入中心化数据交换的概念,使得数据的交换独立于参与方。最后,采用异步计算框架,极大地提高了模型训练的速度。


融合了密码学、机器学习、区块链等联邦学习算法的Fedlearn平台,搭建出一套安全、智能、高效的链接平台,在各机构数据不用向外传输的前提下,通过联合多方机构数据,实现共同构建模型等多方数据联合使用场景,获得加成效应。相较于传统的数据共享交换方法,Fedlearn平台创新性地提出了并行加密算法、异步计算框架、创新联邦学习等技术架构,在保证数据安全的前提下提升学习效率,并逐步达到融合亿级规模数据的能力。


在京东数科开发Fedlearn平台的过程中,也实现了多项业界首创技术,譬如近期实现的“基于核的非线性联邦学习算法”。在安全性上,这一方法不传输原始样本及梯度信息,充分保护数据隐私;在快速性方面,这一方法使用首创的双随机梯度下降,大大提高计算速度,充分利用计算资源,通过增加扰动提高数据的安全保护。这一技术创新已经形成了论文《解决多方垂直联邦学习的安全核学习算法》(Federated Doubly Stochastic Kernel Learning for Vertically Partitioned Data),并被顶级学术会议KDD 2020接受。


Fedlearn平台以多自研联邦学习算法、多方同态加密、轻量级分布式架构、区块链与联邦学习融合、数据安全容器、一站式操作平台“六位一体”核心能力,长效保持自身行业竞争力,其背后的项目团队成员更是90%以上都拥有算法、密码学或机器学习方向的博士、硕士学历,用京东数科AI实验室首席科学家薄列峰的话说,就是“我们在用‘最强大脑’驾驭和梳理联邦学习”。

 

联邦学习领域的“增长官”


    “联邦学习并不会损害模型效果,反而能够提高业务模型效果”,京东数科风险管理中心智能模型部负责人彭南博表示,“在京东数科风控‘联邦模盒’产品业务实践中,着实取得较于传统联合建模更优的效果”。究其原因,一方面,联邦学习理论上是能够获得最优解的,即通过梯度下降迭代过程,可以实现联邦间的特征组合和交叉建模,从而解决如“异或”这样的非线性问题;另一方面,由于能够保护数据隐私安全,因此无需限制建模样本的数量,使联邦学习可以使用更多数据建模,基于大数据更有效发现数据规律,进而提升模型效果。


另外在风控建模合作中,业务方通常还会要求模型具备较高的可解释性,也就是说,模型自己能够解释预测的结果、为什么会做出这样的预测。例如,在信贷风控中,根据多头借贷风险常识,借贷申请数量越多风险越大,若在模型中表现相反,有极大可能性是数据问题导致模型发生错误,此时部署上线将造成金融业务的坏账损失。然而联邦学习的主张是保护用户隐私,使得传统联邦模型很难进行细节解释,当前风控最常用的联邦XGB算法,因其分裂方向暗含了特征取值区间,需要隐藏特征含义才能保护数据,所以联邦模型的不可解释性成为联邦学习面向风控应用的又一大难题,目前市场上的联邦学习产品训练出的模型往往不可解释。


在风险管理创新性应用领域上,京东数科提出行业内首个实现联邦树模型可解释性方法,并融入到“联邦模盒”产品中,该产品已包含了多种原创的路径加密算法,实现即使公开特征含义也不会泄露用户隐私,该算法在准确性、复杂度方面与原方案保持一致,同时具有更好的可解释性。


      目前京东数科金条、白条业务模型已经全面实现了传统建模向联邦建模的升级,联邦模式下模型的风险识别能力和流量转化率均得到了提升。除了在风控方面的应用,AI+智能城市领域,京东数科自研的联邦学习平台——Fedlearn平台也有广泛应用。如“智能城市操作系统”作为政府数字化服务的“底座”,其包含时空数据引擎、时空智能引擎、基于联邦学习的数字网关技术以及京东城市莫奈可视化平台等诸多前沿科技。像时空数据引擎归类城市中的万千数据,解决数据标准化的问题,处理速度比传统数据平台快10—100倍;时空智能引擎将算法进行模块化、积木式输出,解决不同场景下智能应用的开发问题,极大降低开发成本;再如基于联邦学习的数字网关技术,通过用户隐私保护的联合建模机制和多源数据融合算法,有效助力解决平台隐私保护问题。


除此之外,京东数科依托在金融服务、数字营销等领域积累的丰富实践经验,形成了多场景的解决方案,通过联邦学习可以实现多场景的解决方案升级,结合各个客户的自身情况,提供定制化程度更高的服务。目前,已实现多个不同类型的合作项目落地。


从底层代码到算法再到平台搭建,京东数科始终坚持自主研究创新,一路稳扎稳打。“我们希望依托数科强大的AI技术背景,通过Fedlearn平台的科技能力输出助力用户和产业实现‘联结’,为各种规模企业实现赋能和增长,这也是我们作为联邦学习应用落地领军者的使命”,薄列峰表示。


声明:荟捧场尊重行业规范,转载的文章都会标注作者或来源,所转载文章并不代表荟捧场赞同其观点和对其真实性负责;如作品内容、版权有问题的请与本网联系,我们将在24小时内移除相关争议内容。荟捧场的原创文章,请转载时注明文章"来源:荟捧场";
网友评论 文明上网理性发言,请遵守新闻评论服务协议

内容为空!

  • 全部评论
    加载更多>>

    热点文章 更多>

    汉朔与科沃斯商用达成战略合作 联合发布SPatrol零售机器人

    商米亮相外滩大会 看商用IoT如何普惠大众

    第十四届中国零售商大会|第3届厦门国际智慧零售产业博览会9月16日在厦门隆重开幕

    2020中国零售数字化最佳实践案例名单公布

    数字化路上少走弯路,送给中国便利店企业的几点建议

    看 SUNMI V2 PRO 如何在各类商业场景中大显身手

    2020年中国便利店TOP100榜单发布

    2020零售业自有品牌与可持续海产品发展报告

    14.95亿元被网信挪用 先锋支付牌照存被吊销风险

    条码识别格局再变, 海归品牌挤谁出局?

    战“疫”新思考——门店运营为核心,数据决策为驱动!找到适合门店自己的玩法。

    新一代烘焙管店黑科技 | 思迅“烘焙e家”重磅发布!

    有赞发布会晒5个千万级订单数据 如何做品牌数字化“新基建”

    天财商龙助力重庆现代餐饮产业园打造供应链产业集群

    美团配送升级开放策略:共建未来城市新基础设施,让配送服务更普惠

    为什么你的储值营销没效果?这样做储值,营收瞬间翻倍!

    600位企业CEO直播“带货”,直播是线上地摊经济吗?

    百度直播“聚能计划”首批大V名单曝光 钟南山、李兰娟在列

    2020年一季度餐饮市场同比大幅下跌44.3%

    社区生鲜电商同程生活完成2亿美元C轮融资,未披露具体估值。

    刷脸支付终端断崖式下跌,颗粒无收的遍地炮灰?

    2019年中国连锁百强榜单发布

    中国烹协最新发布《2019年度中国餐饮企业百强和餐饮五百强门店分析报告》

    研华推出全新AIR系列边缘AI推理产品 聚焦人工智能与视觉分析

    还没真正理解用户标签体系?看这篇就够了!

    “新基建”看好自助终端,来看自助收银和自助货柜有哪些好处

    汉印手机打印,让智慧零售留住客人的心

    电子证据在手,不要怂,干就完了!

    不容小觑!京东数科产业数字化再升级

    阿里美团酣战同城零售 催生本地电商新赛道

    青云QingCloud全新升级超融合战略 加速企业数字化转型与升级

    后疫情时代,农牧产业数字化转型升级新机遇

    客如云与建行浙江分行达成战略合作,书写本地生活数字化升级新篇章

    “浙交汇”上线啦,实现“最多跑一次”!

    新大陆软件公司通过CMMI5级复评

    用友与智齿科技达成战略合作 全面服务企业数智化转型

    海信智能商用“新零售”抗疫组合拳:中台+到家+自助=不聚集、少流动、享便利!

    一个高品质的产品和服务是如何诞生的?

    超赢科技签约具有65年历史的中国奶业20强A股上市企业---燕塘乳业

    阿里让天下没有难做的生意,商米让天下没有难开的店!

    2020年CHINASHOP金翼榜,权威综合的零售供应商榜单正式开启申报

    关店305家!前五月餐饮业太难了 后面会好吗?

    80%餐饮商户,不敢得罪美团

    一份外卖账单的秘密:餐饮业正集体上演“去平台化”

    苏宁618云发布:云店,是零售终极形态

    盒马是如何打造一站式新零售体验的?

    商米推出两款自助新品 助力疫情下无接触式新零售发展

    桑达服务,使命必达!

    【为梦想 不止步】2020桑达商用年会盛典圆满结束!

    沃尔玛引进自动清洁系统 减少人力成本

    荟眼 | 灯影科技CEO:灯影准备好迎接电子标签市场井喷

    永和大王如何在新餐饮浪潮下续写中式餐饮传奇

    美团正在打通业务数据,这可能会带来3个变化

    荟眼 | 海信智能商用:整合技术实力与服务实力,赋能合作伙伴

    自助收银>人工收银模式备受欢迎 海信自助收银助阵伊藤洋华堂数字化布局

    荟眼 | 辰达物联刘亮:AI视觉让购物更轻松、更高效!

    荟眼 | 赋能新零售,看远望谷&每人店如何重新定义消费场景?

    热门活动 更多>

    热门视频 更多>

    关注荟捧场

    "荟捧场特别报道"订阅号
    2017 荟捧场,全新起航!