天津移动打造基于“联邦学习+区块链”的多方安全计算引擎系统-“珍珑”
珍珑利用联邦学习技术搭建中国移动和银行之间的联邦和信用评分模型,双方在不共享数据的基础上实现了联合建模,从技术上打破数据孤岛,实现更准确高效的信用评估,同时,区块链也确保了去中心化架构,多家运营商和银行可以打造信用评分共享机制,结果可追溯且不可篡改,形成模型共享训练生态。 4 珍珑与区块链的联系 产品和区块链技术结合紧密,真正用区块链解决了AI建模的难题,实现“联邦学习+区块链”的新模式、新应用。 在多方共同参与模型训练后,如何对多方数据进行统一管理,就成为一个重要课题,珍珑通过引入区块链智能合约技术解决这个难题。 (1)多方贡献度判定 多参与方在进行数据上链时,均会在区块链平台生成一个永久不可逆的数据区块,以此计算当前参与方本次上链对整体模型的贡献度,在模型收敛后,可以对全部参与方对最终模型的贡献度进行量化判断,为联邦参与方的合作提供谈判依据。 (2)异常参与方识别 在平台运营过程中,通过智能合约及共识算法对各参与方的训练及推理请求进行统一规则的判定,如发现非法上链请求,将会拒绝在区块链中生成区块,从而规避风险,控制流量,保障优质合作方的请求。 5 产品成效及下一步发展 当前,“珍珑”整体架构已经在CMBAAS区块链平台大赛中进行了demo的开发、部署、验证工作,将B域大数据用户标签与O域家宽数据模拟两方进行联合共享训练,实现用户资费满意度的预测模型。已实现的满意度预测联合训练部署架构如下: 下一步将在三个方面持续提升: (1)整体平台部署及网络联调 在整体平台架构中涉及内网应用主动访问互联网应用的需求,一方面,CMBaas区块平台及服务需要部署公网,以吸引更多域外企业加入生态,另一方面,联邦学习需要获取企业内网用户数据实现多方数据联合训练,因此,需要打通内外网网络,通过防火墙管控内外网联通端口。 (2)构建统一管理平台 构建一套参与方管理平台,通过页面可视化方式,一方面实现参与方的自助注册、数据上传、模型申请、推理服务等业务能力,另一方面为平台提供参与方入驻审核、状态管理、贡献度查询、异常参与方判断等管理能力。 (3)扩展联邦学习模型算法类型 目前已完成基于决策树模型的资费满意度预测模型构建,后续可以预置其他高级智能模型,如CNN/RNN,预训练模型等,实现各参与方入驻后直接选择相关模型进行业务场景构建。 后续,“珍珑”将积极推进平台推广及生态运营,吸引运营商领域以外的企业入驻,通过多方数据的可控共享,实现多方的业务共赢。 团队介绍: 赵东明,项目负责人,博士,浙江大学博士后,中国移动AI中台专家/“高层次”专家/IT高级专家,天津移动AI实验室负责人,累计获得116项科技奖励及荣誉,16项发明专利,20余篇高水平论文,负责产品的人工智能、区块链技术研发、算法研究和产业赋能工作。 田雷,技术负责人,北大数学系硕士,天津中心大数据架构专家,积累了大量数据仓库和大数据平台的系统架构、数据模型、需求开发的先进经验,负责产品的联邦学习算法及大数据支撑工作。 刘静,系统架构师,华中师范大学硕士,中国移动集团大数据专家,长期钻研客户需求深度挖掘,基于AI算法促进存量客户价值循环升档研究,负责产品的区块链算法及工程实现。 石理,算法工程师,南开大学硕士,集团AI中台专家,在人工智能、计算机视觉、机器学习方面具有较丰富的研发经验,负责视觉产品的联邦学习算法研发。 吴娜,交互设计师,北京邮电大学硕士,UI专家,负责产品交互界面的设计、开发,以及AI模型的标准、运营和优化。 特别鸣谢:亚信科技PRD研发中心技术专家杨爱东、孔令鲁、林大兴、刘志勇、韦强申,以及CMC客服产品部的徐晨兴、王新,给予充分的技术支持和帮助。 本文章素材来自互联网 (编辑:应用网_阳江站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |