如何为机器学习工程设计Python接口

发布时间：2020-08-21 17:35:50 所属栏目：模式来源：Python学会

导读：前言为了进行机器学习工程，首先要部署一个模型，在大多数情况下作为一个预测API。为了使此API在生产中工作，必须首先构建模型服务基础设施。这包括负载平衡、扩展、监视、更新等等。乍一看，所有这些工作似乎都很熟悉。Web开发人员和DevOps工程师多年来

前言

为了进行机器学习工程，首先要部署一个模型，在大多数情况下作为一个预测API。为了使此API在生产中工作，必须首先构建模型服务基础设施。这包括负载平衡、扩展、监视、更新等等。

乍一看，所有这些工作似乎都很熟悉。Web开发人员和DevOps工程师多年来一直在自动化微服务基础设施。当然，我们可以重新定位他们的工具?

不幸的是，我们不能。

虽然ML的基础结构与传统的DevOps类似，但它与ML的特殊性足以使标准的DevOps工具不那么理想。这就是为什么我们开发了Cortex——机器学习工程的开源平台。

在一个非常高的层次上，Cortex被设计用来简化在本地或云上部署模型，从而自动化所有底层基础设施。该平台的一个核心组件是预测器接口——一个可编程Python接口，开发人员可以通过该接口编写预测api。

设计一个专门为web请求提供预测的Python接口是一个挑战，我们花了几个月的时间(目前仍在改进)。在这里，我想分享一些我们已经开发的设计原则:

1.预测器只是一个Python类

Cortex的核心是我们的预测器，它本质上是一个预测API，包括所有的请求处理代码和依赖关系。预测器接口为这些预测api实施了一些简单的需求。

因为Cortex采用微服务的方式来进行模型服务，预测器界面严格关注两件事:

初始化模型提供预测

在这种精神下，Cortex的预测界面需要两种功能，即剩余的init__()和predict()，它们或多或少做你所期望的事情:

import torch from transformers import pipeline class PythonPredictor: def __init__(self, config): # Use GPUs, if available device = 0 if torch.cuda.is_available() else -1 # Initialize model self.summarizer = pipeline(task="summarization", device=device) def predict(self, payload): # Generate prediction summary = self.summarizer( payload["text"], num_beams=4, length_penalty=2.0, max_length=142, no_repeat_ngram_size=3 ) # Return prediction return summary[0]["summary_text"]

初始化之后，您可以将一个预测器看作一个Python对象，当用户查询端点时，将调用它的单个predict()函数。

这种方法的最大好处之一是，对于任何有软件工程经验的人来说，它都是直观的。不需要接触数据管道或模型训练代码。模型只是一个文件，而预测器只是一个导入模型并运行predict()方法的对象。

然而，除了语法上的吸引力之外，这种方法还提供了一些关键的好处，即它如何补充了皮层更广泛的方法。

2. 预测只是一个HTTP请求

为生产中提供预测服务而构建接口的复杂性之一是，输入几乎肯定会与模型的训练数据不同，至少在格式上是这样。

这在两个层面上起作用:

POST请求的主体不是一个NumPy数组，也不是您的模型用来处理的任何数据结构。机器学习工程就是使用模型来构建软件，这通常意味着使用模型来处理它们没有受过训练的数据，例如使用GPT-2来编写民间音乐。

因此，预测器接口不能对预测API的输入和输出固执己见。预测只是一个HTTP请求，开发人员可以随意处理它。例如，如果他们想部署一个多模型端点，并基于请求参数查询不同的模型，他们可以这样做:

import torch from transformers import pipeline from starlette.responses import JSONResponse class PythonPredictor: def __init__(self, config): self.analyzer = pipeline(task="sentiment-analysis") self.summarizer = pipeline(task="summarization") def predict(self, query_params, payload): model_name = query_params.get("model") if model_name == "sentiment": return self.analyzer(payload["text"])[0] elif model_name == "summarizer": summary = self.summarizer(payload["text"])[0] else: return JSONResponse({"error": f"unknown model: {model_name}"}, status_code=400)

虽然这个界面让开发者可以自由地使用他们的API做什么，它也提供了一些自然的范围，使皮质在基础设施方面更加固执己见。

例如，在后台Cortex使用FastAPI来设置请求路由。Cortex在这一层设置了许多与自动排序、监控和其他基础设施功能相关的过程，如果开发人员需要实现路由，这些功能可能会变得非常复杂。

但是，因为每个API都有一个predict()方法，所以每个API都有相同数量的路由—1。假设这允许Cortex在基础设施层面做更多的事情，而不限制工程师。

3.服务模型只是一个微服务

（编辑：应用网_阳江站长网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!

1/2

尾页