锋盈数科-知识库 Logo
首页
软件开发
计算机基础
Hello Halo
新手必读
关于本知识库
登录 →
锋盈数科-知识库 Logo
首页 软件开发 计算机基础 Hello Halo 新手必读 关于本知识库
登录
  1. 首页
  2. 软件开发
  3. 数据结构与算法 —— Transformers之Pipeline

数据结构与算法 —— Transformers之Pipeline

0
  • 软件开发
  • 发布于 2024-09-27
  • 14 次阅读
黄健
黄健

Transformers之Pipeline是Hugging Face Transformers库中提供的一种使用预训练模型进行推理的极简方式。这些Pipeline对象从库中抽象出大部分复杂代码,为多项任务(如命名实体识别、情感分析、特征提取和问答等)提供了简单的API。以下是对Transformers之Pipeline的详细介绍:

一、Pipeline概述

Pipeline是Transformers库中的一个基础功能,它封装了预训练模型和对应的前处理与后处理环节。用户只需输入数据,Pipeline就能自动完成预处理、模型推理和后处理,最终返回易于理解的结果。这种方式极大地简化了模型的使用流程,使得非专业用户也能轻松上手。

二、Pipeline支持的任务类型

Transformers库将目前的NLP任务归纳为以下几大类,并提供了相应的Pipeline支持:

  • 文本分类:如情感分析、句子对关系判断等。
  • 词语分类:如词性标注(POS)、命名实体识别(NER)等。
  • 文本生成:如填充预设的模板(prompt)、预测文本中被遮掩(masked)的词语、文本翻译、自动摘要等。
  • 问答系统:如根据给定的问题从一段文本中抽取出对应的答案。
  • 其他任务:还包括特征提取、零训练样本分类、图像分类、自动语音识别等。

目前常用的Pipeline包括但不限于:

  • feature-extraction:获得文本的向量化表示。
  • fill-mask:填充被遮盖的词或片段。
  • ner(命名实体识别)。
  • question-answering:自动问答。
  • sentiment-analysis:情感分析。
  • summarization:自动摘要。
  • text-generation:文本生成。
  • translation:机器翻译。
  • zero-shot-classification:零训练样本分类。

三、Pipeline的创建与使用

创建和使用Pipeline非常简单,主要有两种方法:

  1. 根据任务类型直接创建Pipeline:

    from transformers import pipeline
    classifier = pipeline("sentiment-analysis")
    result = classifier("I've been waiting for a HuggingFace course my whole life.")
    print(result)
    
  2. 指定任务类型和模型创建Pipeline:

    from transformers import pipeline
    classifier = pipeline("text-classification", model="uer/roberta-base-finetuned-dianping-chinese")
    result = classifier("我觉得不太行!")
    print(result)
    

四、Pipeline的高级功能

Pipeline还支持一些高级功能,如批处理、GPU推理、自定义后处理等。例如,可以通过设置device参数将Pipeline绑定到GPU上进行推理,以提高处理速度。

五、Pipeline的实现原理

Pipeline的实现原理大致可以分为三个步骤:

  1. 数据预处理:将输入数据转换为模型可以理解的格式,如文本分词、编码等。
  2. 模型推理:将预处理后的数据送入预训练模型进行推理。
  3. 后处理:对模型的输出进行后处理,如解码、格式化等,最终返回易于理解的结果。

六、总结

Transformers之Pipeline是Hugging Face Transformers库中提供的一种非常实用的功能,它极大地简化了预训练模型的使用流程,使得用户能够轻松地进行各种NLP任务的推理。无论是专业研究人员还是非专业用户,都可以通过Pipeline快速上手并应用这些强大的预训练模型。

原文链接: https://blog.csdn.net/hai40587/article/details/140401492

标签: #算法 139
相关文章

万字:支付“核心系统”详解 2024-11-02 15:33

专栏作者:隐墨星辰 \| 主编:陈天宇宙 这篇文章也尝试化繁为简,探寻支付系统的本质,讲清楚在线支付系统最核心的一些概念和设计理念。 虽然支付行业已经过了风头最劲的时光,但跨境支付仍然在蓬勃发展,每年依然有很多新人进入这个行业,这篇文章尝试为这些刚入行的新人提供一点帮助。 文章只介绍一些支付行业十几

资深支付架构师视角:实战从问题定义到代码落地的完整套路 2024-11-02 15:33

前言 今天从一个实际案例入手,介绍站在架构师的角度,如何识别并定义问题,提炼需求,技术方案选型,再到详细设计,最后利用AI的能力协助写出核心的代码,验证与调优。 解决问题存在一定的模式,也可以称之为框架,总结出自己的思考和解题框架,以后再碰到同类型的问题就可以如庖丁解牛一样容易。 很多年前,我写代码

Spring 实现 3 种异步接口 2024-10-18 09:07

大家好,我是苏三~ 如何处理比较耗时的接口? 这题我熟,直接上异步接口,使用 Callable、WebAsyncTask 和 DeferredResult、CompletableFuture等均可实现。 但这些方法有局限性,处理结果仅返回单个值。在某些场景下,如果需要接口异步处理的同时,还持续不断地

重学SpringBoot3-集成Redis(五)之布隆过滤器 2024-10-08 11:24

更多SpringBoot3内容请关注我的专栏:《SpringBoot3》 期待您的点赞👍收藏⭐评论✍ 重学SpringBoot3-集成Redis(五)之布隆过滤器 1. 什么是布隆过滤器? * 基本概念 适用场景 2. 使用 Redis 实现布隆过滤器 * 项目依赖 Redis 配置

设计模式第16讲——迭代器模式(Iterator) 2024-10-08 11:24

一、什么是迭代器模式 迭代器模式是一种行为型设计模式,它提供了一种统一的方式来访问集合对象中的元素,而不是暴露集合内部的表示方式。简单地说,就是将遍历集合的责任封装到一个单独的对象中,我们可以按照特定的方式访问集合中的元素。 二、角色组成 抽象迭代器(Iterator):定义了遍历聚合对象所需的方法

vue2路由和vue3路由区别及原理 2024-10-08 11:24

一、Vue2 与 Vue3 路由的区别 1. 创建路由实例方式的不同 Vue 2 中,通过 Vue.use() 注册路由插件,并通过 new VueRouter() 来创建路由实例。 import Vue from 'vue';import VueRouter from 'vue-router';i

目录

IT 外包服务商

  • 意见投递
  • zyf6619

软件开发应用

主菜单

  • 首页
  • 软件开发
  • 计算机基础
  • Hello Halo
  • 新手必读
  • 关于本知识库
Copyright © 2024 your company All Rights Reserved. Powered by Halo.