doccano:面向机器学习从业者的开源标注工具

Slow1年前 ⋅ 4032 阅读

https://github.com/doccano/doccano

https://doccano.github.io/doccano/     官网文档

doccano 是一个供人类使用的开源文本注释工具。它为文本分类、序列标记和序列任务提供注释功能。因此,您可以创建用于情感分析、命名实体识别、文本摘要等的标记数据。只需创建一个项目、上传数据并开始注释。您可以在数小时内构建数据集。

transformers 支持零样本文本分类任务了

https://github.com/huggingface/transformers/blob/main/examples/research_projects/zero-shot-distillation/README.md

@sleep0902  标注后的数据进行文本分类训练效果更好,且复杂的需要人工标注而无法做到零样本建模

全部评论: 0

    

    1. 友善是交流的起点。
    2. 请尽量使用Chrome浏览器(手机端遇到不兼容其他浏览器的情况请使用简单编辑器)。
    3. 同一条评论中多@其他人更容易得到Time。
    4. 支持直接粘贴图片(gif等动图不支持复制粘贴到文本框,需手动保存后上传才可显示)。

    相关推荐