Label Studio

AI・ML

会話を通じてデータラベリングプロジェクトとアノテーションを管理できます — Neotask は OpenClaw を使用して Label Studio アノテーションインフラを操作します。

できること

ラベリングプロジェクトを作成・設定する

Neotask に特定のタスクタイプ(画像分類、NER、バウンディングボックス、感情分析、カスタム)で Label Studio プロジェクトを作成し、ラベリングインターフェースを設定するよう指示できます。ラベルスキーマを平易な言葉で提供すると、Neotask が正しい Label Studio XML 設定に変換します。

アノテーション用データをインポートする

URL リスト、S3 パス、または JSON ペイロードから Label Studio プロジェクトにタスクをインポートするよう Neotask に依頼できます。インポート API 呼び出しを処理して作成されたタスク数を返します。

アノテーションの進捗を追跡する

任意のプロジェクトのアノテーションの進捗を Neotask に問い合わせることができます:タスクの総数、アノテーション済みの数、レビュー中の数、スキップされた数。

ラベル付きデータをエクスポートする

希望するフォーマット(JSON、CSV、COCO、YOLO、Pascal VOC)でプロジェクトからアノテーションをエクスポートするよう Neotask に依頼して、データまたはダウンロードリンクを受け取ることができます。

予測と事前アノテーションを管理する

モデルの予測を事前アノテーションとして Label Studio プロジェクトにインポートして、人間によるレビューを高速化できます。Neotask に予測をアップロードして、アノテーションに変換するか提案として残すかを依頼できます。

アノテーターを割り当て・管理する

Neotask に特定のタスクへのアノテーターの割り当て、アノテーションキューの設定、またはどのアノテーターが最も多くのタスクを保留しているかの確認を依頼できます。

試してみましょう

  • 「Positive、Negative、Neutral の 3 つのラベルを持つ感情分類用の新しい Label Studio プロジェクトを作成してください」
  • 「この S3 URL からプロジェクト 42 に 500 個のテキストタスクをインポートしてください」
  • 「customer-feedback-q3 プロジェクトのアノテーション進捗はどうですか?」
  • 「COCO フォーマットでプロジェクト 15 のすべてのアノテーションをエクスポートしてください」
  • 「これらのモデル予測を事前アノテーションとしてプロジェクト 42 にアップロードしてください」
  • 「invoice-ner プロジェクトで未完了タスクが最も多いのは誰ですか?」
  • 「すべてのプロジェクトとその現在のステータスを一覧表示してください」
  • 「アノテーターが再試行できるよう、プロジェクト 22 のスキップされたタスクをすべて削除してください」
  • プロのヒント

  • 事前アノテーションでラベリングを高速化する — 人間がレビューする前にモデルの予測を事前アノテーションとしてインポートしてください。アノテーターはゼロからラベル付けするのではなく確認または修正を行うため、成熟したモデルではアノテーション時間が 50〜70% 短縮されます。
  • 早期かつ頻繁にエクスポートする — プロジェクトが 100% 完了するまでエクスポートを待たないでください。ラベリングが並行して続いている間に初期モデルのトレーニング実行のために部分的なデータセットをエクスポートするよう Neotask に依頼してください。
  • 一貫したラベルスキーマが重要 — データをインポートする前にラベルスキーマを慎重に定義してください。プロジェクト途中でラベルを変更すると再アノテーションが必要になります。
  • ステータスでタスクをフィルタリングする — 品質をレビューする際は、不一致や低いアノテーション信頼度を持つタスクを最初に一覧表示するよう Neotask に依頼してください。不確実性を早期に解決することでデータセット全体の品質が向上します。
  • アノテーターごとの API トークン — Label Studio の各ユーザーは独自の API トークンを持っています。監査証跡のために、個々のアノテーターが共有アカウントではなく各自の認証情報を使用することを確認してください。
  • Works Well With