機能 | 内容 |
データセットのコピー・管理 |
画像とアノテーションで構成されるデータセットをコピーできます。 また、データセットのバージョンを管理できます。 |
ラベルの統合 |
複製のラベルを1つに統合できます。 |
データの用途指定 |
アップロードした画像を学習用、検証用に指定することができます。指定しない場合は、自動振り分けされます。 |
今回のリリースによって、画像やアノテーションなどを試行錯誤しながら、用途にあったモデルをより構築しやすくなります。
今回のリリースによって、ユーザーのみなさまが実現できること
「同じ画像に対して異なるルールのアノテーションを行って、精度の良いデータセットを採用する」
モデルの精度を高めるために、アノテーションのルールを見直すことがモデル構築にとって重要な要素の一つです。同じデータセットに対して異なるルールでアノテーションして精度を比較することで、今後のモデル構築の方針を決定できます。
手順例
- 作成したデータセットをコピーすることで、同じデータがアップロードされているデータセットを2つにする
- それぞれのデータセットに異なるアノテーションを行い、モデルを学習させる
- 精度が良いデータセットを今後のモデル構築に用いる
「試行錯誤した結果、最も良い結果を出すデータセットからやり直す」
アノテーションのルールやアップロードしたデータなどの試行錯誤をした結果、過去のデータセットに立ち返って検討することもモデル構築では発生します。そんな時は、古いバージョンをコピーして最適なモデルを構築してください。
手順例
- データセットのバージョンを確認して、該当するデータセットをコピーして、今後のモデル構築に用いる
「細かいラベルを一つに統合して、より精度の高いモデルを構築できるか検証する」
あらゆる食べ物を一度に検出するモデルよりも、まず果物を検出するモデルで推論し、その結果をバナナやりんごを検出するモデルで推論するほうがより高い精度で検出できることがあります。データ数が増えても精度が伸び悩んでいたら、ラベルをまとめるアプローチもご検討ください。
手順例
- ラベルの統合によって、複数のラベルを一つにまとめる
「この画像を学習に回して精度を高めたい」「検証用のデータを前回と同じにしたい」
モデル構築をすすめる中で、精度の低いラベルをまとめて学習させるケースや、社内説明のために特定の画像を検証に回すケースが発生します。そんな時に、データを学習用・検証用として指定してください。
指定がなければ自動で振り分けられますし、過去に学習用に指定されたデータを検証用に指定し直すこともできます。(逆も可能です。)
手順例
- データ検索画面にて、任意の画像を学習用・検証用として指定する。