概要
Vision は、開発の知識がなくても自社業務に合わせた物体検知/物体分類モデルを簡単に作成できるクラウドサービスとなっております。
そして、作ったAIモデルは、1-Clickであらゆるシステムと連携可能なAPIとして配信されます。
本記事では、Vision の主な機能をご紹介します。
ワークスペース
ワークスペースとは、色んなAIモデルやたくさんのデータセットを集約できる「場所」のようなものです。
データセット
データセットはデータの集合です。
デフォルトではデータセット内の画像が80%:20%の割合で、学習用と検証用に自動で振り分けられます。
手動でデータ用途を指定する場合は、こちらの記事をご参照ください。
モデルタイプ
「物体検出」と「画像分類」と「OCR」の3種類のモデルタイプをご用意しております。
画像から複数物体を検出する場合や物体の位置を特定したい場合は「物体検出」モデルを利用します。
例)画像から作業員と荷物を検出する
一方で、複数物体ではなく、画像そのものを分類したい場合は「画像分類」モデルを利用します。
画像面積の多くを占める主要な物体1つが対象です。
例)商品種別の判別
紙面の帳票スキャンデータや、画像の中にあるテキスト項目を抽出してデータ化(OCR)したい時は「OCR」モデルを利用します。書式が変わらない場合にはDX Suiteがおすすめですが、書式が帳票ごとに変わる場合にはAnyDataで読み取りたい項目を抽出することができるのでおすすめです。
例)請求書から合計金額と支払期日を読み取る、レセプトから合計点数を読み取る
学習設定
下記3種類の学習設定をご用意しております。
デフォルト設定では「標準モデル」となっております。
必要に応じて検出対象物の大きさ、ご希望の検出速度などの条件を考慮した上で、適宜変更してください。