1
概要
コニカミノルタはAIを活用したプロジェクトを積極的に推進しているが、AIモデル開発における正解付け(アノテーション)は、大量データを手作業で処理する必要があり、大きな課題となっている。この課題に対し、CVAT1) やLabelStudio2) などのアノテーションツールは自動正解付け機能を備えているが、正解付けAIモデルの再学習機能がなく、精度向上や異なるプロジェクトへの対応が難しい。コニカミノルタが開発した「QuickAnno」は、専用のAIモデル(以後Anno-AIモデル)での自動正解付けと、ツール内のデータを用いた再学習機能を備えている。さらに、複数のAnno-AIモデルを一元管理・共有し、要件が近いモデルをベースに追加学習を行うことで、ゼロからのAnno-AIモデル構築を回避し効率的な自動正解付けを可能にした。本システムはこれら機能によりAI開発の効率向上に貢献している。
2
詳細
■構成
QuickAnnoは、Anno-AIを活用し、データ特性や要件に応じた自動正解付けを実現するシステムである。CVATやLabel Studioといったアノテーションツール、および学習結果管理ツールであるMLflow3) から構成されている。これらのツール間の連携を効率化するために、統合UIやAnno-AI操作ツールをコニカミノルタで開発・実装しており、ユーザーは1つのGUI上でデータの自動アノテーション、学習結果の確認、管理、そしてAnno-AIの再学習を行うことができる(Fig. 1)。

Fig. 1 Architecture of QuickAnno
■機能/特長/用途
本システムは、対象データに対してAnno-AIが自動で正解付けを行い、ユーザーはその結果を確認・修正することで、ゼロから手作業で行う場合と比べて大幅に作業時間を短縮できる。自動正解付けとユーザーの修正により作成された学習データは本システム内に保管され、プロジェクトのAIモデルの学習や、ユーザーが修正したデータはAnno-AIの自動正解付け精度を向上させるための再学習にも活用される。従来のアノテーションツールでは自動正解付けを行うAIモデルの再学習には外部環境が必要だったが、本システムでは保管された修正データを直接選択し、再学習を行うことが可能である。この機能により「Anno-AIによる自動正解付け→修正→再学習」のサイクルが効率化され、プロジェクトごとにAnno-AIを継続的に改善・活用できる(Fig. 2)。

Fig. 2 Workflow of Annotation in QuickAnno
更に、MLflowとの連携により再学習結果やモデルバージョンを一元管理でき、別のプロジェクトへの共有や以前のバージョンに戻すこともできる。過去の学習結果や類似モデルをベースにすることで、新規プロジェクトでも効率的に自動正解付けを開始できる。これらの操作はすべてWebブラウザ上の統合GUI(Fig. 3)を通じて行え、専門知識がなくても簡単に利用することができる。現在、Anno-AIモデルのラインナップとして、物体検出、クラス分類、セグメンテーションの画像タスク向けモデルに加え、音声の文字起こしを行うモデルも提供し、今後も拡充していく予定である。

Fig. 3 Training GUI
■今後の展望
本システムの課題として、データ数が少ない段階ではAnno-AIの精度が十分に発揮されない場合がある。この課題を解消するために、少量データでも安定した精度を維持できるAIモデルをAnno-AIとして追加搭載することで、初期段階から高精度な自動正解付けを実現し、本システムの汎用性と精度をさらに向上させる。