当社は、OpenAI社のAIモデル「CLIP」(Contrastive Language–Image Pre-training)※1をエッジデバイスに実装し、クラウドと通信することなく、簡単なプロンプトを設定するだけで任意の物体を分類できる画像解析アプリ「CLIP on Actcast」の提供を開始しました。
※1 CLIPは、OpenAI社が2021年に発表した、画像とテキストの類似度を計測できるAIモデルです。画像とそのキャプション4億ペアのデータで学習されたCLIPは、追加の学習なしに様々な画像の分類に利用できます。
「CLIP on Actcast」は、AIモデル「CLIP」を、当社のエッジAI開発プラットフォーム「Actcast」上のエッジデバイス(ai cast )※2で実行するアプリです。専用のソフトウェアやAIモデルを構築することなく、任意の物体をAIカメラに映して簡単なプロンプトを設定するだけで、画像データを解析して物体を分類できます.
活用例として、工場における特定の部品や、店舗における特定の商品などの数をカウント可能です。また、「作業者がヘルメットを着用しているか否か」「特定の場所にトラックが止まっているか否か」といった状態も分類できるため、リアルタイムな異常検知にも役立てることができます。
本ソリューションはクラウドとの通信を行わないため、データ漏えいなどのプライバシーリスク回避に寄与します。また、複数の工場や店舗などに大規模導入する場合に、クラウド型カメラと比べて通信コストを大きく抑えることが可能です。
※2 ai castについて:https://www.idein.jp/ja/blog/20230221-aicast(当社公式ブログ)
開発背景/既存ソリューション「LLM App on Actcast」との違い
社会におけるデータ処理の需要増加に伴い、プライバシー保護やクラウド負荷軽減への関心が高まり、その解決策としてエッジAIへの注目が集まっています。
企業がAIをビジネスに導入する際、一般的には導入前にPoCを実施します。そしてPoCを開始する際、PoC用のAIをはじめとしたソフトウェア開発が必要となります。この取り組みにおいて、ビジネス導入に向けた価値や効果の検証よりも、機械学習モデルの精度向上などに注力してしまう傾向がありました。本来は十分な検討の必要な本導入やその後の検証サイクルといった運用を見越した検証に進めないままPoCが終わってしまうため、本格導入の判断に至らないままプロジェクトが頓挫してしまうことが多く発生していました。
こうした課題を解決するために、当社は2024年5月、「Actcast」とマルチモーダルLLM(Multimodal Large Language Models/マルチモーダル大規模言語モデル)を連携させた画像解析ソリューション「LLM App on Actcast」※3を発表しました。OpenAI社の「ChatGPT」のAPIを用いてエッジデバイスで撮影した画像に対する推論を行うアプリで、プロンプトエンジニアリングにより疑似的なアプリ設計を行うことができます。初期投資が必要だったPoC用ソフトウェアをプロンプトエンジニアリングで代替することで、AI開発よりも先に、最低限の手間とコストで、本来最も重要なビジネス価値の検証にフォーカスすることを可能にしました。
「LLM App on Actcast」はクラウドLLMを活用して複雑な自然言語処理や画像解析を実現するアプリであるのに対し、「CLIP on Actcast」は、CLIPを用いて画像とテキストの関係性に基づく物体分類をエッジデバイス上で実行するアプリです。AIモデル開発を経ずに物体を分類するAIの実行がエッジで完結するため、先述の活用例をはじめとする様々な用途で低コスト運用を可能にします。
※3「LLM App on Actcast」について:https://www.idein.jp/ja/news/240529-llm-app-actcast(当社お知らせ)
今後の展望:エッジLLMへの挑戦
今回は、短期間でエッジデバイス上での動作実現を目指して、OpenAI社のCLIPを活用しました。将来的にはエッジデバイス上でLLMを効率的に実行し、クラウド依存を減らすよう研究開発を進めてまいります。
*「CLIP on Actcast」に関するさらに詳しい情報は当社公式ブログをご覧ください。
ブログタイトル:「CLIP on Actcast」開発の背景
URL:https://www.idein.jp/ja/blog/20241218-clip-on-actcast
「国内シェアNo.1について」
デロイト トーマツ ミック経済研究所 『AI(ディープラーニング)活用の画像認識ソリューション市場の現状と展望 2024年度版』(https://mic-r.co.jp/mr/03210/)「提供形態別市場シェア【SDK/開発プラットフォーム】」の調査結果に基づく。2024年度は見込み値。
▼プレスリリースはこちら(外部サイト:PR TIMESへ遷移します)
Idein、エッジAIソリューションの拡充に向けた新展開―― OpenAIのモデル「CLIP」を活用した画像解析アプリを発表
関連記事
- マルチモーダルLLMを活用した画像解析ソリューションを提供開始
2024/05/29
- JR東日本との協業に向けた検討を開始しました
2024/11/14
- 東京都の「現場対話型スタートアップ協働プロジェクト」に採択されました
2023/12/25