カスタマーサポートAIで培った「意図理解」×「画像認識」技術を製造現場のロボット制御に転用
カラクリ株式会社のプレスリリース
国産マルチモーダルAI開発を手がけるカラクリ株式会社(本社:東京都中央区、代表取締役CEO:小田志門、以下「カラクリ」)は、トヨタグループの主要企業である株式会社ジェイテクト(本社:愛知県刈谷市、取締役社長:近藤禎人、以下「ジェイテクト」)およびグローバルAI企業であるUpstage AI株式会社(本社:東京都港区、代表取締役:松下紘之、以下「Upstage」)と共同で、アマゾン ウェブ サービス ジャパン合同会社(以下「AWSジャパン」)が提供する「フィジカルAI開発支援プログラム by AWSジャパン」に採択されたことをお知らせいたします。
本プログラムの採択を通じて、3社は製造業界におけるフィジカルAIの活用可能性を検証し、ジェイテクトの工場における自律型・適応型生産システムの社会実装を目指します。

採択の背景と本プロジェクトの意義
日本の製造業は世界屈指の技術力を誇る一方、深刻な労働力不足と、熟練工の技能伝承という構造的課題に直面しています。特にロボット制御における「ティーチング(高度なプログラミング)」の負担は大きく、現場での柔軟な運用を阻む壁となっています。 本プロジェクトでは、カラクリの「LLM/高度な意図理解」とUpstageの「非構造データをAI活用可能にするデータ構造化技術」、そしてジェイテクトの「製造現場で培った数多くの知見」を掛け合わせることで、専門知識がなくても「言葉」や「視覚情報」で直感的にロボットを操作できる、日本発のフィジカルAIの実装を目指します。
カラクリがフィジカルAIに参入する理由 ― 「カスタマーサポート」から「Physical AI」への技術転用
カラクリがフィジカルAI領域に参入する背景には、同社がカスタマーサポート向けに開発してきたコンピューター操作エージェント(CUA)モデルと、ロボット制御に用いられるVision-Language-Action(VLA)モデルの高い技術的親和性があります。
CUAモデルの仕組み: 画面上の画像を認識し、ユーザーの自然言語による指示から「どの座標にマウスを移動し、何をクリックするか」というアクションを自律的に生成します。
VLAモデルとの共通点: 「画像(Vision)を見て、言語(Language)で理解し、動作(Action)を生成する」プロセスは、CUAモデルと本質的に同じ構造です。
この技術転用により、以下の3つのポイントがフィジカルAIの開発を加速させます。
|
意図理解技術 |
カスタマーサポート領域で磨き上げた、曖昧な指示から真の意図を汲み取る技術。製造現場での「あれをそっちに運んで」といった直感的な指示の理解に直結します。 |
|
画像・空間認識 |
画面上の要素を把握する技術を、製造ラインのリアルタイムな状況把握に応用。CG合成データを活用した効率的な学習も可能です。 |
|
高効率トレーニング |
AWS Trainium活用において世界トップクラスの技術力で、限られたリソースで高性能なモデル開発を可能にします。 |
3社連携体制と各社の役割
本プロジェクトでは、それぞれの強みを持つ三社が連携し、製造現場におけるフィジカルAIの社会実装を推進します。
|
ジェイテクト(実証フィールド) |
製造現場とドメイン知識の提供。実際の製造ラインにおける課題抽出および実証環境の提供 |
|
Upstage(モデル開発支援) |
現場の「非構造データ」をAIが処理可能な形に変換。LLM開発の知見に基づく技術支援とデータの資産化 |
|
カラクリ(AIモデル開発) |
CUA/VLAモデル技術を基盤としたロボット制御AIの開発。AWS Trainiumを活用した高効率トレーニング技術の提供。 |
3社で進める共同開発について
Vision Language Action(VLA)の活用
マルチモーダル生成AIにより、画像・言語・動作を統合的に学習・推論することで、複雑な製造プロセスの自動化と最適化を実現します。
仮想空間での高速学習(Sim2Real)による試作コストの削減
シミュレーション環境での学習成果を実環境に転用することで、AIモデルの開発コストと試作期間を大幅に短縮します。
現場データの資産化とAI-Ready化
ジェイテクトの工場に蓄積されている多様且つ高精度なデータを、AIが最大限に活用できる形に変換し、現場データに基づいた専用モデルを構築します。
「フィジカルAI開発支援プログラム by AWSジャパン」について
「フィジカルAI開発支援プログラム by AWSジャパン」は、AWSジャパンが日本に法人または拠点を持つ企業・団体を対象に実施するプログラムです。VLAをはじめとしたロボット基盤モデルの開発に対して、技術支援、AWSクレジット提供(プログラム全体で最大600万USドル規模)、フィジカルAIコミュニティの形成、Go-to-Market支援を提供します。支援期間は2026年3月から約6ヶ月間で、7月に成果発表会を予定しています。
URL: https://aws.amazon.com/jp/blogs/news/aws-japan-physical-ai-development-support-program/
株式会社ジェイテクト イノベーション本部 研究開発センター長 小野﨑 徹 コメント
日本の少子高齢化による生産年齢人口減少へ迅速に対応するため、ジェイテクトが培ってきた『匠の技』と『現場の知』を、フィジカルAIとして昇華させることが、今まさに求められていると感じています。
自動車部品・軸受・工作機械の製造現場には、熟練技術者の経験と勘・コツに裏打ちされた膨大な暗黙知が蓄積されています。しかし、その多くはデジタルの力によっても、まだ十分には形式知化されていません。
Upstage様のDocument AI技術、カラクリ様の生成AI技術を組み合わせることで、現場の知をAIが扱える形式知へ変換し、製造現場におけるフィジカルAIの実装を加速させたいと考えています。
この取り組みを、世界に誇る日本のモノづくりの競争力を再定義する第一歩と位置づけ、製造業のフィジカルAI実装の型を共創していきます。
Upstage AI 株式会社 代表取締役 松下紘之 コメント
製造業はデータで動いていますが、その多くはいまだに文書やログ、分断されたシステムの中に閉じ込められています。Upstageの強みは、そうした非構造情報、そして現場に眠る暗黙知を形式知へと変換し、AIが活用できるインテリジェンスにすることです。ジェイテクト様の製造業での知見、カラクリ様の生成AI開発力とUpstageのDocument AI技術を組み合わせることで、フィジカルAIをコンセプトから製造業の現場へと実装していく機会になると考えています。
カラクリ株式会社 CPO 中山智文 コメント
日本のものづくりの強みは「現場力」にあります。トップダウンでは考えきれない複雑な問題を、現場で改善サイクルを回しながら解決してきた力です。この強みをAIの時代にも活かすためには、現場の人間がAIを直感的に使いこなせる仕組みが不可欠です。カスタマーサポート領域で磨いてきた「人の言葉の意図を理解し、適切に応える」技術は、ロボットを人間の言葉で制御する技術にそのまま転用できます。Upstage様のデータ構造化技術、ジェイテクト様の世界トップクラスの製造現場と組むことで、日本発のフィジカルAIの新しい形を示していきたいと考えています。
各社概要
株式会社ジェイテクト
所在地:愛知県刈谷市朝日町1丁目1番地
代表者:取締役社長 近藤禎人
事業内容:ステアリング、ドライブライン、軸受、工作機械、電子制御機器等の開発・製造・販売。自動車部品のステアリングシステムにおいては世界シェアNo.1。
Upstage AI株式会社
所在地:東京都港区
代表者:代表取締役 松下紘之
事業内容:安全で高性能なLLMおよびドキュメントAIプラットフォームの提供。AmazonやAMDからの出資を受け、国内開発LLM「Syn Pro」やDocument Parseなど企業向けAIプラットフォームを展開
カラクリ株式会社
所在地:東京都中央区築地2-7-3 Camel築地II 5F
代表者:代表取締役CEO 小田志門
設立:2016年10月
事業内容:カスタマーサポート特化型AI「KARAKURI」シリーズの開発・提供・運営、大規模言語モデル(LLM)の研究開発

