【技術コラム】AI向けデータ提供を成長領域へ―高精度3次元データを活用したAIネイティブデータセット開発の進捗と構想

公開日
更新日
  • X
  • Facebook
  • LinkedIn
【技術コラム】AI向けデータ提供を成長領域へ―高精度3次元データを活用したAIネイティブデータセット開発の進捗と構想

こんにちは、執行役員 テクノロジー統括の福田 譲です。現在の自動運転技術開発においてはAI利用が当たり前となり、「どれだけリアルなデータで検証できるか」つまり「どれだけSim-to-Realのギャップを埋められるか」が開発スピードと品質を大きく左右する時代に入っています。実際、当社の高精度3次元データに関するお問い合わせにおいても、AIモデル開発やシミュレーション環境下での評価を目的としたものが急速に増えてきました。

このような背景のもと、当社ではお客様が即時利用なAIネイティブデータを整備すべく、長年蓄積してきた高精度3次元データ資産を活用した新商品の開発を進めています。本コラムでは、当社のAI向けデータセット開発の進捗と構想について解説します。

AIネイティブなデータとは

当社が目指すAIネイティブなデータとは、AIモデル開発に必要な学習データとして、或いはシミュレーションで利用するデジタルツインデータとして、その目的で利用するプラットフォーム上で即時利用可能な高精度3次元データ、その利用目的に対して価値のある高精度3次元データを指します。当社が保有する膨大な点群データ、カメラ画像、高精度位置情報、高精度3次元地図データといった複数種のデータから、時間的・空間的に同期された状態のデータセットを適切に選択し再構成することで実現していきます。これにより、AIモデルは現実世界をより正確に、かつ文脈を含めて理解することも可能になります。

AIネイティブな高精度3次元データのイメージ

このようなAIネイティブデータとして最もシンプルな形態は、カメラ画像と高精度位置情報の組み合わせです。画像認識系のAI技術は早くから発達し既にコモディティ化していますから、ニーズの多さも分かります。当社では高精度3次元地図データ制作過程で膨大なカメラ画像を蓄積していますので、それを使ってAIモデルに道路環境を学習させたいというご相談を頂いています。その量だけでなく、高精度位置情報を併せ持っている点で、高付加価値な画像データとなるのでしょう。

また、高精度3次元地図データ単体でも、AIネイティブなデータとしての期待値は高まっています。実際に当社の高精度3次元地図データをAIモデルの学習用途で使うお客様は着実に増えてきています。地図として収録された地物情報はすなわちアノテーション情報に相当し、AIモデル学習用において他にない付加価値を持った素材となるためです。これをAIネイティブデータと呼べるものにするべく、主なAI開発プラットフォームで即時利用可能な汎用的/標準的な提供フォーマットへ変換したり、API連携によってオンデマンドで取り出せたりするようシステム開発を進めています。

これらの取り組みの先にあるAIネイティブデータの形として、3D Gaussian Splatting技術によって生成される3Dシーンデータ(以降、3DGS)があります。同技術は2023年に登場して以降急速に普及し、多様な目的で、数多くのプラットフォーム上での利用が可能になっているためです。現実社会を極めて忠実に再現できるにも関わらず高速に描画でき、データ生成も比較的高速かつ低コストで済むという特性が人気の理由でしょう。

AIネイティブデータの開発状況

1. 高精度画像データ

既に膨大なカメラ画像データを保有していることに加え、当社では360度カメラ画像の有用性にも着目し収集を進めています。私たちが日常的に利用できる360度ビューアプリケーションは複数ありますが、その多くは利用規約上の制限によってAI利用ができません。このような背景を踏まえ、当社自身で収集する360度カメラ画像を用いて、高精度3次元地図データ制作にAIを活用すること(AI for Data)と、これをAIネイティブデータの一要素として位置づけ更なる付加価値を生み出すこと(Data for AI)を並行的に進めています。

(参考:「“AI for Data” & “Data for AI”当社の高精度3次元データとAIの関係性とは」)

現在は東京や名古屋といった重要地域から収集し始めています。これらを既存のカメラ画像と組み合わせ、あるいは使い分け、AIネイティブなデータセットとしてお客様に提供できるよう取り組んでいます。


2. 高精度3次元地図データ

高精度3次元地図データはもともと自動運転車両に搭載される目的で制作していますが、前述の通りAIモデルの学習用途で使うお客様も増えています。そうなると従来通り全国カバレッジのフルデータセットを必要とされるニーズに加え、目的に応じて必要な情報・エリアを選んで利用したいというニーズも出てきます。

当社ではオンデマンドでのデータ提供システムとしてAPI開発を進めていますが、別のアプローチでもこうしたニーズに向けて開発を進めており、それが1月のCESで発表したAIプラットフォームです。AIモデルを強化する用途では走行が難しいエリアのデータが期待されますが、それを具体的に指定/特定するのは容易ではありません。それが当社のAIプラットフォームを使えば、例えば「曲率の大きいカーブを上位20箇所探して」といった具合に自然言語で調べることができるようになります。北米のように既に150万kmもの高精度3次元地図データが存在する地域では、それをAIネイティブなデータとして提供するために利便性の高い検索手段も重要な意味をもってきます。最終的にはAPIと組み合わせた形で、自律的なActive Learningでの活用も期待されます。


3. 高精度3DGSデータ

3DGSに関する論文やソフトウェアは数多く公開されており、それらを利用して誰でも容易にデータを生成することが可能です。スマホアプリを使ってデータ生成した経験のある人も少なくないでしょう。

このように手軽にデータを生成できる3DGSですが、その用途が自動運転技術開発やロボット技術開発のような産業用途、今でいうフィジカルAIの領域となると、途端に事情が変わってきます。現実世界を忠実に再現した3Dシーンが大規模に求められるため、オープンデータから生成する3DGSでは実用に耐えず、自力でデータ収集するにも機材やノウハウがないため現実的でない、といった状況に陥ります。

このようなお客様のジレンマを解消すべく、当社が保有するカメラ画像、点群データ、高精度位置情報、高精度3次元地図データを元に生成する高精度3DGSの生成に取り組み始めました。オープンデータ由来の3DGSで直面するデータの歪みや欠損などを排除し、産業用途で期待される高い水準の精度と忠実度で現実世界を再現すべく開発と検証を進めています。

3DGSで期待されるデータ品質 vs 現実に予想されるデータ品質

この高精度3DGSの開発状況につきましては、改めて別のコラムでもう少し深く踏み込んで解説する予定です。

おわりに

当社は、AI向けデータ提供を高精度3次元地図データ事業に続く、戦略的成長領域として位置づけています。現実世界を忠実にデジタル化してきた強みを活かし、AI開発を支える基盤データの提供者として産業の発展に貢献していきます。

監修者情報
福田 譲

執行役員 テクノロジー統括

福田 譲

サービスに関するお問い合わせ、
またはIRメールの配信登録はこちらから