AIウェアラブルに必須!Memories.aiが築くビジュアル記憶の未来

テクノロジー

■AIが「見る」ことから「覚える」ことへ:Memories.aiが切り拓く未来

皆さんは、AIって聞くとどんなイメージをお持ちでしょうか?「賢い」「便利」「SFみたい」…色々な言葉が思い浮かぶかもしれません。私も、日々進化するテクノロジーの最前線に身を置く者として、AIの可能性には常にワクワクさせられています。特に、AIが私たちの「視覚」を通して世界を理解し、それを記憶するようになるなんて、まさに夢のような話ですよね。今日は、そんな未来を現実のものにしようとしている、Memories.aiというスタートアップ企業のお話をご紹介したいと思います。

彼らが目指しているのは、AIが単に情報を処理するだけでなく、「見たもの」を記憶し、そしてそれを自在に思い出せるようになるための基盤技術を構築すること。これって、私たちが人間として日々の生活を送る上で、当たり前のように行っていることじゃないですか?朝起きて、顔を洗って、朝食を食べて…こうした日々の出来事も、私たちは記憶しているからこそ、次に何をすべきか判断できます。AIにも、物理世界で賢く振る舞うためには、この「記憶」という能力が不可欠だ、というのがMemories.aiの Shawn Shen氏の強い信念なんです。

AIが「記憶する」という概念自体、実は比較的新しい進歩なんです。最近でも、ChatGPTが過去の会話を覚えられるようになったり、Elon Musk氏のxAIやGoogle Geminiが独自の記憶ツールを発表したりと、AIの記憶力は急速に向上しています。ただ、これまでの進歩の多くは、テキストベースの記憶、つまり文章でやり取りした内容を覚えることに重点が置かれてきました。これはこれで素晴らしい進歩なのですが、Shen氏が指摘するように、私たちが世界と直接触れ合う物理的なAI、例えばウェアラブルデバイスやロボットにとっては、テキストだけでは限界があるんです。彼らは、文字通り「目」で見たものを覚える、視覚的な記憶が重要だと考えているんですね。

このMemories.aiのアイデアが生まれたきっかけは、彼らがMetaでスマートグラスのAIシステム開発に携わっていた経験にあります。そこで彼らは、「せっかく録画できるのに、その映像を後から思い出せないんじゃ、あまり意味がないんじゃないか?」と疑問に思ったそうです。確かに、未来のスマートグラスが、昨日見た景色や、誰かと話した会話の断片を覚えていなかったら、あまり便利とは言えませんよね。彼らは、こうした「ビジュアルメモリ」、つまり視覚的な記憶をサポートするソリューションが、まだ世の中に十分に存在しないことに気づき、自社で開発することを決意したのです。Metaからスピンアウトしてまで、この分野に情熱を燃やす彼らの意気込みが伝わってきます。

■Nvidiaとの強力タッグ:AIの「見る」「覚える」を加速させる

Memories.aiの技術開発を語る上で欠かせないのが、Nvidiaとの協業です。Nvidiaといえば、AIやグラフィックス処理の分野で世界をリードする企業ですよね。彼らが開発するAIツールは、まさにAIの「脳」とも言える部分を担っています。Memories.aiは、Nvidiaの「Cosmos-Reason 2」という、推論型のビジョン言語モデルと、「Metropolis」という、ビデオの検索や要約を行うアプリケーションを活用することで、自社のビジュアルメモリ技術をさらに発展させています。

「Cosmos-Reason 2」のような高度なビジョン言語モデルは、AIが画像や動画の内容を深く理解する能力を高めます。単に「猫がいる」というだけでなく、「ソファの上で丸くなって眠っている猫」といった、より詳細な情報を認識できるようになるわけです。そして、「Metropolis」は、大量のビデオデータの中から、必要な情報だけを効率的に探し出し、要約してくれる強力なツールです。例えば、監視カメラの映像を分析して、特定の人物が映っているシーンだけを抜き出したり、会議の動画から重要な発言だけをまとめてくれたりするイメージでしょうか。

これらのNvidiaの技術とMemories.aiのビジュアルメモリ技術が組み合わさることで、AIは「見たもの」をより鮮明に、そして長期的に記憶できるようになります。これは、AIが物理世界でより人間らしく、そしてより賢く振る舞うための、まさに強力な推進力となるでしょう。AIが、私たちが普段経験するような「記憶」を持つことで、ロボットが作業手順を覚えたり、ウェアラブルデバイスが個人の生活習慣を理解してサポートしてくれたり、といったことが、もっと身近になっていくはずです。

■「LUCI」が捉える現実:データ収集の現場から生まれる知性

さて、AIに「見たものを記憶させる」ためには、その「見たもの」をAIが理解できる形で提供する必要があります。ここでMemories.aiが独自に開発したのが、「LUCI」というハードウェアデバイスです。これは、彼らの言うところの「データコレクター」が装着するもので、モデルのトレーニングに必要なビデオを記録するために使われます。

「え、ハードウェアも作ってるの?」と思われるかもしれませんが、Memories.aiはハードウェア企業になるつもりはないそうです。あくまで、自分たちのビジュアルメモリ技術を開発するために、最適なデータ収集手段として、このLUCIを開発したのです。市販のビデオレコーダーでは、高解像度で長時間のビデオを効率的に記録するのが難しかったり、バッテリー消費が激しすぎたりといった課題があったとのこと。それを解決するために、自分たちで納得のいくデバイスを作り上げた、というわけですね。

このLUCIが記録する映像は、AIにとっての「経験」そのものです。私たちが子供の頃に色々なものを見て、触れて、学んでいくように、AIもこのLUCIを通して、現実世界の多様な情報を取り込み、学習していきます。この、現実世界から直接得られる「生きたデータ」が、AIの視覚的な記憶能力を飛躍的に向上させる鍵となるのです。

そして、このデータ収集の過程で生まれたのが、「大規模ビジュアルメモリモデル(LVMM)」です。これは、GoogleのGemini Embedding 2のような、マルチモーダルな情報をインデックス化・検索できるモデルの小型版とも言えるそうです。つまり、画像や動画といった視覚情報だけでなく、それに関連するテキスト情報などもまとめて記憶し、後から効率的に検索できる能力を持っている、ということですね。このLVMMの第2世代も既にリリースされており、さらに進化を続けています。

■Qualcommとの連携:AIの記憶を、もっと身近なデバイスへ

Memories.aiの歩みは、ハードウェアとの連携という点でも注目に値します。彼らは、Qualcommという、スマートフォンや様々な電子機器に搭載されるプロセッサーで世界的なシェアを誇る企業とパートナーシップを結びました。これにより、Memories.aiのビジュアルメモリ技術は、Qualcommのプロセッサー上で動作するようになり、より多くのデバイスに搭載される可能性が広がっています。

Qualcommのプロセッサーは、その高い性能と省電力性で知られています。AIの「記憶」という、それなりに計算リソースを必要とする機能を、これらのプロセッサー上で効率的に動かすことができれば、ウェアラブルデバイスやロボットのような、バッテリー容量や処理能力に制約のあるデバイスでも、高度なビジュアルメモリ機能を実現できるようになります。これは、AIをより私たちの生活の隅々にまで浸透させるための、非常に重要なステップです。

現在、一部の大手ウェアラブル企業とも協力関係にあるとのことですが、具体的な社名はまだ明かされていません。しかし、これらの強力なパートナーシップを通じて、Memories.aiのビジュアルメモリ技術が、私たちの身近なデバイスに搭載される日が、そう遠くない未来に訪れることを期待せずにはいられません。

■未来への布石:ウェアラブルとロボットが「覚える」世界

Shawn Shen氏は、商業化という点では、現時点ではモデルとインフラストラクチャに重点を置いていると述べています。これは、ウェアラブルやロボットの市場は、いずれ必ず大きなものになると確信しているものの、まだ「今」ではない、という彼らの戦略的な判断から来ています。

しかし、その「いずれ来る」未来を見据えたからこそ、今、彼らは基盤となる技術を徹底的に磨き上げているのです。AIが「見たもの」を記憶し、それを活用できるようになるということは、単なる技術的な進歩にとどまりません。それは、私たちの生活のあり方そのものを変える可能性を秘めています。

例えば、
介護ロボットが、お年寄りの日々の生活パターンや、過去の出来事を記憶することで、よりパーソナルで安心できるサポートを提供できるようになる。
産業用ロボットが、過去の作業経験を「視覚的に記憶」し、より複雑で繊細な作業を自律的にこなせるようになる。
スマートグラスが、会議で交わされた議論や、誰が何を話したかを正確に記録・想起することで、チームの生産性を劇的に向上させる。
ドローンが、探索した場所の地形や障害物を記憶することで、より安全で効率的な飛行ルートを自律的に計画できるようになる。

このように、AIが「視覚的な記憶」を持つことで、私たちの社会は、より安全で、より便利で、そしてより人間らしいものへと進化していくでしょう。Memories.aiが開発しているのは、単なる技術ではなく、こうした未来社会の実現に向けた、まさに「記憶」という名の羅針盤なのです。彼らの情熱と、NvidiaやQualcommといった強力なパートナーシップが、AIの「記憶」の未来を、どのように切り拓いていくのか、これからも目が離せません。この技術が、私たちの日常にどのような驚きと便利さをもたらしてくれるのか、心から楽しみにしています。

タイトルとURLをコピーしました