Weekly Newsletter #167
Google、AIモデルGemini 1.5を発表:長文理解に画期的な進歩/OpenAI、テキストから動画生成のAI「Sora」発表:倫理的な課題も浮き彫りに/Apple、開発者向けコード生成AIアシスタントを年内にリリースへ/AIチップ市場:NVIDIAがカスタムチップ市場に参入、競争激化へ
今週は風邪を引いてしまい、殆ど部屋に引きこもっていました。私はアメリカに来てからずっと健康だったので、所謂、ホームドクター(掛かり付け医:何かあった時に最初に相談するお医者さま。こちらは飛び込みで病院に行っても見てもらえないので、通常、懇意のお医者さまを見つけておく必要があります)がおらず、苦労しました。でも、ようやく回復しました!
お願い:
このNewsletterを継続させるために、登録者をもう少し増やしたいです。まだ登録されていない方は、是非、登録をお願いします。また周りでご興味ありそうな方に紹介してもらえると嬉しいです。
Google、AIモデルGemini 1.5を発表:長文理解に画期的な進歩
長文の文脈理解を大幅に向上
デモでは月面着陸記録から3つの興味深い瞬間を抽出、セリフと背景も提示
1時間ビデオ、11時間音声、3万行コードなど、膨大なデータ分析が可能
Googleは、主力言語モデルBardのアップデート版であるGemini 1.5を発表しました。このリリースの大きなポイントは、「モダリティを超えた長期コンテキスト理解における画期的な進歩」なんだそうです。これはだいぶ分かり難いのですが、Google Deepmindの共同創設者が、デモを通してこの概念を説明してくれていました。デモでは、月面着陸に関する402ページのNASAミッション記録(「長い」プロンプト)をお題データとして与え、「この中から3つ、面白い瞬間を選んで、その時のセリフを教えて」とAIにお願いすると、Gemini 1.5は小説ほどの長さのテキストから、3つの興味深い瞬間を抽出しました。ここで注目すべきは、AIは選択した場面でのセリフとその「背景(コンテキスト)」を提示出来ている事です。つまり、物語の全体を理解した上で解答を出している点です。
<Geminiの解答例>
Coffee Bet
引用: コーヒーを賭けるよ
背景: コリンズは、星の観測中のレチクルの位置合わせに関するミッションコントロールの指示にふざけて異議を唱えます。 この陽気な瞬間は、重要な任務中であっても、宇宙飛行士と管制官の間の友情とユーモアを示しています。
Gemini 1.5は、1時間のビデオ、11時間の音声、30,000行以上のコード、700,000語以上の単語の解析が可能であり、これは、少なくとも数冊の本に相当するテキストを処理できる能力です。これらの機能は、ドキュメントの概要作成や、アップロードした財務データのパターンの発見などに役立つでしょう。
OpenAI、テキストから動画生成のAI「Sora」発表:倫理的な課題も浮き彫りに
テキストからリアル動画を生成するAI、従来技術を圧倒するクオリティで注目を集める
フェイクニュースなど悪用への懸念も。OpenAIは対策を講じていると声明
情報伝達、エンターテイメント、私たちの認識に大きな影響を与える可能性も
OpenAIは2月16日、テキストに基づいてリアルな動画を生成するAIモデル「Sora」を発表しました。これは、ユーザーが入力したテキスト内容を基に、ストーリーや風景、人物などを自動的に生成し、映画のような品質の動画を創り出す技術です。Google、Meta、スタートアップ企業Runway MLなど、同様の技術を開発する企業は他にも存在するのですが、今回、OpenAIが公開したSoraのデモ動画は、その高いクオリティによって注目を集めています。
OpenAI CEOのアルトマン氏は、フリーカメラマンが提案した「映画のような照明を備えた素朴なトスカーナの田舎のキッチンで、ソーシャルメディアのインフルエンサーのおばあちゃんが主催する自家製ニョッキの調理指導セッション」というお題に対し、同氏は直ぐにプロンプトの内容を描写したリアルなビデオで返答していました。
Soraのような高度な技術は、フェイクニュースやプロパガンダ、ディープフェイクなどの悪用にも利用される可能性があり、倫理的な問題が懸念されています。OpenAIは、これらの問題を認識しており、誤解を招くコンテンツを検出するツールなど、対策を講じていると声明を発表してはいるのですが、これ程にリアルですと、我々の世界の捉え方が変わりますよね。
Apple、開発者向けコード生成AIアシスタントを年内にリリースへ
AIでコード自動生成、開発者負担軽減
年内リリース予定であり、社内テスト済み、Xcodeに統合か
iOS/iPadOS 18に多数AI機能が搭載予定、ユーザー体験向上も
Appleが、開発者がAIを利用してコードを自動生成できるコーディングアシスタントを開発し、早ければ今年中にリリースする予定のようです。このツールは、マイクロソフトの「GitHub Copilot」と同様であり、AIを活用してコード予測や補完を行い、開発者の作業時間を大幅に短縮すると期待され、すでに社内でテストされているようです。Appleは開発者向けツールの進化に積極的に投資しており、今回のリリースもその一環と見られます。
また、Appleは今年度のOSアップデートに向けてAI機能の強化に注力してると伝えられています。次期iPhone/iPad向けOS「iOS 18/iPadOS 18」には多数のAI機能が搭載される予定で、その中でも「Crystal」と呼ばれるコードネームのソフトウェアは、iPhone 16年史の中でも最も重要なアップデートの一つと位置づけられています。具体的なAI機能としては、Apple Musicのプレイリスト自動作成、Keynoteのスライドショー自動生成などが検討されているようです。また、システム全体の検索機能Spotlightの改良も予定されており、アプリ内機能の切り替えや、大規模言語モデルに基づいた複雑な質問への回答などが可能になる見込みです。
アップルユーザーですので、これはこれで楽しみです。
AIチップ市場:NVIDIAがカスタムチップ市場に参入、競争激化へ
NVIDIA、AI技術の発展とニーズ変化に対応すべくカスタムチップ開発へ
Amazon、Microsoftなどハイテク企業へのカスタムチップ提供で、市場シェア拡大を目指す
3NVIDIAの参入で、カスタムチップ市場の競争激化か
ハイエンドAIチップ市場を支配するNVIDIAが、データセンター向けカスタムAIチップ市場に参入することが明らかになりました。この動きは、AI技術の発展とデータセンターのニーズの変化に対応するもののようです。
これまで、NVIDIAは汎用性の高いAIチップを提供してきましたが、近年、Amazon、Microsoft、メタプラットフォームなどのハイテク企業は、特定のニーズに合わせて独自の内部チップを開発し始めています。この動きは、Nvidia への依存度を下げたいという各社の思惑からなのですが、一方のNVIDIAとしては、カスタムチップ開発への参入により、これらの顧客ニーズに対応し、競争力を強化する狙いがあるのでしょう。また、この動きはデータセンター向けのカスタム シリコン設計市場を独占してきたBroadcomとMarvellにとって脅威となる可能性もあります。NVIDIAは、高い技術力と豊富な顧客基盤を活かして、データセンター市場シェアを獲得していくことが予想されます。
NVIDIAのカスタムチップ開発への参入は、AIチップ市場の競争を激化させ、市場の勢力図を塗り替える可能性があります。今後、NVIDIAがどのようなカスタムチップを開発し、市場にどのような影響を与えるのか、注目ですね。