Weekly Newsletter #266
AIの競争軸が、「モデル性能」から「推論をどれだけ安く動かせるか」へ移り始めています。今週は、DeepInfra の大型調達から見える推論専用クラウド市場、米議会で進むAI チップ輸出規制、そして侵害分析の最新レポートが示した脆弱性悪用の急増を取り上げます。
こんにちは、5月はRio がお届けします。
撮影: 筆者
ゴルフ場でよく見かけるカナダグース。🦆
のんびり芝生を歩いている姿を見ると、昔からそこにいた鳥のように見えます。
しかし実は、北米のカナダグースには少し意外な歴史があります。
かつては狩猟や生息環境の変化で数が減り、地域によっては保護や再導入の対象になりました。
ところがその後、人間が作った公園、池、ゴルフ場、芝生の景観にうまく適応し、今では都市部に一年中住み着く群れも珍しくありません。
以前カナダのバンクーバーカナダグース渋滞が起きていたのを思い出しました。
だれも急かさず、怒ることなく、ただただ通り過ぎていくのをみんなが見守っていたのを覚えています。
つまりカナダグースは、守るべき野生動物から都市環境に適応しすぎた存在へと立場を変えてきた鳥でもあります。
この変化は、AIインフラにも少し重なります。
使いやすい環境が整えば、利用は一気に広がる。
けれど、その先では制御すべき問題 が表に出てきます。
先週のニュースレターを見逃した方はこちら
Weekly Newsletter #265: AI インフラの主戦場は、GPUの数から「使い切る力」へ。Aria Networks の大型調達、AI 生成ゼロデイ、Apple–Intel の製造委託、Cerebras のIPO を手がかりに、ネットワーク・半導体・セキュリティと、シリコンバレーで起きている変化を読み解きます。
Weekly Newsletter #264: Amazon がGlobalstar を$116億で取り込みD2D 衛星戦争に参戦、米国防総省はAI 8社と機密契約を結びAnthropic を除外、ServiceNow はKnowledge 2026で"AI Control Tower" を全面に実行レイヤーの覇権を主張。今週はモデルではなく、その上下を握る基盤の主導権争いが揃った週でした。
利益率に直結する「推論コスト」 - DeepInfra の調達に見る推論専用クラウド市場の今
Photo: Unsplash(@heyquilia)
📚 トピックのポイントを3 行で
DeepInfra がシリーズB で1 億700 万ドル(約160 億円) を調達
同社は週あたり約5兆トークンを処理する推論専用クラウドを運営
推論API 市場ではFireworks AI やTogether AI が競合
AI の推論に特化したクラウド基盤を手がけるDeepInfra が、5月4日にシリーズB で1 億700 万ドル(約160 億円: $1=150 円換算) を調達したと発表しました。
500 Global とGoogle の初期エンジニアの一人Georges Harik が共同で主導し、NVIDIA やSamsung Next、Supermicro も名を連ねています。
ここで気になるのは、「GPU クラウドならCoreWeave、推論ならBaseten という名前はすでに聞いたことがある。DeepInfra は何が違うのか。」という点ではないでしょうか?
3 社はまとめてAI インフラと呼ばれがちですが、引き受けている責任の範囲が違います。
CoreWeave は、GPU そのものを時間貸しするGPU クラウドに近く、利用者は自分でモデルを載せて動かします。
Baseten は、利用者が自社で用意したモデルを本番運用するための推論PaaS で、デプロイやオートスケールの面倒を引き受けます。
これに対してDeepInfra は、すでにホスト済みのオープンソースモデルをAPI 経由で呼び出すだけで使える推論API 基盤が主です。
利用者はGPU もモデルの運用も意識せず、リクエストを投げてトークンを受け取るだけで済みます。
同じ領域にはFireworks AI やTogether AI もいて、オープンソースモデルの推論API という市場が静かに立ち上がっています。
なぜ今、この推論専用が増えているのでしょうか?
2025年半ばくらいまで(主観)、AI インフラの主役は学習で語られがちでした。
巨大なGPU クラスターでモデルを鍛える話が中心で、推論はその後工程の地味な存在でした。
ところが生成AI が実際の業務に組み込まれ始めると、動かし続けるための推論のほうが圧倒的に量が多くなります。
DeepInfra は週あたり約5 兆トークンを処理しているといい、膨大な推論の需要を示しています。
チャットだと1つのリクエストに対し1つのレスポンスが帰ってくるので、LLM に入力がそのままいっているのかなと想像してしまいます。
しかし実際にはチャットを含むAI アプリやAI エージェントは、ユーザーの1 回の操作の裏で何度もモデルを呼び出します。
エージェントが自律的に調べ物をして手順を踏むようなワークフローでは、1 タスクあたり数十回の呼び出しになることも珍しくありません。
呼び出すたびにトークンが消費され、そのトークンには単価があります。
つまり、AI を組み込んだサービスの提供者視点に立つと、機能の良し悪しだけでなく1 ドルあたり何トークンを生み出せるか が粗利に直結します。
競争軸はGPU をどれだけ多く持つか から、持っているGPU をどれだけ効率よくトークンに変換できるかへと広がってきました。
DeepInfra が自前のGPU を米国内の複数データセンターで保有し、スポット調達に頼るより構造的に安く、レイテンシも読みやすいと主張しているのは、まさにこの一点で勝負しているからのようです。
もっとも、すべてをこうしたAPI 型基盤に寄せればよいわけではなさそうです。
実務では、PoC やモデル比較のようにとにかく速く試したい場面ではDeepInfra のようなAPI 型基盤、統制やコンプライアンスを重視する本番運用ではAWS のBedrock やMicrosoft のAzure、Google のVertex AI、自社モデルをしっかり運用したい場面ではBaseten のようなPaaS、という使い分けが現実的に見えてきます。
今回の調達で印象的なのは、金額そのものより、推論というレイヤーが独立したインフラ市場として成立し始めたことを示している点だと感じました。
AI を組み込んだサービスの収益性が推論コストに左右される時代に、このレイヤーを誰がどう押さえるのかは、日本企業がAI サービスの採算を設計するうえでも見過ごせない論点になりそうです。
参考文献
Deepinfra lands $107M in funding to build out its dedicated inference cloud for open-source models - SiliconANGLE https://siliconangle.com/2026/05/04/deepinfra-lands-107m-funding-build-dedicated-inference-cloud-open-source-models/
AI cloud DeepInfra raises $107m in Series B funding round - DataCenterDynamics
https://www.datacenterdynamics.com/en/news/ai-cloud-deepinfra-raises-107m-in-series-b-funding-round/DeepInfra Raises $107M Series B to Scale Inference Infrastructure - DeepInfra Blog
https://deepinfra.com/blog/deepinfra-series-b
最新AI チップの輸出は「武器」になった - 米議会が進める3つの規制法案
Photo: pixabay(@diarypow)
📚 トピックのポイントを3 行で
下院外交委員会が5月、AI チップ輸出規制の法案群を可決
AI OVERWATCH Act はBlackwell の懸念国向け輸出を禁じる内容を含む
ホワイトハウスは対中H200 輸出を容認しており議会と対立している
最新のAI チップを、もはや戦闘機やミサイルと同じ武器として扱う。
そんな発想の転換が、米議会で形になりつつあります。
ホワイトハウスがNVIDIA のH200 の対中輸出を、25%を米国に納めることを条件に容認した一方で、議会側はむしろ規制を締め上げる方向に動いています。
5月中旬、下院外交委員会(House Foreign Affairs Committee) は、AI 半導体の輸出規制に関する一連の法案を可決しました。
中心にあるのが3 つの法案です。
1 つ目のAI OVERWATCH Act は、中国やイラン、北朝鮮、ロシアなど懸念国向けの輸出ライセンスが承認された後に30 日間の停止期間を設け、その間に議会が審査して差し止められるようにするものです。
報道によれば、NVIDIA のBlackwell チップの輸出禁止も含まれており、委員会では42 対2 の賛成多数で可決されました。
2 つ目のChip Security Act は、AI 用半導体が承認された場所に留まっているかを企業に検証させ、敵対国への密輸や横流しを防ぐ狙いです。
3 つ目のMATCH Act は、半導体の製造装置や部品そのものへの多国間規制で、中国が自前で先端チップを作れないよう抜け穴を塞ぐことを目指しています。
象徴的なのは、これらが先端半導体の輸出を兵器の売却と同じ枠組みで捉えている点です。
武器輸出のように、議会が事後に介入して止められる仕組みを作ろうとしています。
一方でホワイトハウスのAI 担当David Sacks は、こうした議会の動きを
大統領の権限を損なう
として反対しており、行政府と議会のねじれが当面の焦点になりそうです。
日本にとって他人事ではないのが、MATCH Act のような多国間規制です。
先端チップの製造装置ではASML や東京エレクトロンといった日欧の企業が要となっており、対中規制が同盟国の協調を前提に組まれれば、日本の装置・部品メーカーや、それを扱う商社・SI にも影響が及びます。
規制が技術の進歩に追いつけるのか、それとも抜け道が先に広がるのか。
チップという物理的なモノを握ることがどこまで効くのかは、これから何度も問われていきそうです。
参考文献
Chip export bill advances in House Foreign Affairs - Roll Call https://rollcall.com/2026/01/21/chip-export-bill-advances-in-house-foreign-affairs/
US House Foreign Affairs Committee advances bill to give Congress AI chip export authority - DataCenterDynamics https://www.datacenterdynamics.com/en/news/us-house-foreign-affairs-committee-advances-bill-to-give-congress-ai-chip-export-authority/
AI export controls are not the best bargaining chip - Chatham House https://www.chathamhouse.org/2026/04/ai-export-controls-are-not-best-bargaining-chip
侵入経路の主役が脆弱性に交代 - 実際の侵害データの分析が明らかにした攻撃トレンドの変化
Screeshot: phxintel.security より
📚 トピックのポイントを3 行で
脆弱性の悪用が侵入経路の31%を占め、初めて首位に
パッチ適用完了までの中央値は32日から43日に
脆弱性の公開から悪用までの猶予が数か月から数時間に短縮
攻撃者がシステムに最初に侵入する手口の主役が、19年ぶりに交代しました。
Verizon が毎年公開しているData Breach Investigations Report(DBIR) は、世界中の法執行機関やインシデント対応企業から集めた実際の侵害データを分析する報告書で、2008年の初版以来、セキュリティ業界の定点観測として読まれてきました。
5月19日に公開された2026年版で、長年トップだった認証情報の窃取がついに首位から滑り落ちました。
代わって最大の侵入経路になったのが、ソフトウェアの脆弱性の悪用です。
2025年のデータ侵害のうち約31% が脆弱性の悪用から始まっており、DBIR19年の歴史で初めて、認証情報の窃取(13%) を上回りました。
分析対象も急増しています。
インシデントは3万1000件、確認された侵害は2万2000件超と、前年の1万2195件からほぼ倍増しました。
さらに深刻なのが、守る側のパッチ適用が追いついていないことです。
完全なパッチ適用までの期間は中央値で前年の32日から43日に伸び、CISA が悪用が確認された脆弱性としてまとめるKEV カタログのうち、実際に修正できたのは26%にとどまりました。
これは前年の38%から下がっており、脆弱性の増加スピードにパッチ適用が追いついていないことを明確に示しています。
背景にあるのは生成AI です。
脆弱性が公開されてから実際に悪用されるまでの猶予は、かつての数か月から数時間へと縮みました。
攻撃者は平均で15 種類、多いケースでは50 種類もの攻撃手法にAI を取り入れているといいます。
パスワードを盗まれないよう注意する、という従来型の発想だけでは守りきれない時代に入ったといえそうです。
通信事業者やクラウド基盤を運用する企業、複雑な分散環境を抱える組織にとって、パッチ適用をときどきやる作業ではなくリアルタイムの規律として組み込み直すことが、これまで以上に求められています。
次の番外編ショートトピックで触れるサプライチェーン攻撃も含め、AI が攻める側と守る側の双方の能力を加速させているものの、防御側の活用が後手に回っている現実があります。
参考文献
Verizon DBIR 2026: Vulnerability Exploitation Overtakes Credential Theft as Top Breach Vector - SecurityWeek
https://www.securityweek.com/verizon-dbir-2026-vulnerability-exploitation-overtakes-credential-theft-as-top-breach-vector/Vulnerability exploitation top breach entry point, 2026 industry-wide DBIR finds - Verizon
https://www.verizon.com/about/news/breach-industry-wide-dbir-findsVerizon DBIR: Vulnerability exploitation is the dominant initial access vector - Help Net Security
https://www.helpnetsecurity.com/2026/05/20/verizon-2026-dbir-findings/
📎 番外編ショート: GitHub のプライベートリポジトリが大規模侵害
開発者にとって背筋が寒くなるニュースが続いています。
GitHub は、内部リポジトリ約3,800 件が侵害された件を調査していると明らかにしました。
公開されているコードだけでなく、本来は外部から見えないはずのプライベートリポジトリまで含まれていた点が衝撃を呼んでいます。
侵入の起点になったのは、先週起きたTanStack というnpm パッケージのサプライチェーン攻撃で汚染された、Nx Console のVS Code 拡張機能でした。
開発者が普段当たり前のように使っているエディタの拡張機能が踏み台になったかたちです。
同じ汚染では、OpenAI やMistral AI、Grafana Labs も影響を受けたと報じられています。
怖いのは、自分が直接ミスをしていなくても、使っているライブラリやツールのサプライチェーンのどこか一点が破られると、間接的に被害が及ぶ点です。
これまで意識されてきたのは本番環境やパッケージそのものでしたが、いまや開発ツールチェーン、しかも手元のエディタ拡張までが攻撃面になっています。
最近は個人的にもCodex やClaude Code を使っていますが、楽しさと共に人間のボトルネックを感じます。
それ故ついつい権限を移譲し、大した精査もせずに進めてしまう場面もあり、何を信頼して入れているかを、改めて棚卸しするタイミングなのかもしれないと感じました。
参考文献
最後までお読みいただきありがとうございます!
励みになりますので、ぜひLikeボタン (♡) をお願いします!








