今週は、AI エージェントの構築や展開のあり方を大きく変えつつある、新たなオープンスタンダード「Skills」に注目してみたいと思います。
Skillsとは
Skills とは、特定タスクの処理手順や関連知識を、AI エージェントが利用しやすい形に体系化したパッケージです。AI が処理を行う前に読み込む「手順書」のような存在で、ワークフロー、参考資料、スクリプト、テンプレートなどを、コードとともにフォルダとしてまとめた構成になっています。
Agent Skills の仕様は、2025 年 12 月に Anthropic によって公開され、Claude、OpenAI Codex、GitHub Copilot、Cursor など、複数のエージェントプラットフォームで採用されています。Microsoft、Atlassian、Figma、Canva なども、それぞれのプラットフォーム向けにSkillsを構築しています。
Skillsの構成例
invoice-processor/
├── SKILL.md ├── SKILL.md # ワークフローと手順
├── references/
│ ├── field-mappings.md # 想定されるデータ構造
│ └── validation-rules.md
└── scripts/
└── extract_data.py # 補助ツール
スキルの中核となるのが SKILL.mdです。以下は、このファイルを簡単に説明したものです。
—
name: invoice-processor
description: 請求書 PDF からデータを抽出・検証します。仕入先請求書、経費精算書、支払関連書類を処理する際に使用します。
name: invoice-processor
description: 請求書 PDF からデータを抽出・検証します。仕入先請求書、経費精算書、支払関連書類を処理する際に使用します。
---
# Invoice Processing
## Workflow
1. `scripts/extract_data.py` を使って請求書 PDF を読み込む
2. ベンダー名、請求書番号、日付、明細、合計金額を抽出する
3. `references/validation-rules.md` に定義されたルールで検証する
4. `references/field-mappings.md` のスキーマに従った JSON として出力する
## Guidelines
- 明細の合計が総額と一致しない場合はフラグを立てる
- ベンダーが承認済みリストにない場合は「要確認」とする
- 元の通貨情報は必ず残し、日本円への換算は別のフィールドに出力する
必要な情報はこれだけです。AI モデルは SKILL.md を読み込むことで、description からSkillsの使用タイミングを理解し、定義されたワークフローに従って処理します。references フォルダには、必要に応じて読み込まれる仕様の詳細が格納されています。
こうすることで、AI モデルは長いプロンプトを与えなくても、関連ファイルを読み込んでドメインを理解し、安定した処理を実行できるようになります。エージェントがタスクの処理に必要な情報だけを段階的に読み込むこの考え方は、Anthropic では「プログレッシブ・ディスクロージャー」と呼んでいます。
3つの重要な変化
- 無駄な再開発をしない
今日のアプリケーション開発では、自社にはない動きの実装に、何カ月も時間をかけている開発者が少なくありません。AI は PDF をどう処理し、Word 文書を生成し、カスタマーサポートのチケットを処理すべきでしょうか。
Skills を使えば、こうした一般的な知識を共通化できます。たとえば、ドキュメント生成の Skills に成功事例をコード化しておけば、どの AI エージェントでも、ファイルを読み込むだけで高品質な出力を行えるようになります。その結果、チームはライブラリ固有の挙動を再確認するのではなく、自社ならではの実装に集中できます。
Skills はオープンスタンダード化されているため、再利用も簡単です。同じ Skills を、Claude、OpenAI Codex、Gemini CLI、VS Code のエージェントモード、ChatGPT、Cursor など、複数の環境でそのまま利用できます。また、Skills Marketplace にはコミュニティによって作成された Skills が 70,000 以上登録されており、特定のベンダーに依存する必要もありません。
例:小規模言語モデル(SLM)は、データ抽出ロジック、検証ルール、出力スキーマを定義した請求書処理用 Skills を読み込むだけで、追加の学習を行うことなく、1 時間あたり数千件の請求書を安定して処理できます。
- 業務ノウハウをパッケージ化する
社内業務においても、同じ考え方が当てはまります。企業独自のノウハウ、たとえば、固有の業務フロー、コンプライアンス要件、社内ポリシーなどは、プライベートな Skills としてエンコードできます。
例:法務部門が、承認フロー、条文テンプレート、リスク判定パターンを含む契約書レビュー用のSkillsを作成した場合、新入社員(AI エージェントを含む)も初日から同じ基準で業務を行えます。ポリシーが変更されても、更新は 1 ファイルで済みます。
この手法は、一貫性や監査性が重視される規制産業において、特に有効です。Skills は単なるファイルであるため git で管理でき、すべての変更履歴を追跡・レビュー・監査できます。Skills そのものが、ドキュメンテーションとして機能します。
- 小さなモデルで、大きな成果を
ここからは、インフラの観点で特に重要なポイントを見ていきましょう。
Skills を活用することで、モデルにかかる推論負荷を大きく下げることができます。大規模モデルがゼロからワークフローを推測するのではなく、小規模モデル(およそ 10 億~100 億パラメータ)が、あらかじめ定義された具体的な手順に従って処理を行えるようになるためです。NVIDIA によると、この組み合わせにより、エンタープライズタスクの 40~70% を、10~30 倍低いコストで処理できるとされています。
出展: NVIDIA Research on SLM Agentsおよび IBM Small Language Models Study に基づくコスト試算
| ユースケース | Skills が提供するもの | SLM の役割 |
|---|---|---|
| チケット振り分け | 分類スキーマ、ルーティングルール、返信テンプレート | 解析・分類・振り分け:1,000 件あたり約 $0.10(参考値、NVIDIA による 10~30 倍の推論コスト差に基づく) |
| データベース検索 | スキーマ定義、クエリパターン、検証ルール | 自然言語から SQL への変換をサブ秒で実行 |
| ログ解析 | エラーパターン、重要度分類、ランブック参照 | エッジ環境でのリアルタイムな分類 |
考え方の本質は、限定的なスコープ、構造化された入出力、そして決定論的な検証にあります。Skills が定義した処理の制約条件に従って、小規模モデルが処理を実行します。
IBM の研究でも、小規模モデルとエンタープライズデータを組み合わせることで、特定のタスクにおいては、大規模モデルに匹敵する性能を 3~23 倍低いコストで実現できることが示されています。こうした背景から、1 つの巨大モデルですべてを処理する構成から、特定のスキルを持つ小規模モデル群を組み合わせた本番アーキテクチャへと移行が進みつつあります。
インフラへの今後の影響
2024~2025 年にかけての AI の取り組みは、巨大な GPU クラスターやペタバイト級のデータ、数カ月に及ぶ学習ジョブなど、「学習(トレーニング)」が中心でした。この潮流は続いているものの、その状況は少しずつ変わり始めています。
推論が、ワークロードの中心になりつつあります。
Deloitte によると、2026 年には AI コンピュート全体の約 3 分の 2 を推論が占める見通しで、その比率は 2023 年の約 3 分の 1 から大きく拡大します。また、推論向けチップ市場だけでも、規模は 500 億ドルを超えると見込まれています。VAST Data は、2026 年を「AI 推論ビジネスが本格的に加速する年」と位置付けています。
業務ごとに特化した AI エージェントを数多く展開する場合、以下のように、従来とは異なるインフラ要件が求められます。
- バッチサイズよりもスループットを重視:少量の大規模ジョブではなく、多数の小さなリクエストを同時に処理
- 低レイテンシ:対話型ワークフローにおいて、サブ秒で応答するエージェント
- 柔軟なスケーリング:月末には請求書処理能力を拡張し、処理後は縮小
- データ主権:Skills にエンコードされた業務知識を、自社インフラの外に出さない
ルーティングには、RouteLLM、vLLM Semantic Router、NVIDIA LLM Router など、実運用に基づくルーターパターンを使用。KubeRay はオーケストレーションとして機能。
トレーニングの重要性は、新しいモデルの作成やファインチューニングでは今後も変わりません。一方で、多くの企業では、日常的に利用される AI ワークロードの中心が、特化型エージェントによる推論へと移りつつあります。
Midokura が担う役割
こうした環境こそが、当社が描く AI Factory ソフトウェアの利用シーンです。
Midokura は、GPU サーバーを企業が自ら管理・制御できるプライベートインフラとして活用できるよう設計されています。IaaS レイヤーでは、標準 API を通じてベアメタル GPU リソースを柔軟にプロビジョニングできます。さらに PaaS レイヤーでは、Kubernetes 上で KubeRay のような AI ネイティブなプラットフォームを活用し、推論エージェント群のオーケストレーション、デプロイ、スケーリングを担います。
Skills × SLM が自然にフィットする理由
数カ月ではなく、数日で。主権を保った AI 環境を構築し、自社ドメインの Skills を読み込めば、そのまま本番運用に移行できます。ファインチューニングも学習基盤も、データセンターに関する専門知識も必要ありません。
高いリソース効率。
Skills を活用した小規模モデルは、必要とする計算資源がごくわずかです。同じハードウェア上により多くのエージェントを展開することも、最初から適切な規模でインフラを設計することも可能です。KubeRay が、需要に応じて各エージェントを個別にスケーリングします。
知識を社外に出さない。
独自の業務フローを含む Skills は、自社の管理下で実行されます。そのため、これまで築いてきた競争優位性が、他社のモデルの学習データとして使われることはありません。
トレーニングから推論への移行は、もはや予測ではありません。すでに現実のものとなっています。Skills は、AI 活用において主導権を手放したくない企業にとって、この移行を現実的に進めるための手段となります。
オープンスタンダード、効率的な小規模モデル、そして専用設計のインフラ。この 3 つが組み合わさることで、これまでハイパースケールな学習投資を正当化できなかった組織にとっても、主権を保った AI エージェントが、手の届く存在になりつつあります。
2026 年は、大きな転換点となる年になりそうです。
本記事で参照したリンク
- Agent Skills Specification
- Agent Skills GitHub Repository
- Anthropic: Equipping Agents with Skills
- The New Stack: Agent Skills as Open Standard
- NVIDIA Research: Small Language Models are the Future of Agentic AI
- IBM: Power of Small Language Models
- Deloitte: AI Compute Predictions 2026
- VAST Data: 2026 The Year of AI Inference
- KubeRay: Ray on Kubernetes