Ollamaとは？LM Studio・vLLMとの比較とGPT-OSSをローカルで動かす方法

トップページ

ブログ

OllamaでOpenAIのgpt-ossをローカルLLMとして動かす方法を解説。インストール手順、セキュリティ、具体的なユースケースまで網羅し、安全かつ柔軟に社内や開発環境で活用するポイントを紹介します。

山﨑祐太

代表取締役

2025年08月16日

Ollama とは？ローカルLLMプラットフォームの全体像
Ollama の概要
Ollama の特徴 - LM Studio や vLLM との違い
Ollama がセキュリティ的に安全な仕組み
Ollama の具体的なユースケース
社内情報の安全な活用
開発環境での高速プロトタイピング
ネットワーク制限下でのAI活用
カスタムモデルの社内展開
OpenAI GPT-OSS とは？
Ollama をインストールして gpt-oss を動かす
1. Ollama のインストール
2. Ollama で gpt-oss-20b を動かす
3. Ollama の OpenAI互換のAPIを使う
まとめ

これまでに、 LM Studio を用いて gpt-oss をローカルLLMとしてを動かす情報について発信してきました。

今回は Ollama を用いて手軽に手元の環境でローカルLLMを動かす方法について、先日OpenAI社が公開した gpt-oss-20b を用いて試してみます。

ディジョンはお客様のクラウド環境やオンプレ環境で、ローカルLLMをセキュアに動かす「ローカルLLM構築サービス」を提供しています。

Ollama とは？ローカルLLMプラットフォームの全体像

Ollama の概要

Ollamaは、高性能なオープンソース大規模言語モデル（LLM）を、手元のPCや社内サーバーで手軽に起動・管理できるローカルAIプラットフォームです。

プライバシー重視の企業や個人に適しており、LLMとのやり取り自体はインターネット非依存かつ機密性の高いAI活用を実現できます。

対応モデルには、

Meta Llama
Google Gemma
DeepSeek‑R1

などがあり、先日このラインナップに、OpenAI社が公開した gpt-oss が追加されました。

Ollama の特徴 - LM Studio や vLLM との違い

まとめ

Ollamaはローカルで使える汎用性と簡単さのバランス重視
LM Studioはとにかく簡単に試したいユーザー向け
vLLMは高負荷・大量アクセス環境での運用特化

類似サービスには先日記事を公開した LM Studio や vLLM などがあります。

Ollama の最大の特徴は LM Studio に近く、手元のパソコンやサーバーで手軽に試しやすいという点です。CLIツールだけではなく、GUI版の提供もあり、コマンド操作に慣れない人でも画面上の操作で簡単にローカルLLMを試すことができます。

それに対する LM Studio は CLI の提供はなく、手軽にローカルLLMを動作させることに特化したツールである点が特徴です。

そして vLLM はパフォーマンスに最適化されており、重いモデルを高いパフォーマンス（特に実行速度）で動かす能力が特徴です。使い道としては、Ollama や LM Studio で手軽に検証して実際に本番環境でローカルLLMを構築しようというケースに最適化されたツールです。

Ollama と LM Studio との比較記事を公開していますので、詳しくはこちらもご覧ください。

Ollama vs LM Studio ローカルLLMツールの特徴・使いやすさ・選び方ガイド

Ollama がセキュリティ的に安全な仕組み

Ollama は LM Studio と同様に、モデルのダウンロードなどにおいてはインターネット環境を使用します。

一度ダウンロードしたモデルについては、その後はインターネットへの接続なしに、メッセージのやり取りができるので、データがどこかに流出するという懸念はありません。

Ollama はアプリのインストールと起動が完了した段階で、 localhost のポート 11434 でサーバーが起動しています。

モデルダウンロード後にここへ必要なリクエストを送信することで、OpenAIのChat Completion API互換のローカルAPIとしても動きます。

この辺りの仕組みも含めて、 LM Studio と同様のようなアプリケーションとなっています。

Ollama の具体的なユースケース

社内情報の安全な活用

多くの企業では、顧客情報や機密資料を外部のクラウドAIに送信することに対して強い懸念があります。

Ollamaを使えば、社内サーバーや閉域ネットワーク内でモデルを稼働させられるため、情報漏えいリスクを最小化できます。

例えば、社内マニュアルの検索や、契約書の要約・比較といったタスクを安全に自動化可能です。

開発環境での高速プロトタイピング

ローカル環境で直接モデルを動かせるため、APIの呼び出し制限や料金を気にせずに試作を繰り返せます。

フロントエンド・バックエンド両方のエンジニアが同じ環境でテストできるため、開発サイクルの短縮に貢献します。

特にOllamaのOpenAI互換APIは、既存のChatGPT向けコードをほぼそのまま流用できる点が大きな利点です。

ネットワーク制限下でのAI活用

工場・病院・官公庁など、一部の業務環境ではインターネット接続が制限されているケースがあります。

こうした場所でも、Ollamaでモデルを事前ダウンロードしておけば、オフライン状態で推論を実行できます。

結果として、現場作業員や研究員がネット接続を待たずにAIの補助を受けられます。

カスタムモデルの社内展開

Ollamaは標準モデルだけでなく、LoRAやFine-tuningを行ったカスタムモデルもローカルで動かせます。

これにより、業界固有の専門用語や社内ルールを反映した独自AIを構築し、全社員が同一品質の支援を受けられます。

また、モデルの切り替えや更新も社内で完結するため、セキュリティ監査や運用管理も容易です。

OpenAI GPT-OSS とは？

GPT-OSS はOpenAI社が発表したオープンウェイトなLLMであり、 gpt-oss-20b と gpt-oss-120b の2つのモデルが提供されています。

Meta Llama や Google Gemma などが、オープンLLMの先行プレイヤーとして存在していましたが、 gpt-oss が発表されたことにより、 OpenAI の o3-mini や o4-mini レベルのモデルが使えるようになりました。

これによってローカル環境や自社のサーバーでLLMを動かすときの最有力の選択肢になってきています。

gpt-oss について詳しくは OpenAI GPT-OSS の概要と性能を確認した記事を公開していますので、ぜひご参照ください。

Ollama をインストールして gpt-oss を動かす

1. Ollama のインストール

Ollama は公式のダウンロードページからダウンロード・インストールできます。

対応OSは、 Windows / Mac / Linux であり、それぞれに合わせたバージョンのアプリをインストールしてください。

インストールが完了すると、CLIとGUIの両方のインストールが完了した状態になります。アプリを起動すると以下のような画面が表示されます。

そしてターミナルを開くと、こちらもインストールが完了していることが分かります。

2. Ollama で gpt-oss-20b を動かす

先ほどの画面の右下のモデル選択部分で「gpt-oss-20b」を選択し、そのままメッセージを送信します。すると必要なモデルのダウンロードが始まります。

ダウンロードが完了すれば、先ほどのメッセージの回答を受け取ることができます。

3. Ollama の OpenAI互換のAPIを使う

Ollama は先述の通り、ローカルにAPIサーバーを立ててくれます。

このAPIはOpenAIに互換性のあるライブラリを提供しており、OpenAI Python SDK をそのまま利用することができます。

import openai

client = openai.OpenAI(
    base_url = "http://localhost:11434/v1",
    api_key="my-api-key",  # str型なら何の値でもOK
)

response = client.chat.completions.create(
    model="gpt-oss:20b",
    messages=[
        {"role": "system", "content": "あなたは優秀なアシスタントです。"},
        {"role": "user", "content": "こんにちは、あなたについて教えてください。"},
    ]
)

print(response.choices[0].message.content)

上記のコードを実行すると、以下の結果を受け取れました。

こんにちは！  

私は**ChatGPT**、OpenAIが開発した大規模言語モデルです。  

- 文章の生成・補完、質問への回答、情報整理、翻訳など、テキストに関するさまざまなタスクを行えます。  

- 日常会話から専門的な話題まで幅広く対応できるように設計されています。  

- 学習データは2023年11月までの情報を元にしていますが、リアルタイムの出来事や個人情報は持っていません。  

  

何か知りたいことがあれば、遠慮なく聞いてくださいね！

これによって、ローカルLLMをAPI経由で簡単に検証できます。