Ollama
此内容尚不支持你的语言。
Ollama
Section titled “Ollama”curl -fsSL https://ollama.com/install.sh | sh通过环境变量配置: https://github.com/ollama/ollama/blob/main/docs/faq.md
OLLAMA_HOST: 服务监听地址, 默认127.0.0.1:11434OLLAMA_ORIGINS: 允许的来源, 用于跨域
OLLAMA_HOST=0.0.0.0:11434 OLLAMA_ORIGINS=* ollama serve| 模型 | 大小 | 描述 |
|---|---|---|
llama3.1 | 4.7GB | Meta 最新的开源模型 |
qwen2.5 | 4.5GB | 阿里开源模型, 中文效果好 |
ollama list # 列出本地模型ollama pull <model> # 拉取模型ollama run <model> # 运行模型并进入交互模式ollama serve # 启动 Ollama 服务ollama rm <model> # 删除本地模型API 调用
Section titled “API 调用”Ollama 默认在 http://localhost:11434 提供 API。
生成文本:
curl http://localhost:11434/api/generate -d '{ "model": "llama3.1", "prompt": "你好,请介绍一下你自己", "stream": false}'对话模式:
curl http://localhost:11434/api/chat -d '{ "model": "llama3.1", "messages": [ { "role": "user", "content": "你好,请介绍一下你自己" } ], "stream": false}'OpenAI 兼容 API
Section titled “OpenAI 兼容 API”Ollama 提供 OpenAI 兼容的 API 端点:
curl http://localhost:11434/v1/chat/completions -H "Content-Type: application/json" -d '{ "model": "llama3.1", "messages": [ { "role": "user", "content": "你好" } ]}'与 LangChain 集成
Section titled “与 LangChain 集成”from langchain_ollama import ChatOllamafrom langchain_core.messages import HumanMessage
model = ChatOllama(model="llama3.1")response = model.invoke([HumanMessage(content="你好")])print(response.content)可以通过 Modelfile 自定义模型:
FROM llama3.1
SYSTEM "你是一个专业的编程助手,擅长用简洁明了的方式回答技术问题。"
PARAMETER temperature 0.7ollama create my-assistant -f Modelfileollama run my-assistantWeb UI
Section titled “Web UI”- Open WebUI: 功能丰富的 Web 界面
- ollama-webui: Ollama 官方 Web UI
使用 Docker 启动 Open WebUI:
docker run -d -p 3000:3000 --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main- 使用 GPU 加速: Ollama 会自动检测并使用 NVIDIA GPU
- 调整模型参数:
num_ctx: 上下文窗口大小num_predict: 最大生成 token 数temperature: 生成随机性
model = ChatOllama( model="llama3.1", num_ctx=8192, temperature=0.7)