安装ollama
ollama是一种本地大模型管理工具
brew install ollama --cask |
常见的 ollama 指令有:
ollama list:显示模型列表。 |
当使用ollama serve
指令后,显示如下信息:
2025/03/26 13:23:33 routes.go:1230: INFO server config env="map[HTTPS_PROXY: HTTP_PROXY: NO_PROXY: OLLAMA_CONTEXT_LENGTH:2048 OLLAMA_DEBUG:false OLLAMA_FLASH_ATTENTION:false OLLAMA_GPU_OVERHEAD:0 OLLAMA_HOST:http://127.0.0.1:11434 OLLAMA_KEEP_ALIVE:5m0s OLLAMA_KV_CACHE_TYPE: OLLAMA_LLM_LIBRARY: OLLAMA_LOAD_TIMEOUT:5m0s OLLAMA_MAX_LOADED_MODELS:0 OLLAMA_MAX_QUEUE:512 OLLAMA_MODELS:/Users/xxl/.ollama/models OLLAMA_MULTIUSER_CACHE:false OLLAMA_NEW_ENGINE:false OLLAMA_NOHISTORY:false OLLAMA_NOPRUNE:false OLLAMA_NUM_PARALLEL:0 OLLAMA_ORIGINS:[http://localhost https://localhost http://localhost:* https://localhost:* http://127.0.0.1 https://127.0.0.1 http://127.0.0.1:* https://127.0.0.1:* http://0.0.0.0 https://0.0.0.0 http://0.0.0.0:* https://0.0.0.0:* app://* file://* tauri://* vscode-webview://* vscode-file://*] OLLAMA_SCHED_SPREAD:false http_proxy: https_proxy: no_proxy:]" |
Listening on 127.0.0.1:11434 (version 0.6.2)"
表示ollama serve
正在监听127.0.0.1:11434
端口。library=metal
表明 Ollama 正在使用 Metal 框架进行 GPU 加速 (Metal 是 Apple 平台的 GPU 框架)。
total="48.0 GiB"
表示你的 GPU 总共有 48 GB 显存。available="48.0 GiB"
表示目前有 48 GB 显存可用。
安装并运行大模型
在 https://ollama.com/search 中可以选择想要的大模型
以gemma3:27b
为例,下面指令会运行gemma3:27b
,如果没有安装就会先安装。
ollama run gemma3:27b |
运行成功后显示:

安装大模型前端UI工具
以chatbox
为例,这是一个 GUI app:
brew install chatbox --cask |
安装完成之后,配置一下api,即可使用:
