Ollama学习3:环境变量、日志
·
环境变量
| 参数 | 标识与配置 |
|---|---|
| OLLAMA_MODELS | 拉取的模型存放位置,建议必须修改调整,要不然撑爆系统C盘 |
| OLLAMA_HOST | 可以允许外部访问的IP地址,默认只能本127.0.0.1,如果需要支持外部访问,需调整成0.0.0.0 == 0.0.0.0:11434 修改需要重启 |
| OLLAMA_PORT | API的端口号,默认11434 |
| OLLAMA_ORIGINS | HTTP客户端的请求来源,用于配置跨域资源共享(CORS)如果本地使用不受限制,可以设置成星号* |
| OLLAMA_KEEP_ALIVE | 单位(秒)大模型加载到内存中后的存活时间 默认300,0代表处理请求响应后立即卸载模型,任何负数则表示一直存活 |
| OLLAMA_NUM_PARALLEL | 请求处理的并发数量,默认为1 |
| OLLAMA_MAX_QUEUE | 请求队列长度,默认值为512 == 请求一旦超过这个项目就报错503 |
| OLLAMA_DEBUG | 输出 Debug 日志,应用研发阶段可以设置成1(即输出详细日志信息,便于排查问题) |
| OLLAMA_MAX_LOADED_MODELS | 最多同时加载到内存中模型的数量,默认为1 |
| ANTHROPIC_AUTH_TOKEN | ClaudeCode兼容性API ollama |
| ANTHROPIC_API_KEY | ClaudeCode兼容性API密钥 |
| ANTHROPIC_BASE_URL | ClaudeCode兼容性API请求前缀 http://localhost:11434 |
| OLLAMA_CONTEXT_LENGTH | 每次对话的最大上下文长度,默认4096,如果使用agent或者编码官方建议64000 |
| HTTPS_PROXY | 设置代理服务器,进行拉取远程的模型文件 |
| OLLAMA_FLASH_ATTENTION | 是否启用高效计算注意力机制的算法,通过减少 GPU 内存访问次数和优化计算流程,提升推理性能 启用则设置1 |
日志
Windows
//近期的 模型服务 日志
explorer %LOCALAPPDATA%\Ollama
// 浏览二进制文件,我也不知道是啥,运行了没看到有东西
explorer %LOCALAPPDATA%\Programs\Ollama
// 浏览模型和配置的存储位置
explorer %HOMEPATH%\.ollama
// 临时可执行文件存储在一个或多个ollama* 目录中
explorer %TEMP%


更多推荐
所有评论(0)