文章目录

环境变量

参数 标识与配置
OLLAMA_MODELS 拉取的模型存放位置,建议必须修改调整,要不然撑爆系统C盘
OLLAMA_HOST 可以允许外部访问的IP地址,默认只能本127.0.0.1,如果需要支持外部访问,需调整成0.0.0.0 == 0.0.0.0:11434 修改需要重启
OLLAMA_PORT API的端口号,默认11434
OLLAMA_ORIGINS HTTP客户端的请求来源,用于配置跨域资源共享(CORS)如果本地使用不受限制,可以设置成星号*
OLLAMA_KEEP_ALIVE 单位(秒)大模型加载到内存中后的存活时间 默认300,0代表处理请求响应后立即卸载模型,任何负数则表示一直存活
OLLAMA_NUM_PARALLEL 请求处理的并发数量,默认为1
OLLAMA_MAX_QUEUE 请求队列长度,默认值为512 == 请求一旦超过这个项目就报错503
OLLAMA_DEBUG 输出 Debug 日志,应用研发阶段可以设置成1(即输出详细日志信息,便于排查问题)
OLLAMA_MAX_LOADED_MODELS 最多同时加载到内存中模型的数量,默认为1
ANTHROPIC_AUTH_TOKEN ClaudeCode兼容性API ollama
ANTHROPIC_API_KEY ClaudeCode兼容性API密钥
ANTHROPIC_BASE_URL ClaudeCode兼容性API请求前缀 http://localhost:11434
OLLAMA_CONTEXT_LENGTH 每次对话的最大上下文长度,默认4096,如果使用agent或者编码官方建议64000
HTTPS_PROXY 设置代理服务器,进行拉取远程的模型文件
OLLAMA_FLASH_ATTENTION 是否启用高效计算注意力机制的算法,通过减少 GPU 内存访问次数和优化计算流程,提升推理性能 启用则设置1

日志

文档: https://docs.ollama.com/troubleshooting

Windows

//近期的 模型服务 日志
explorer %LOCALAPPDATA%\Ollama


// 浏览二进制文件,我也不知道是啥,运行了没看到有东西
explorer %LOCALAPPDATA%\Programs\Ollama


// 浏览模型和配置的存储位置
explorer %HOMEPATH%\.ollama


// 临时可执行文件存储在一个或多个ollama* 目录中
explorer %TEMP%

在这里插入图片描述

在这里插入图片描述

Logo

这里是“一人公司”的成长家园。我们提供从产品曝光、技术变现到法律财税的全栈内容,并连接云服务、办公空间等稀缺资源,助你专注创造,无忧运营。

更多推荐