热门搜索:和平精英 原神 街篮2 

您的位置:首页 > > 教程攻略 > ai教程 >本地大模型部署笔记:Ollama+Qwen2.5+Win11环境配置实录

本地大模型部署笔记:Ollama+Qwen2.5+Win11环境配置实录

来源:互联网 更新时间:2026-06-08 07:14

本地大模型部署笔记:Ollama+Qwen2.5+Win11环境配置实录

0、前言

先说几个核心判断:本地部署大模型,Ollama确实是当前最轻量的选择之一,配上Qwen2.5,在Win11上跑起来相当丝滑。而且最诱人的一点——不需要独立显卡也能跑,隐私安全也完全在自己手里。整篇文章会围绕这样几个关键点展开:Ollama怎么装、Modelfile怎么配、ModelScope怎么用、Notebook是什么角色,以及最终怎么通过API调通这个大模型。 本地大模型部署笔记:Ollama+Qwen2.5+Win11环境配置实录 通过这次部署,你会清楚: - Ollama 是干什么的,怎么装怎么用; - Modelfile 长什么样,怎么配置; - ModelScope 扮演什么角色; - Notebook 在什么场景下派上用场; - 这些工具怎么组合,部署成功后怎么通过API调用。

1、环境与准备

实践出真知,先亮一下我的实验台配置: - Win11:Windows 11 专业版 25H2 - CPU:Intel(R) Core(TM) i7-8750H CPU @ 2.20GHz (2.21 GHz) - 内存:16.0 GB - 显卡:GTX1050Ti(说实话挺鸡肋的,这次的实践过程中基本没用到它) - Ollama:0.17.7 - 大模型: - qwen2.5-3b-instruct-q4_k_m - qwen2.5-7b-instruct-q4_k_m

前置依赖检查

- PowerShell(Win11自带的就够) - Git(可选,用来下载东西) - Python(只有在用ModelScope CLI时才需要,如果只用浏览器下载,可以不装)

2、核心概念速览

2.1、模型文件名 qwen2.5-3b-instruct-q4_k_m.gguf 到底在说什么?

文件名通常长这样:qwen2.5-3b-instruct-q4_k_m.ggufinstruct 表示这个模型经过了指令微调,适合对话场景;如果是 base 版本,那更适合做续写或者二次微调,直接拿来对话效果不太好。 1)q + 数字:代表每个参数用了多少 bit 来存储。 - 数字越小 = 文件越小 = 速度越快 = 自然会笨一点点; - 数字越大 = 文件越大 = 速度越慢 = 理论上更聪明; - 业界共识:4-bit(q4)是性价比最高的选择,智商损失微乎其微,体积却能直接砍半。 2)k:用了 K-quants 量化技术,比老式的 q4_0 更聪明,压缩效率更高。 3)m/s/l:分别代表 Small(小)、Medium(中)、Large(大)。 - q4_k_s:更小一点,稍微笨一点点; - q4_k_m:标准版,平衡最好,首选; - q4_k_l:更大一点,稍微聪明一点点,但对显存的要求也上去了。

2.2、Modelfile 的基本结构与含义

Modelfile 是 Ollama 的“灵魂配置”,它告诉系统模型从哪来、怎么聊、聊什么风格。基本结构长这样:
FROM 
SYSTEM 
PARAMETER  
TEMPLATE