拔掉网线也能问?在 Ubuntu 上用 DeepSeek 打造“绝对隐私”的第二大脑
🔒 核心方案: Ubuntu + Ollama + DeepSeek-R1 + AnythingLLM ⏱️ 部署时间: 约 15 分钟 🏷️ 关键词: 本地部署, RAG, 隐私安全, 知识库
你是否也遇到过这样的尴尬: 想用 AI 润色公司的机密文档,或者整理自己的私人日记,但手指悬在“发送”键上却迟疑了——这些数据会被上传吗?会被拿去训练吗?
在这个大数据“裸奔”的时代,隐私是最后的奢侈品。
今天,我们将利用 Ubuntu 强大的生态,结合最近大火的 DeepSeek-R1 开源模型,手把手教你在本地搭建一个 RAG (检索增强生成) 系统。 最硬核的是:搭建完成后,即使拔掉网线,它依然能精准回答你关于私有文档的任何问题。
🛠️ 为什么是 Ubuntu + RAG?
- RAG (Retrieval-Augmented Generation):简单说,就是给 AI 外挂一个“图书馆”。当你提问时,AI 先去图书馆(你的本地文档)翻书,找到答案后再整理回答给你。
- Ubuntu 的优势:作为 AI 开发的首选 OS,Ubuntu 对显卡驱动(NVIDIA CUDA / AMD ROCm)的支持最完善,且拥有最丰富的 Docker 和 Python 社区资源。
准备工作
- 系统: Ubuntu 22.04 / 24.04 LTS
- 硬件: 建议 NVIDIA 显卡(8GB+ 显存体验最佳),或者 M系列芯片 Mac,纯 CPU 也可以跑(速度稍慢)。
🚀 第一步:地基 —— 部署 Ollama
Ollama 是目前 Linux 上运行大模型最优雅的工具,没有之一。
打开终端,一行命令搞定安装:
curl -fsSL https://ollama.com/install.sh | sh安装完成后,我们需要把“大脑”请回来。这里我们推荐 DeepSeek-R1(性能与推理能力的平衡大师)。 根据你的显存大小选择版本:
# 8G 显存推荐 7b/8b 版本
ollama run deepseek-r1:7b
# 显存较小或纯 CPU 跑,可以尝试 1.5b
# ollama run deepseek-r1:1.5b当看到 >>> 提示符时,试着问它:“你是谁?”。如果它回答流畅,恭喜你,本地 AI 已经跑起来了!
🧠 第二步:海马体 —— 搭建知识库 (AnythingLLM)
光有模型还不够,我们需要一个界面来管理我们的文档,并把它们“喂”给 AI。 AnythingLLM 是一个开源的全栈 RAG 解决方案,支持桌面版 AppImage,非常适合 Ubuntu 用户。
- 下载:去官网下载 Linux 版本的 AppImage 文件。
🔗 下载地址: https://anythingllm.com/desktop
- 运行:bash
chmod +x AnythingLLMDesktop.AppImage ./AnythingLLMDesktop.AppImage - 配置:
- LLM Provider:选择 Ollama。
- Ollama URL:填写
http://127.0.0.1:11434。 - Model:选择刚刚下载的
deepseek-r1:7b。 - Vector Database(向量数据库):直接选择默认的 LanceDB(内置,无需额外安装)。
📂 第三步:投喂数据
现在,见证奇迹的时刻到了。
- 在 AnythingLLM 中创建一个新的 Workspace(例如叫 "My Secrets")。
- 点击上传按钮,把你的 PDF、Markdown 笔记、Word 文档统统拖进去。
- 点击 "Move to Workspace" -> "Save and Embed"。
此刻,系统正在疯狂地将你的文档切片、向量化,并存入本地数据库。这一切都发生在你的硬盘上,没有一个字节流向互联网。
🧪 第四步:断网测试
为了验证绝对的隐私安全,请执行物理操作:拔掉网线(或断开 Wi-Fi)。
现在,在对话框里问一个只有你的文档里才有的问题。 比如,你上传了一份《2026年家庭装修预算表.pdf》,你可以问:
“我客厅的地砖预算是多少?如果不买进口品牌能省多少钱?”
你会发现,AI 不仅准确报出了数字,还根据你的文档内容给出了推理建议!
📝 总结
通过这套 Ubuntu + DeepSeek + AnythingLLM 的组合,我们实现了:
- 数据主权:所有文档不出本地。
- 零成本:软件全部开源免费。
- 高性能:DeepSeek-R1 的推理能力加持,让私有知识库不再是“人工智障”。
在这个 AI 狂飙的年代,拥有一台属于自己的、绝对忠诚且沉默的服务器,或许是极客们最后的浪漫。
下期预告: 嫌界面操作太麻烦?下期教大家用 Python + LangChain 手写代码,给你的终端加上“记忆”!
喜欢本文?点赞、在看、转发,让更多人掌握数据主权!