本系列是AI仓鼠洞针对DeepSeek的从入门到日常应用完成教程，持续更新。本篇【学前班】争取带大家先一次全面了解DeepSeek是什么和怎么开始使用。

什么是DeepSeek？

一款世界领先的大语言模型，或者说AI助手。结合了数据搜索、分析、理解和推理，可以帮助用户高效处理和分析数据、生成内容、优化工作流程等。

推荐阅读：1分钟简单认识DeepSeek

为什么就它爆火？

如果一句话说就是：便宜+强大+开源+能联网，东方神秘力量Appstore排行第一，导致算力股大跌。

拆分来看就是3点：

便宜：
- 网页端和APP都免费，而能力相当的 ChatGPT o1 一个月 200 美元会员。
- API 调用成本相比 OpenAI o1 降低了 90-95%（恐怖）
强大：Chatbot Arena榜单上，DeepSeek-R1 性能综合排名第三，与 ChatGPT o1 并列，在高难度提示词、代码和数学等技术性极强的领域以及风格控制方面，DeepSeek-R1 位列第一。
开源：与Close AI形成对比，任何人都可以自由地使用、修改、分发和商业化该模型，彻底打破了以往大型语言模型被少数公司垄断的局面。

我的使用体会

原文地址：https://weibo.com/1794009892/PbZcw21yq?pagetype=detail

功底过硬，能力与OpenAI最强的o1跑分持平，但DeepSeek开源
实测惊艳，这几天大家在网上看到的各种文案输出已经有感觉
很多文风已经以假乱真，你根本分不出是不是AI创作，不信你看这篇
以往通用模型的结构化提示词，用在R1上效果却不一定好
那提示框架还有用吗？有用，因为提示词本身的目的是“清晰表达”，无论是么时候都有用，只是这个措辞过程会越来越简单
如果你有既定的解题思路或输出格式需要遵循，还是可以应用提示框架
之前的通用模型是指令型，像是需要你事无巨细指导的实习生；R1是推理大模型，像是猎头刚刚挖来的职业经理人，告诉TA你的目标，他会自己思考如何实现
如我之前一直所说，模型越厉害，提示技巧越简单

关于我学习和理解AI的更多思路，去年写得这篇我很喜欢，现在大家看看依然有参考价值：https://weibo.com/1794009892/OwdjKncJv?pagetype=detail

如何使用？

1. 官方途径

电脑：www.deepseek.com
手机：打开应用市场，搜索“DeepSeek”下载即可
记得必须勾选【深度思考】激活R1模型

勾选【深度思考】、【联网搜索】和什么都不勾选的三种模式区别对比如下：

对比维度	深度思考（R1）	联网搜索	默认模式（V3）
核心能力	复杂逻辑推理、多角度结构化分析	实时获取互联网最新信息并整合	快速回答常识性问题
数据来源	预训练知识库（截至2024年7月）	实时网络抓取（截至当前时间）	预训练知识库（可能过时）
处理方式	思维链展开、贝叶斯推理框架	搜索+信息筛选+多源交叉验证	直接调用模型记忆
响应速度	较慢（需模拟人类思考过程）	中等（需等待网络检索）	极快（平均1秒内）
典型优点	1. 解决数学/代码难题 2. 生成结构化报告	1. 时效性强 2. 附带来源引用	1. 即问即答 2. 资源消耗低
主要缺点	可能过度复杂化简单问题	受网站反爬机制限制	无法处理时效性问题
适用场景举例	• 学术论文逻辑推演 • 职业规划分析	• 查询奥运会新增项目 • 追踪股市动态	• 水的化学式 • 历史事件简述

2. 推荐满血版平替

由于官方总是提示“服务器繁忙，请稍后再试”，近期使用可以考虑以下6个替代方案，间接使用 满血版 DeepSeek R1 模型。

1. DeepSeek 点开即用

目前搜索AI很多接入了R1满血模型，优势是点开即用，最方便的推荐。

1. 【首推】硅基流动

点击注册硅基流动

硅基流动目前官方活动：使用邀请链接注册就送 2000 万 Token，对话输入和输入数量大致相当于1000万汉字，足够大家免费使用一段时间啦。

获取API后，你有两个选择：

直接在硅基流动官网使用DeepSeek
借助客户端使用DeepSeek

如果在官网使用，直接打开 https://cloud.siliconflow.cn/models

如上图，找到 R1 模型，点击进入-在线体验，即可开始正常对话。

如果你希望对话更稳定，界面更友好，可以往下看，使用第三方客户端接入R1。

2. 秘塔搜索：https://metaso.cn/

如果你需要 联网搜索 + DeepSeek R1推理，那么秘塔是首选，除了秘塔之外，腾讯元宝、纳米搜索、天工AI也是类似的 搜索+DeepSeek 模式。

网页地址：https://yuanbao.tencent.com/
手机APP：应用商店搜索「秘塔AI搜索」

3. 腾讯元宝：https://yuanbao.tencent.com/

支持手机端和网页端，先切换为 DeepSeek R1 模型，然后搜索问题即可。

网页地址：https://yuanbao.tencent.com/
手机APP：应用商店搜索「腾讯元宝」

4. 纳米搜索：https://www.n.cn/

适合移动端用户快速调用 AI 能力，尤其适合碎片化场景（如通勤、会议记录）。

使用步骤

应用商店搜索「纳米 AI 搜索」APP 下载安装；
输入问题，开启「深度回答」按钮调用满血版模型。
如果你的目标不是「搜索」，而是「对话」，那么点击下方【机器人】，选择 DeepSeek-R1-联网满血版 开启对话。

5. 天工AI：https://www.tiangong.cn/

网页地址：https://www.tiangong.cn/
手机APP：应用商店搜索「天工」

6. 火山引擎

进入火山引擎后，会免费赠送50万token额度，在模型广场搜索找到 DeepSeek-R 点击【立即体验】，即可开始已使用。

模型广场：https://console.volcengine.com/ark/region:ark+cn-beijing/model?projectName=default&search=deepseek&vendor=Bytedance&view=LIST_VIEW

2. DeepSeek API + 第三方客户端

获取DeepSeek的稳定API+使用API，API你可以理解为大模型能力的接口，接给谁，谁就拥有和大模型一样的超能力，那么就简单了。

那很明显，这种方式你需要准备两个东西： API 和 客户端。

第1步：获取API推荐

【首推】硅基流动API

硅基流动目前官方活动：使用邀请链接注册就送 2000 万 Token，对话输入和输入数量大致相当于1000万汉字，足够大家免费使用一段时间啦。

第2步：下载客户端

【首推】Chatbox：https://chatboxai.app/zh
【备选】Cherry Studio：https://cherry-ai.com/download

具体操作教程

获取API：点击注册硅基流动账号获取
进入硅基流动平台后，点击左侧边栏【API密钥-新建API密钥】
命名为DeepSeek，点【新建密钥】
新页面中，鼠标悬停在密钥上，单击复制，搞定！
使用 API
打开chatbox（在线）：https://web.chatboxai.app/
或者下载Chatbox客户端（稳定）：https://chatboxai.app/zh
点击【设置-显示】，语言为中文
点击【模型-Siliconflow API】即硅基流动
粘贴刚刚获取到的API，并且下方模型确保选择【DeepSeekR1】
搞定！你可以回到主界面开始与 DeepSeek 对话啦！

17+使用平替：

点击查看完整列表

硅基流动：https://cloud.siliconflow.cn/i/snHnLED8
国家超算中心 https://chat.scnet.cn/#/home
百度云千帆：https://console.bce.baidu.com/qianfan/modelcenter/model/buildIn/list
英伟达NIM：https://build.nvidia.com/deepseek-ai/deepseek-r1
Groq：https://groq.com/
Fireworks：https://fireworks.ai/models/fireworks/deepseek-r1
Chutes：https://chutes.ai/app/chute/
Github：https://github.com/marketplace/models/azureml-deepseek/DeepSeek-R1/playground 🚫
POE：https://poe.com/DeepSeek-R1 🚫
Cursor：https://cursor.sh/ 🚫
MonicaAI：https://monica.im/invitation?c=ACZ7WJJ9 🚫
Lambda：https://lambdalabs.com/ 🚫
Cerebras：https://cerebras.ai 🚫
Perplexity：https://www.perplexity.ai 🚫
阿里云百炼：https://api.together.ai/playground/chat/deepseek-ai/DeepSeek-R1
Windsurf：https://codeium.com/windsurf
DeepSeek伴侣：https://ds.huasheng.ai/

🚫 为需要魔法

本地部署DeepSeek

什么是本地部署？

简单说就是把在线的大语言模型，安装在你家的电脑上使用，拔掉网线也能继续使用，这样做有以下几个好处。

本地部署的好处

更稳定更快：离线使用，无需联网，减少网络依赖和延迟
模型可控性：根据自身对模型进行定制和优化
数据安全：避免了将敏感信息上传至云端，降低了数据泄露风险
成本控制：无限免费使用，无需支付订阅费用

不建议部署R1

这部分本来想写【部署方式】，网上也有很多教程，但想来想去，写出来反而是浪费大家时间，其实对于咱们普通用户，根本没必要，原因有二：

满血版 DeepSeek 硬件配置需求极高，价格需要200万以上
如果不部署满血版，蒸馏版的7B模型使用体验很差，不如不部署

索性咱也别浪费时间鼓捣了，如果你实在想要部署，直接看这几个教程：

方法①：使用 ollama+PageAssist 插件部署

视频教程：DeepSeek R1，本地部署才是王道！

方法②：使用 LM Studio 部署

视频教程：DeepSeek R1 推理模型完全本地部署保姆级教程

附件：网上别人传的本地部署「Deepseek 大礼包」

DeepSeek R1 7b 模型整合包，开箱即用。

2025 年 DeepSeek 桌面版：一键安装，轻松体验桌面版强大功能。

破除限制文件补丁：解锁 DeepSeek 全部潜能，突破使用限制。

本地部署其他大模型

参考教程：离线使用 | 本地部署大语言模型（LLM）

DeepSeek基础技巧

0. R1 推理模型与基础模型使用差异

1. 深度思考和联网搜索

深度思考：激活R1推理模型，适用于理解和解决复杂逻辑问题
联网搜索：结合网络最新信息，提供更准确、实时的回答

这两个功能都必须手动打开，才能使用，不选择【深度思考】默认的模型是V3，擅长基于知识库快速回答，没有高级推理的思考过程。

三种模式对比测试

我们的测试问题基于最近大火的《哪吒2》：

2025年春节档电影《哪吒2》目前票房已达多少亿？请结合其3D动画制作成本、观众口碑评分与同期竞争对手《流浪地球3》的排片率，预测该片能否打破中国影史票房纪录，并分析其对国产动画产业链的长期影响。

这里有几个坑：
-《哪吒2》的实时票房需要联网检索
-《流量地球3》2025春节并未上映，是虚假信息

预测是否能打破中国影史票房记录，其实已经打破
我们看对比结果：

同时开启深度思考+联网搜索
读取了47个网页，思考了48秒，完美避开了所有坑，并且指出了虚假信息，得出正确结论。

开启深度思考，无联网
回答截图太长，这里不放了，尽管有推理，但无法验证“信息真实性”，只能依靠时效性较差的知识库回答，所以无法获得真正的实时票房，无法识别虚假信息和做出最终正确判断。

开启联网，无深度思考
虽然读取了50多个网页，但是由于取法推理思考，这种复杂问题很容易产生AI幻觉，回答错误，也就是虽然有网络，但是脑子不够聪明，转不过来。

2. 提示词3个心法

相比于传统模型，我们需要事无巨细地提供思路、信息、方案，才能获得较好效果，R1模型需要的提示变得更简单，它会发挥主观能动性，深刻、准确理解用户意图，自己寻找解题思路。

之前的通用模型是指令型，像是需要你事无巨细指导的实习生；R1是推理大模型，像是猎头刚刚挖来的职业经理人，告诉TA你的目标，他会自己思考如何实现。

但这并不是说，你可以“省略必要信息”，该给还是得给，我把提示思路简化为了三个技巧：具体、详细、说人话。

具体

不具体：“写段春节祝福”
具体：“我是28岁设计公司打工人，写一段蛇年初一给直属领导王总的拜年祝福词，对方在意的是公司做大做强，可提及今年公司初创一起奋斗的经历，不超过150字。”

详细

如果你不知道怎么具体，那么只需要告诉AI四个核心信息：谁+做什么+补充细节+结果描述（包括格式、字数、输出要求等）。

比如：“我是机械专业本科生，需要优化文献综述部分，重点突出近 3 年柔性机器人传感器的突破，请用学术语言重写并标注参考文献 DOI。”

说人话

确保自己“说人话”，所说即所想，不用担心过于接地气它不懂或误解，然后可以暂时忘掉所有技巧，大道至简，会问就行，然后根据答案给出你的反馈，循环往复，像苏格拉底一样追问。

3. 四要素模板

如果上方的不好记，你也可以用网上大家总结的四要素模板：

[角色] 作为专家
[任务] 需要完成
[要求] 输出格式为，包含要素
[补充] 相关背景：，限制条件：

示例：

作为营养学顾问，需要为糖尿病患者设计一周食谱。
要求输出表格格式，包含早/中/晚餐的热量值。
相关背景：患者年龄65岁
限制条件：每日总热量<1800大卡

4. 万能提示词积木

有些提示词适用于任何场景，可以用简单几个词让AI理解你的意图，我称为【万能提示词】，这里有一份万能提示积木清单：点击查看

如果AI回复太晦涩，你可以：

说人话
请用通俗易懂的语言讲解
我是一个小学生，请用我能理解的语言回答
避免使用任何术语

类似的万能积木还有：

提供一个真实世界的案例
用类比和比较来解释
提供多个答案
如果你在回答前有任何问题，请向我提问
减少无关信息，只关注xxxxx
提供一步一步的指导（step-by-step）
是否还有其他的视角
请深入探讨xxxxx
输出为xxxxx格式

5. 指定输出格式

如果对框架感兴趣可以看这篇：万能提示词框架ABC

虽然说提示词不用特别复杂，但亲测输入格式的限定还是必要的，不然同一个简单的问题，比如“翻译”，它输出的结果会五花八门，就像这篇讲过的翻译结果混乱的问题。

想要提前规避，最好的方法就是指定输出格式。

你可以让输出格式结构化，比如输出为

表格

Markdown/代码

列表

步骤

图表

……

如果输出结构复杂，你也可以直接提供示例，如：

以xxx开始；

以xxx结束；

以如下格式“可能原因+结果+解决方案”

翻译结果以纯英文输出，不带双引号，不做任何解释

常用格式控制语法：

强制结构：使用“`包裹格式要求
占位符标记：用{{}}标注需填充内容
优先级符号：> 表示关键要求，! 表示禁止项

6. 限定文风转换

DeepSeek擅长模仿作家风格，但本质是基于文本模式的概率生成，并非真正"理解"风格，因此自然是哪位作家的作品多、网络信息丰富，就更擅长模仿谁。

🔍 我整理了几个最佳模仿对象：

王家卫：精确到分钟的时间戳/无意义但具象的物品计数/错位情感投射
- 例："0.01公分/ 57小时后，这罐凤梨罐头会过期"
鲁迅：文言白话杂糅/递进式讽刺
- 例："翻开报表一查，这报表没有年代，歪歪斜斜每页都写着’降本增效’"
张爱玲：通感比喻/华丽苍凉对照
- 例："他的承诺像玻璃柜里的马卡龙，隔着霓虹灯看是粉色的，咬下去才发现芯子早已潮了"
金庸：四字短句/天地意象
- 例："只见他双掌翻飞，竟将十六核CPU的热浪化作太极气劲，散热器隐隐发出龙吟之声"
莎士比亚：ABAB押韵/命运诘问
- 例："这电量啊电量，你为何像朱丽叶的容颜般易逝？"
海明威：动作串联/隐藏情绪
- 例："他打开冰箱。取出啤酒。看了看生产日期。把易拉罐捏扁。窗外在下雨。"

操作方法

作家风格移植:

"请以[作家]的风格，创作/改写关于[主题]的内容"
"请用[作家A]的XX风格结合[作家B]的XX手法，描述[日常事物/科技现象/社会热点]"

还延展出另一种文体杂交等不同方式，例如：

"将产品说明书改写成《史记》列传格式

混合风格案例

王家卫×程序员周报
「2023年Q4第三周，星期三下午3点42分，IDE显示我修改了768行代码。他们说这叫敏捷开发，可阿May走后，再没人懂我为什么要给变量起名叫happy_ending。合并请求通过那天，我吃了整整三十粒章鱼小丸子——原来需求文档和爱情一样，改着改着就面目全非。」
鲁迅×星座运势
「大抵是水逆到了极致。狮子座的骄傲，在这几日竟显出些阿Q精神来。投资理财栏分明写着’不宜’，偏要买那虚拟币，仿佛这样便战胜了星盘。殊不知运势就像未庄的月亮，照赵家的便圆，照你的总是缺着。」
金庸×智能家居说明
「此扫地机器人曾于华山之巅修炼九年，自创’凌波微步清洁大法’。遇宠物毛团则使出乾坤大挪移，电量不足时更有梯云纵绝技直返基站。注：若见它深夜自行启动，莫慌，此乃闭关突破AI心法第三重境。」
莎士比亚×奶茶测评
「珍珠！你这来自东方的诱惑精灵！
是让罗密欧忘却朱丽叶的甜蜜毒药，
当黑糖裹挟茶汤穿越唇齿的瞬间，
人类啊，终于懂得特洛伊为何沦陷！」

DeepSeek进阶技巧

这部分未完成，还在继续补充……

1. 领域穿透

领域穿透技术通俗来说，就是用其他领域的知识或方法，解决本领域看似不相关的问题。就像武侠小说里的“隔山打牛”，用物理学原理分析奶茶店排队，或用艺术思维设计科技产品，这是AI很擅长的一种玩法。

行业黑话破解 → "解释Web3领域的’胖协议瘦应用’理论"
知识边界测试 → "用相对论原理分析奶茶店排队现象"
思维破壁指令 → "如果达芬奇穿越到现代设计智能家居，会提出什么方案"

领域穿透技术的核心是打破思维壁垒，可以有不同形式，比如：

技术穿透：如NAT穿透让内外网互通
学科穿透：用物理原理解释社会现象
时空穿透：让历史天才解决现代问题

下次遇到难题或很难理解的学科时，试试“不按套路出牌”，用完全不相干的领域知识降维打击！

场景化实战策略

商业决策支持

"假设我们要在曼谷开重庆火锅店：
列出当地餐饮法规的三个关键注意点
对比三个竞争对手的优劣势
用SWOT分析给出选址建议
要求：数据截止2023年Q2，考虑雨季影响"

创意内容生成

"创作科幻微小说：
核心冲突：AI获得诺贝尔文学奖引发的社会争议
关键道具：能修改现实的量子钢笔
风格要求：模仿刘慈欣的宏观叙事+东野圭吾的反转设计
限制：在1500字内完成三次剧情转折"

技术方案论证

"作为CTO评审区块链存证项目：
找出PoW机制在本场景中的三个不适用点
提出改进方案（需兼容现有智能合约）
用医院病历管理案例做推演验证
附加要求：绘制技术演进路线图（文字描述版）"

DeepSeek介绍附录

DeepSeek（深度求索）是一家专注于人工智能基础技术研究的科技公司，致力于探索AGI（通用人工智能）的实现路径，公司背景：

成立时间：2023年
总部：中国杭州
定位：聚焦大模型研发与应用，提供高效、安全、可控的AI技术解决方案。

2025 年 2 月 2 日，据彭博社报道，由 DeepSeek 开发的人工智能助手在全球范围内掀起了一股热潮。这款推理型 AI 聊天机器人自 2025 年初发布以来，迅速攀升至 140 个国家的苹果 App Store 下载排行榜首位，并在美国的 Android Play Store 中同样占据榜首位置。

延伸阅读：一文读懂｜DeepSeek新模型大揭秘，为何它能震动全球AI圈

企业官网

官方地址：https://www.deepseek.com/
APP下载：https://download.deepseek.com/app/

官方频道

微信公众号：DeepSeek
小红书：@DeepSeek（deepseek_ai)
X (Twitter) : DeepSeek (@deepseek_ai)

创始人信息

背景：80后，浙江大学电子工程系人工智能方向毕业，本土背景。
特点：兼具强大的infra工程能力和模型研究能力，学习能力强，像极客而非老板。
理念：强调“是非观”置于“利害观”之前，倡导原创式创新。
教育背景：浙江大学

DeepSeek 创始人梁文锋，1985 年出生于广东省湛江市。梁文锋从小成绩优异，小学六年级时他就通过考试被吴川一中录用。一直是学校里的“尖子生”并在数学学科表现出极大天赋。

2002 年，梁文锋 17 岁，以吴川一中“高考状元”的成绩考上浙大本科电子信息工程专业，于 2007 年考上浙江大学信息与通信工程专业研究生。

2013 年，梁文锋与浙大同学徐进共同创立了杭州雅克比投资管理有限公司，两年后又成立了杭州幻方科技有限公司，致力于通过数学和人工智能进行量化投资。

2021 年，幻方的资产管理规模突破千亿大关，2023 年，他宣布将正式进军通用人工智能领域，并创办了深度求索 DeepSeek，专注于做真正人类级别的人工智能。

近日这名 85 后还现身《新闻联播》以 AI 初创公司深度求索（DeepSeek）创始人的身份参加了一场国家超高规格座谈会，并现场发言。

创始人履历

团队信息

从目前已有的媒体公开报道中可以看出，DeepSeek 团队最大的特点是名校、年轻，即使是团队 Leader 级别，年纪也多在 35 岁以下。不到 140 人的团队，工程师和研发人员几乎都来自清华大学、北京大学、中山大学、北京邮电大学等国内顶尖高校，工作时间都不长。

团队里程碑

时间	关键事件	突破性意义
2008	开启量化对冲研究	本土量化探索先驱
2015	创立幻方量化	打造千亿级量化私募
2016	上线首套AI投资策略	量化投资AI化革命
2019	自研“萤火一号”AI集群(1100 GPU)	算力储备超前布局
2021	“萤火二号”投入运营(10亿/1万A100)	算力规模比肩科技巨头
2023.07	创立DeepSeek	AGI探索新起点
2024.05	DeepSeek V2引发行业价格战	推理成本降至GPT-4 Turbo 1/70
2024.12	DeepSeek V3 685B超越Llama3.2 405B	训练成本仅为Meta的1/9

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

DeepSeek 学前班 | 什么是DeepSeek？如何使用？