本系列是AI仓鼠洞针对DeepSeek的从入门到日常应用完成教程,持续更新。本篇【学前班】争取带大家先一次全面了解DeepSeek是什么和怎么开始使用。

什么是DeepSeek?

一款世界领先的大语言模型,或者说AI助手。结合了数据搜索、分析、理解和推理,可以帮助用户高效处理和分析数据、生成内容、优化工作流程等。

推荐阅读:1分钟简单认识DeepSeek

为什么就它爆火?

如果一句话说就是:便宜+强大+开源+能联网,东方神秘力量Appstore排行第一,导致算力股大跌。

拆分来看就是3点:

  • 便宜

    • 网页端和APP都免费,而能力相当的 ChatGPT o1 一个月 200 美元会员。
    • API 调用成本相比 OpenAI o1 降低了 90-95%(恐怖)
  • 强大:Chatbot Arena榜单上,DeepSeek-R1 性能综合排名第三,与 ChatGPT o1 并列,在高难度提示词、代码和数学等技术性极强的领域以及风格控制方面,DeepSeek-R1 位列第一。

  • 开源:与Close AI形成对比,任何人都可以自由地使用、修改、分发和商业化该模型,彻底打破了以往大型语言模型被少数公司垄断的局面。

我的使用体会

原文地址:https://weibo.com/1794009892/PbZcw21yq?pagetype=detail

  • 功底过硬,能力与OpenAI最强的o1跑分持平,但DeepSeek开源
  • 实测惊艳,这几天大家在网上看到的各种文案输出已经有感觉
  • 很多文风已经以假乱真,你根本分不出是不是AI创作,不信你看这篇
  • 以往通用模型的结构化提示词,用在R1上效果却不一定好
  • 那提示框架还有用吗?有用,因为提示词本身的目的是“清晰表达”,无论是么时候都有用,只是这个措辞过程会越来越简单
  • 如果你有既定的解题思路或输出格式需要遵循,还是可以应用提示框架
  • 之前的通用模型是指令型,像是需要你事无巨细指导的实习生;R1是推理大模型,像是猎头刚刚挖来的职业经理人,告诉TA你的目标,他会自己思考如何实现
  • 如我之前一直所说,模型越厉害,提示技巧越简单

关于我学习和理解AI的更多思路,去年写得这篇我很喜欢,现在大家看看依然有参考价值:https://weibo.com/1794009892/OwdjKncJv?pagetype=detail

如何使用?

1. 官方途径

  • 电脑:www.deepseek.com
  • 手机:打开应用市场,搜索“DeepSeek”下载即可
  • 记得必须勾选【深度思考】激活R1模型
    file

勾选【深度思考】、【联网搜索】和什么都不勾选的三种模式区别对比如下:

对比维度 深度思考(R1) 联网搜索 默认模式(V3)
核心能力 复杂逻辑推理、多角度结构化分析 实时获取互联网最新信息并整合 快速回答常识性问题
数据来源 预训练知识库(截至2024年7月) 实时网络抓取(截至当前时间) 预训练知识库(可能过时)
处理方式 思维链展开、贝叶斯推理框架 搜索+信息筛选+多源交叉验证 直接调用模型记忆
响应速度 较慢(需模拟人类思考过程) 中等(需等待网络检索) 极快(平均1秒内)
典型优点 1. 解决数学/代码难题
2. 生成结构化报告
1. 时效性强
2. 附带来源引用
1. 即问即答
2. 资源消耗低
主要缺点 可能过度复杂化简单问题 受网站反爬机制限制 无法处理时效性问题
适用场景举例 • 学术论文逻辑推演
• 职业规划分析
• 查询奥运会新增项目
• 追踪股市动态
• 水的化学式
• 历史事件简述

2. 推荐满血版平替

由于官方总是提示“服务器繁忙,请稍后再试”,近期使用可以考虑以下6个替代方案,间接使用 满血版 DeepSeek R1 模型。

1. DeepSeek 点开即用

目前搜索AI很多接入了R1满血模型,优势是点开即用,最方便的推荐。

1. 【首推】硅基流动

  1. 点击注册硅基流动

    硅基流动目前官方活动:使用邀请链接注册就送 2000 万 Token,对话输入和输入数量大致相当于1000万汉字,足够大家免费使用一段时间啦。

获取API后,你有两个选择:

  • 直接在硅基流动官网使用DeepSeek
  • 借助客户端使用DeepSeek

如果在官网使用,直接打开 https://cloud.siliconflow.cn/models
file

如上图,找到 R1 模型,点击进入-在线体验,即可开始正常对话。
file

如果你希望对话更稳定,界面更友好,可以往下看,使用第三方客户端接入R1。

2. 秘塔搜索:https://metaso.cn/

如果你需要 联网搜索 + DeepSeek R1推理,那么秘塔是首选,除了秘塔之外,腾讯元宝、纳米搜索、天工AI也是类似的 搜索+DeepSeek 模式。

网页地址:https://yuanbao.tencent.com/
手机APP:应用商店搜索「秘塔AI搜索」

file

3. 腾讯元宝:https://yuanbao.tencent.com/

支持手机端和网页端,先切换为 DeepSeek R1 模型,然后搜索问题即可。

网页地址:https://yuanbao.tencent.com/
手机APP:应用商店搜索「腾讯元宝」

file

4. 纳米搜索:https://www.n.cn/

适合移动端用户快速调用 AI 能力,尤其适合碎片化场景(如通勤、会议记录)。

使用步骤

  1. 应用商店搜索「纳米 AI 搜索」APP 下载安装;
  2. 输入问题,开启「深度回答」按钮调用满血版模型。
  3. 如果你的目标不是「搜索」,而是「对话」,那么点击下方【机器人】,选择 DeepSeek-R1-联网满血版 开启对话。
    file

5. 天工AI:https://www.tiangong.cn/

网页地址:https://www.tiangong.cn/
手机APP:应用商店搜索「天工」

file

6. 火山引擎

进入火山引擎后,会免费赠送50万token额度,在模型广场搜索找到 DeepSeek-R 点击【立即体验】,即可开始已使用。

模型广场:https://console.volcengine.com/ark/region:ark+cn-beijing/model?projectName=default&search=deepseek&vendor=Bytedance&view=LIST_VIEW

file

2. DeepSeek API + 第三方客户端

获取DeepSeek的稳定API+使用API,API你可以理解为大模型能力的接口,接给谁,谁就拥有和大模型一样的超能力,那么就简单了。

那很明显,这种方式你需要准备两个东西: API客户端

第1步:获取API推荐

【首推】硅基流动API

硅基流动目前官方活动:使用邀请链接注册就送 2000 万 Token,对话输入和输入数量大致相当于1000万汉字,足够大家免费使用一段时间啦。

第2步:下载客户端

具体操作教程

  1. 获取API:点击注册硅基流动账号获取

  2. 进入硅基流动平台后,点击左侧边栏【API密钥-新建API密钥】
    file

  3. 命名为DeepSeek,点【新建密钥】
    file

  4. 新页面中,鼠标悬停在密钥上,单击复制,搞定!
    file

  5. 使用 API
    打开chatbox(在线):https://web.chatboxai.app/
    或者下载Chatbox客户端(稳定):https://chatboxai.app/zh

  6. 点击【设置-显示】,语言为中文
    file

  7. 点击【模型-Siliconflow API】即硅基流动
    file

  8. 粘贴刚刚获取到的API,并且下方模型确保选择【DeepSeekR1】
    file

  9. 搞定!你可以回到主界面开始与 DeepSeek 对话啦!
    file

17+使用平替:

点击查看完整列表

  1. 硅基流动:https://cloud.siliconflow.cn/i/snHnLED8
  2. 国家超算中心 https://chat.scnet.cn/#/home
  3. 百度云千帆:https://console.bce.baidu.com/qianfan/modelcenter/model/buildIn/list
  4. 英伟达NIM:https://build.nvidia.com/deepseek-ai/deepseek-r1
  5. Groq:https://groq.com/
  6. Fireworks:https://fireworks.ai/models/fireworks/deepseek-r1
  7. Chutes:https://chutes.ai/app/chute/
  8. Github:https://github.com/marketplace/models/azureml-deepseek/DeepSeek-R1/playground 🚫
  9. POE:https://poe.com/DeepSeek-R1 🚫
  10. Cursor:https://cursor.sh/ 🚫
  11. MonicaAI:https://monica.im/invitation?c=ACZ7WJJ9 🚫
  12. Lambda:https://lambdalabs.com/ 🚫
  13. Cerebras:https://cerebras.ai 🚫
  14. Perplexity:https://www.perplexity.ai 🚫
  15. 阿里云百炼:https://api.together.ai/playground/chat/deepseek-ai/DeepSeek-R1
  16. Windsurf:https://codeium.com/windsurf
  17. DeepSeek伴侣:https://ds.huasheng.ai/

🚫 为需要魔法

本地部署DeepSeek

什么是本地部署?

简单说就是把在线的大语言模型,安装在你家的电脑上使用,拔掉网线也能继续使用,这样做有以下几个好处。

本地部署的好处

  • 更稳定更快:离线使用,无需联网,减少网络依赖和延迟
  • 模型可控性:根据自身对模型进行定制和优化
  • 数据安全:避免了将敏感信息上传至云端,降低了数据泄露风险
  • 成本控制:无限免费使用,无需支付订阅费用

不建议部署R1

这部分本来想写【部署方式】,网上也有很多教程,但想来想去,写出来反而是浪费大家时间,其实对于咱们普通用户,根本没必要,原因有二:

  1. 满血版 DeepSeek 硬件配置需求极高,价格需要200万以上
  2. 如果不部署满血版,蒸馏版的7B模型使用体验很差,不如不部署

索性咱也别浪费时间鼓捣了,如果你实在想要部署,直接看这几个教程:

方法①:使用 ollama+PageAssist 插件部署

视频教程:DeepSeek R1,本地部署才是王道!

方法②:使用 LM Studio 部署

视频教程:DeepSeek R1 推理模型完全本地部署保姆级教程

附件:网上别人传的本地部署「Deepseek 大礼包」

  • DeepSeek R1 7b 模型整合包,开箱即用。
  • 2025 年 DeepSeek 桌面版:一键安装,轻松体验桌面版强大功能。
  • 破除限制文件补丁:解锁 DeepSeek 全部潜能,突破使用限制。

本地部署其他大模型

参考教程:离线使用 | 本地部署大语言模型(LLM)

DeepSeek基础技巧

0. R1 推理模型与基础模型使用差异

file

1. 深度思考和联网搜索

file

  • 深度思考:激活R1推理模型,适用于理解和解决复杂逻辑问题
  • 联网搜索:结合网络最新信息,提供更准确、实时的回答

这两个功能都必须手动打开,才能使用,不选择【深度思考】默认的模型是V3,擅长基于知识库快速回答,没有高级推理的思考过程。

三种模式对比测试

我们的测试问题基于最近大火的《哪吒2》:

2025年春节档电影《哪吒2》目前票房已达多少亿?请结合其3D动画制作成本、观众口碑评分与同期竞争对手《流浪地球3》的排片率,预测该片能否打破中国影史票房纪录,并分析其对国产动画产业链的长期影响。

这里有几个坑:
-《哪吒2》的实时票房需要联网检索
-《流量地球3》2025春节并未上映,是虚假信息

  • 预测是否能打破中国影史票房记录,其实已经打破
    我们看对比结果:

同时开启深度思考+联网搜索
读取了47个网页,思考了48秒,完美避开了所有坑,并且指出了虚假信息,得出正确结论。
file

开启深度思考,无联网
回答截图太长,这里不放了,尽管有推理,但无法验证“信息真实性”,只能依靠时效性较差的知识库回答,所以无法获得真正的实时票房,无法识别虚假信息和做出最终正确判断。

开启联网,无深度思考
虽然读取了50多个网页,但是由于取法推理思考,这种复杂问题很容易产生AI幻觉,回答错误,也就是虽然有网络,但是脑子不够聪明,转不过来。

2. 提示词3个心法

相比于传统模型,我们需要事无巨细地提供思路、信息、方案,才能获得较好效果,R1模型需要的提示变得更简单,它会发挥主观能动性,深刻、准确理解用户意图,自己寻找解题思路。

之前的通用模型是指令型,像是需要你事无巨细指导的实习生;R1是推理大模型,像是猎头刚刚挖来的职业经理人,告诉TA你的目标,他会自己思考如何实现。

但这并不是说,你可以“省略必要信息”,该给还是得给,我把提示思路简化为了三个技巧:具体、详细、说人话。

具体

  • 不具体:“写段春节祝福”
  • 具体:“我是28岁设计公司打工人,写一段蛇年初一给直属领导王总的拜年祝福词,对方在意的是公司做大做强,可提及今年公司初创一起奋斗的经历,不超过150字。”

详细

如果你不知道怎么具体,那么只需要告诉AI四个核心信息:谁+做什么+补充细节+结果描述(包括格式、字数、输出要求等)。

比如:“我是机械专业本科生,需要优化文献综述部分,重点突出近 3 年柔性机器人传感器的突破,请用学术语言重写并标注参考文献 DOI。”

说人话

确保自己“说人话”,所说即所想,不用担心过于接地气它不懂或误解,然后可以暂时忘掉所有技巧,大道至简,会问就行,然后根据答案给出你的反馈,循环往复,像苏格拉底一样追问。

3. 四要素模板

如果上方的不好记,你也可以用网上大家总结的四要素模板:

[角色] 作为专家
[任务] 需要完成

[要求] 输出格式为,包含要素
[补充] 相关背景:,限制条件:

示例:

作为营养学顾问,需要为糖尿病患者设计一周食谱。
要求输出表格格式,包含早/中/晚餐的热量值。
相关背景:患者年龄65岁
限制条件:每日总热量<1800大卡

4. 万能提示词积木

有些提示词适用于任何场景,可以用简单几个词让AI理解你的意图,我称为【万能提示词】,这里有一份万能提示积木清单:点击查看

如果AI回复太晦涩,你可以:

  • 说人话
  • 请用通俗易懂的语言讲解
  • 我是一个小学生,请用我能理解的语言回答
  • 避免使用任何术语

类似的万能积木还有:

  • 提供一个真实世界的案例
  • 用类比和比较来解释
  • 提供多个答案
  • 如果你在回答前有任何问题,请向我提问
  • 减少无关信息,只关注xxxxx
  • 提供一步一步的指导(step-by-step)
  • 是否还有其他的视角
  • 请深入探讨xxxxx
  • 输出为xxxxx格式

5. 指定输出格式

如果对框架感兴趣可以看这篇:万能提示词框架ABC

虽然说提示词不用特别复杂,但亲测输入格式的限定还是必要的,不然同一个简单的问题,比如“翻译”,它输出的结果会五花八门,就像这篇讲过的翻译结果混乱的问题

想要提前规避,最好的方法就是指定输出格式

你可以让输出格式结构化,比如输出为

  • 表格
  • Markdown/代码
  • 列表
  • 步骤
  • 图表
  • ……

如果输出结构复杂,你也可以直接提供示例,如:

  • 以xxx开始;
  • 以xxx结束;
  • 以如下格式“可能原因+结果+解决方案”
  • 翻译结果以纯英文输出,不带双引号,不做任何解释

常用格式控制语法:

  • 强制结构:使用“`包裹格式要求
  • 占位符标记:用{{}}标注需填充内容
  • 优先级符号:> 表示关键要求,! 表示禁止项

6. 限定文风转换

DeepSeek擅长模仿作家风格,但本质是基于文本模式的概率生成,并非真正"理解"风格,因此自然是哪位作家的作品多、网络信息丰富,就更擅长模仿谁。

🔍 我整理了几个最佳模仿对象:

  • 王家卫:精确到分钟的时间戳/无意义但具象的物品计数/错位情感投射
    • 例:"0.01公分/ 57小时后,这罐凤梨罐头会过期"
  • 鲁迅:文言白话杂糅/递进式讽刺
    • 例:"翻开报表一查,这报表没有年代,歪歪斜斜每页都写着’降本增效’"
  • 张爱玲:通感比喻/华丽苍凉对照
    • 例:"他的承诺像玻璃柜里的马卡龙,隔着霓虹灯看是粉色的,咬下去才发现芯子早已潮了"
  • 金庸:四字短句/天地意象
    • 例:"只见他双掌翻飞,竟将十六核CPU的热浪化作太极气劲,散热器隐隐发出龙吟之声"
  • 莎士比亚:ABAB押韵/命运诘问
    • 例:"这电量啊电量,你为何像朱丽叶的容颜般易逝?"
  • 海明威:动作串联/隐藏情绪
    • 例:"他打开冰箱。取出啤酒。看了看生产日期。把易拉罐捏扁。窗外在下雨。"

操作方法

作家风格移植:

"请以[作家]的风格,创作/改写关于[主题]的内容"
"请用[作家A]的XX风格结合[作家B]的XX手法,描述[日常事物/科技现象/社会热点]"

还延展出另一种文体杂交等不同方式,例如:

"将产品说明书改写成《史记》列传格式

混合风格案例

  1. 王家卫×程序员周报
    「2023年Q4第三周,星期三下午3点42分,IDE显示我修改了768行代码。他们说这叫敏捷开发,可阿May走后,再没人懂我为什么要给变量起名叫happy_ending。合并请求通过那天,我吃了整整三十粒章鱼小丸子——原来需求文档和爱情一样,改着改着就面目全非。」

  2. 鲁迅×星座运势
    「大抵是水逆到了极致。狮子座的骄傲,在这几日竟显出些阿Q精神来。投资理财栏分明写着’不宜’,偏要买那虚拟币,仿佛这样便战胜了星盘。殊不知运势就像未庄的月亮,照赵家的便圆,照你的总是缺着。」

  3. 金庸×智能家居说明
    「此扫地机器人曾于华山之巅修炼九年,自创’凌波微步清洁大法’。遇宠物毛团则使出乾坤大挪移,电量不足时更有梯云纵绝技直返基站。注:若见它深夜自行启动,莫慌,此乃闭关突破AI心法第三重境。」

  4. 莎士比亚×奶茶测评
    「珍珠!你这来自东方的诱惑精灵!
    是让罗密欧忘却朱丽叶的甜蜜毒药,
    当黑糖裹挟茶汤穿越唇齿的瞬间,
    人类啊,终于懂得特洛伊为何沦陷!」

DeepSeek进阶技巧

这部分未完成,还在继续补充……

1. 领域穿透

领域穿透技术通俗来说,就是用其他领域的知识或方法,解决本领域看似不相关的问题。就像武侠小说里的“隔山打牛”,用物理学原理分析奶茶店排队,或用艺术思维设计科技产品,这是AI很擅长的一种玩法。

行业黑话破解 → "解释Web3领域的’胖协议瘦应用’理论"
知识边界测试 → "用相对论原理分析奶茶店排队现象"
思维破壁指令 → "如果达芬奇穿越到现代设计智能家居,会提出什么方案"

领域穿透技术的核心是打破思维壁垒,可以有不同形式,比如:

  • 技术穿透:如NAT穿透让内外网互通
  • 学科穿透:用物理原理解释社会现象
  • 时空穿透:让历史天才解决现代问题

下次遇到难题或很难理解的学科时,试试“不按套路出牌”,用完全不相干的领域知识降维打击!

场景化实战策略

商业决策支持

"假设我们要在曼谷开重庆火锅店:
列出当地餐饮法规的三个关键注意点
对比三个竞争对手的优劣势
用SWOT分析给出选址建议
要求:数据截止2023年Q2,考虑雨季影响"

创意内容生成

"创作科幻微小说:
核心冲突:AI获得诺贝尔文学奖引发的社会争议
关键道具:能修改现实的量子钢笔
风格要求:模仿刘慈欣的宏观叙事+东野圭吾的反转设计
限制:在1500字内完成三次剧情转折"

技术方案论证

"作为CTO评审区块链存证项目:
找出PoW机制在本场景中的三个不适用点
提出改进方案(需兼容现有智能合约)
用医院病历管理案例做推演验证
附加要求:绘制技术演进路线图(文 字描述版)"

DeepSeek介绍附录

DeepSeek(深度求索)是一家专注于人工智能基础技术研究的科技公司,致力于探索AGI(通用人工智能)的实现路径,公司背景:

  • 成立时间:2023年
  • 总部:中国杭州
  • 定位:聚焦大模型研发与应用,提供高效、安全、可控的AI技术解决方案。

2025 年 2 月 2 日,据彭博社报道,由 DeepSeek 开发的人工智能助手在全球范围内掀起了一股热潮。这款推理型 AI 聊天机器人自 2025 年初发布以来,迅速攀升至 140 个国家的苹果 App Store 下载排行榜首位,并在美国的 Android Play Store 中同样占据榜首位置。

延伸阅读:一文读懂|DeepSeek新模型大揭秘,为何它能震动全球AI圈

企业官网

官方地址:https://www.deepseek.com/
APP下载:https://download.deepseek.com/app/

官方频道

微信公众号:DeepSeek
小红书:@DeepSeek(deepseek_ai)
X (Twitter) : DeepSeek (@deepseek_ai)

创始人信息

  • 背景:80后,浙江大学电子工程系人工智能方向毕业,本土背景。
  • 特点:兼具强大的infra工程能力和模型研究能力,学习能力强,像极客而非老板。
  • 理念:强调“是非观”置于“利害观”之前,倡导原创式创新。
  • 教育背景:浙江大学

DeepSeek 创始人梁文锋,1985 年出生于广东省湛江市。梁文锋从小成绩优异,小学六年级时他就通过考试被吴川一中录用。一直是学校里的“尖子生”并在数学学科表现出极大天赋。

2002 年,梁文锋 17 岁,以吴川一中“高考状元”的成绩考上浙大本科电子信息工程专业,于 2007 年考上浙江大学信息与通信工程专业研究生。

2013 年,梁文锋与浙大同学徐进共同创立了杭州雅克比投资管理有限公司,两年后又成立了杭州幻方科技有限公司,致力于通过数学和人工智能进行量化投资。

2021 年,幻方的资产管理规模突破千亿大关,2023 年,他宣布将正式进军通用人工智能领域,并创办了深度求索 DeepSeek,专注于做真正人类级别的人工智能。

近日这名 85 后还现身《新闻联播》以 AI 初创公司深度求索(DeepSeek)创始人的身份参加了一场国家超高规格座谈会,并现场发言。

创始人履历

file

团队信息

从目前已有的媒体公开报道中可以看出,DeepSeek 团队最大的特点是名校、年轻,即使是团队 Leader 级别,年纪也多在 35 岁以下。不到 140 人的团队,工程师和研发人员几乎都来自清华大学、北京大学、中山大学、北京邮电大学等国内顶尖高校,工作时间都不长。

团队里程碑

时间 关键事件 突破性意义
2008 开启量化对冲研究 本土量化探索先驱
2015 创立幻方量化 打造千亿级量化私募
2016 上线首套AI投资策略 量化投资AI化革命
2019 自研“萤火一号”AI集群(1100 GPU) 算力储备超前布局
2021 “萤火二号”投入运营(10亿/1万A100) 算力规模比肩科技巨头
2023.07 创立DeepSeek AGI探索新起点
2024.05 DeepSeek V2引发行业价格战 推理成本降至GPT-4 Turbo 1/70
2024.12 DeepSeek V3 685B超越Llama3.2 405B 训练成本仅为Meta的1/9
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。