购买
下载掌阅APP,畅读海量书库
立即打开
畅读海量书库
扫码下载掌阅APP

1.2 DeepSeek介绍

DeepSeek是一款由杭州深度求索人工智能基础技术研究有限公司开发的先进AI大模型(LLM),它不仅继承了传统语言模型的强大能力,还引入了混合专家模型(MoE),这使得它在处理各种复杂的办公任务时更加高效且成本更低。自发布以来,DeepSeek迅速获得了市场的认可,在数学推理、编程能力和自然语言理解等领域展现了卓越的性能。

1.2.1 DeepSeek推理模型的优缺点

2025年伊始,DeepSeek公司发布了其最新的推理大模型——DeepSeek-R1,并迅速在科技界引起了轰动。这款模型以惊人的性价比和卓越的性能,展现了我国在人工智能领域的创新能力。DeepSeek-R1仅用了相对较低的成本便完成了训练,且达到了与全球顶级大模型相媲美的水平。这不仅标志着技术上的重大进步,也为后续的研究和发展设定了新的标杆。

DeepSeek具有以下特点和优势。

1.推理思考过程显性化

DeepSeek-R1的一个显著特点是它能够将推理思考的过程显性化地展示给用户。这种透明度在以前的AI领域是罕见的,它使得用户能够看到AI是如何一步一步推理思考,最终得出结论的。对大众而言,这种能力让大家第一次真正“看见”了一个“会思考”的大模型,而不仅仅是接收一个结果。正如360集团创始人周鸿祎所指出的,R1通过展示完整的思维链条增强了用户的信任感。

更为重要的是,推理过程的显性化不仅仅让用户能够看到推理过程,还极大地提高了模型回复内容的质量。这是因为,在展示推理步骤的同时,DeepSeek-R1能够更好地组织逻辑结构,深入分析用户的问题,推导合理的解决方案,减少可能产生的误解或错误信息。

举一个例子。如图1-3所示,当我们询问“达芬奇是摄影师吗?”时,与一般的大模型不同,DeepSeek并没有立刻回答这个问题,而是进行了以下几个方面的推理分析:

回顾达芬奇的生平和职业。

分析用户的问题是否存在同名混淆。

分析达芬奇在光学和视觉研究上的贡献。

分析用户是否将《蒙娜丽莎》细腻的光影效果与摄影技术混淆。

图1-3 DeepSeek的深度思考过程(推理过程)

2.支持推理+联网搜索

DeepSeek-R1的独特之处在于它不仅具备强大的推理能力,还能够同时进行联网搜索,为用户提供一个前所未有的高效工作助手。通过这种双重功能的结合,用户不仅可以利用AI的推理能力大幅提高工作效率和质量,还可以借助联网搜索功能确保信息数据的时效性,弥补知识库的不足,从而获得更加准确和全面的回复。

具体来说,在处理复杂问题时,DeepSeek-R1首先运用其先进的推理算法对已有数据进行深入分析,提供初步的见解和解决方案。然而,面对快速变化的信息环境,仅依赖模型内部的知识往往难以满足最新的需求。这时,DeepSeek-R1的联网搜索功能便发挥了关键作用。它可以实时从互联网上获取最新资讯,补充和完善原有的知识库,确保提供的建议既具有深度又不失时效性。

值得注意的是,在DeepSeek-R1出现之前,尽管海外市场也存在一些推理大模型,但这些模型通常只能单独使用推理功能或联网搜索功能,而无法将两者结合起来。

3.开放性助推全民应用热潮

DeepSeek-R1的成功还推动了AI在我国的应用热潮。无论是企业还是个人,都在积极探索如何利用这一强大工具来提升效率、创造价值。例如,在社交应用领域,微信已经接入DeepSeek-R1(灰度测试,仅部分用户可用),在微信内可以直接与DeepSeek对话,如图1-4所示;在教育领域,网易有道已经开始全面拥抱DeepSeek-R1,以加速个性化教学的升级;在政务领域,多个城市政府也在积极推进DeepSeek的应用探索,力求实现更智能、更高效的城市服务模式。

图1-4 微信AI搜索接入DeepSeek-R1大模型

当然,尽管DeepSeek-R1具有很多优点,但它也存在以下不足:

❑长文本输出能力较弱: DeepSeek-R1输出的内容往往较短,在处理长文本或者生成长文本时,实际效果不佳。

❑多模态能力缺失: DeepSeek-R1目前不支持图片生成、音频生成、视频生成等功能,多模态能力较弱。

1.2.2 推理模型与通用模型的运作机制对比

在DeepSeek-R1模型之前,我们接触更多的是通用模型。那么推理模型和通用模型有什么区别呢?我们在应用时,应该如何挑选适合的模型呢?

所谓推理模型,就像是给传统的大语言模型装上了超级大脑,让它们不仅能理解文字表面的意思,还能进行深层次的逻辑分析和决策。这背后的技术听起来可能有些复杂,但实际上,你可以把它看成一个“解题家”,擅长将解题思路一步一步列出来。DeepSeek-R1就是这样的“解题”高手,它在处理逻辑推理、数学运算以及实时问题解答方面表现出色。如图1-5所示,在DeepSeek聊天窗口选中“深度思考(R1)”,即可调用DeepSeek-R1推理模型。

图1-5 调用DeepSeek-R1推理模型

然而,并不是所有的工作都需要如此精密的推理能力。对于大多数日常任务而言,非推理模型就已经足够了。这些模型擅长理解和生成自然语言,通过对海量文本的学习,掌握语言的基本规则,从而能够流畅地撰写文章、翻译文档或者回答简单的问题。它们虽然不像推理模型那样擅长深度思考,但在文本内容生成、文本上下文阅读、分类文本以及翻译等方面有着独特的优势。DeepSeek-V3就是非推理模型,如图1-6所示,在DeepSeek聊天框不勾选“深度思考(R1)”,则调用的是DeepSeek-V3通用模型。

图1-6 调用DeepSeek-V3通用模型

表1-1展示了推理模型和通用模型的特性对比。推理模型更适合需要深入分析、制定复杂决策和开放性的任务。这类模型的优点是通过推理分析,给出更准确的答案;缺点是回复速度慢,比较耗费时间和计算资源。

表1-1 推理模型和通用模型的特性对比

1.2.3 推理模型与通用模型的提示词设计差异

鉴于推理模型与通用模型在运作机制上的显著差异,两者在处理任务时展现出了不同的特点和能力。这些差异不仅体现在它们如何解析问题和生成答案上,还反映在引导它们执行特定任务的提示词上。理解这两种模型的提示词使用上的区别,对于最大化利用每种模型的优势至关重要。

在这一小节中,我们将探讨推理模型(如DeepSeek-R1)与通用模型(如传统的GPT系列)在提示词设计上的关键差异。

1.面向过程vs面向目标

传统上,当我们与基础AI模型互动时,往往需要详细描述每个步骤,即所谓的“面向过程”的方法。这意味着用户必须分解任务,提供一系列具体的指令,以便模型能够按照预定的路径执行。这种方法虽然确保了结果的可预测性,但也限制了模型的灵活性和创造力。

相比之下,推理模型采用的是“面向目标”的方法。用户只需明确最终想要达到的目标,而不需要过多关注中间的具体步骤。例如,在撰写市场分析报告时,仅需指出三大核心要素——趋势分析、客户特征及差异化建议,AI就能自主规划并完成高质量的内容创作。这种转变不仅简化了用户的操作流程,还极大地释放了模型的潜力,使其能够根据用户提供的必要信息自行决定最佳的实现路径。

2.提示词的核心原则

对于推理模型而言,有效的提示词设计至关重要。以下是几个关键的原则:

❑直接表达需求: 不再需要冗长复杂的提示语,简洁明了地表达需求即可获得理想的结果。

❑不需要思维链辅助: 得益于自身的推理能力,推理模型能够在没有具体思维链指导的情况下独立思考并解决问题。

两类模型具体的提示词的差异如表1-2所示,推理模型的提示词以目标为导向,直接表达需求即可。推理模型会自主生成思考过程(即思维链),对于复杂任务,推理模型可自行规划解决路径,具备更大的开放性。

表1-2 推理模型与通用模型的提示词的差异

简单来说,通用模型,正如笔者前作《Kimi高效办公:AI 10倍提升工作效率的方法和技巧》和《豆包高效办公:AI 10倍提升工作效率的方法与技巧》 这两本书中提到的,用户为了提高大模型的输出质量,往往会在提示词中提供既定的输出格式要求(Format)或者工作流步骤(Workf low),这样会显得“死板”;而推理模型会自主思考、规划细节和步骤,自行补充所需要的格式要求或者工作流步骤,这样每次工作的结果都会有所不同,因此会显得更加“灵活”。

1.2.4 实战:推理模型与通用模型的对比案例

上一节的内容比较理论化,我们用一个通俗易懂的案例来做讲解。

此处分享一个真实案例:笔者搭建了一个AI提示词分享和管理网站,现在需要为这个网站起名,需要借助DeepSeek来提供灵感。首先,我们使用DeepSeek的基础模式,输入以下提示词:

我做了一个AI提示词(Prompt)分享和管理网站,请你帮我给这个网站起名,包含中文名及适配的英文名。请帮我策划至少10组名称。

在提示词中,我仅告诉DeepSeek如下信息:

帮我的AI提示词(Prompt)分享和管理网站起名。

需要包含中文名及适配的英文名。

至少策划10组名称。

在基础模式下,DeepSeek回复如下:

AI提示词分享和管理网站名称策划(10组)

1.灵感源泉(PromptSpring)

中文名: 灵感源泉

英文名: PromptSpring

解释: 灵感如泉涌,PromptSpring寓意网站是AI提示词的灵感源泉,帮助用户激发创意。

2.提示词工坊(PromptCraft)

中文名: 提示词工坊

英文名: PromptCraft

解释: 将提示词创作比作手工艺,PromptCraft强调网站的实用性和工具属性,帮助用户打造优质提示词。

3.提示词星球(PromptPlanet)

中文名: 提示词星球

英文名: PromptPlanet

解释: 将网站比作一个充满提示词的星球,PromptPlanet寓意网站内容丰富,用户可以在其中探索、发现。

4.提示词图书馆(PromptLibrary)

中文名: 提示词图书馆

英文名: PromptLibrary

解释: 将网站比作图书馆,PromptLibrary强调网站的资源丰富,用户可以在这里查找和学习各种提示词。

5.提示词集市(PromptMarket)

中文名: 提示词集市

英文名: PromptMarket

解释: 将网站比作集市,PromptMarket强调网站的分享和交流功能,用户可以在这里“买卖”和交换提示词。

6.提示词实验室(PromptLab)

中文名: 提示词实验室

英文名: PromptLab

解释: 将网站比作实验室,PromptLab强调网站的探索和创新精神,用户可以在这里进行各种提示词实验。

7.提示词花园(PromptGarden)

中文名: 提示词花园

英文名: PromptGarden

解释: 将网站比作花园,PromptGarden寓意网站是一个充满生机和创意的地方,用户可以在这里“培育”和“收获”提示词。

8.提示词宝典(PromptBook)

中文名: 提示词宝典

英文名: PromptBook

解释: 将网站比作宝典,PromptBook强调网站的权威性和实用性,用户可以在这里找到各种提示词秘籍。

9.提示词宇宙(PromptVerse)

中文名: 提示词宇宙

英文名: PromptVerse

解释: 将网站比作宇宙,PromptVerse寓意网站的内容浩瀚无垠,用户可以在这里探索提示词的无限可能。

10.提示词魔方(PromptCube)

中文名: 提示词魔方

英文名: PromptCube

解释: 将提示词比作魔方,PromptCube强调提示词的组合和变化,用户可以通过不同的组合创造出无限可能。

建议:

可以根据网站的具体功能和目标用户群体选择合适的名称。

可以进行用户调研,了解用户对不同名称的喜好程度。

可以进行域名查询,确保选择的名称对应的域名可用。

现在,让我们做一个对比。我将模式切换为深度思考(R1)模式,也就是调用DeepSeek-R1推理模型。使用刚才同样的提示词,DeepSeek回复如下:

[思考开始]嗯,用户让我帮忙给他们的AI提示词分享和管理网站起名字,包括中文名和英文名。首先,我得理解这个网站的主要功能。它是用来分享和管理AI提示词的,也就是Prompt。用户可能需要一个既专业又有创意的名字,容易记住,同时中英文都要适配。

首先,我需要分析用户的需求。他们可能希望名字既能体现AI技术,又能突出分享和管理的功能。中文名字可能需要简洁有力,英文名则要简短且容易拼写。另外,还要考虑品牌的可扩展性和国际化。

接下来,我会考虑关键词。比如“提示词”对应的英文是Prompt,AI相关的词有“智能”“智汇”“灵机”等。管理方面可以用“库”“工坊”“矩阵”“枢纽”等。分享方面可以用“分享”“集”“汇”等。

然后,我会尝试组合这些关键词,形成有意义且流畅的名字。比如“智言工坊”对应“PromptForge”,Forge有锻造的意思,工坊则显得专业。另一个例子是“灵枢PromptHub”,灵枢有枢纽之意,Hub在英文里也是中心的意思,这样中英文对应得比较好。

还要注意避免重复,确保名字独特。可能需要检查现有的网站或商标,但这里可能只是初步建议。另外,名字要易于发音和记忆,比如“PromptGenius”对应“提示天才”,既直接又有吸引力。

还需要考虑目标用户是谁。如果是技术人员,可能需要更专业的术语;如果是普通用户,可能需要更亲切的名字。比如“语界PrompterVerse”中的“语界”给人一种广阔的感觉,适合社区分享。

最后,列出至少10组名字,确保每组都有中英文对应,并且涵盖不同的方向,比如技术感、社区感、工具感等。同时,每个名字后面加上简短的说明,帮助用户理解背后的意义,这样用户可以根据自己的品牌定位选择最合适的名字。[思考结束]

以下是10组中英文适配的AI提示词管理网站名称方案,从技术感、功能属性、品牌传播等维度设计:

1.智言工坊/PromptForge

(“工坊”体现创作属性,Forge象征锻造AI智慧)

2.灵枢PromptHub

(“灵枢”取自中医典籍,暗含核心枢纽之意,Hub对应资源聚合)

3.启钥Promptory

(“启发灵感之钥”,组合Prompt+Repository体现词库属性)

4.语界PrompterVerse

(构建AI语言宇宙的概念,Verse延伸元宇宙意境)

5.墨核InkCore

(“墨”象征知识沉淀,Core突出核心技术引擎)

6.智链PromptChain

(区块链式思维,强调提示词的组合延展性)

7.言矩LingoMatrix

(“语言矩阵”概念,突出结构化管理系统)

8.灵钥PromptGenius

(“开启灵感的钥匙”,Genius暗示智能涌现)

9.语擎Lingine

(组合Linguistic+Engine,彰显语言驱动引擎技术)

10.智汇舱PromptPod

(太空舱概念隐喻AI孵化器,Pod符合现代科技命名趋势)

命名逻辑说明:

1)中文名注重意象传达,英文名确保语义关联与国际化发音。

2)核心词根围绕“Prompt/语言/智能”展开衍生。

3)后缀采用Hub/Pod/Forge等科技领域常见词根增强专业感。

4)部分名称预留品牌延展空间(如Verse/Matrix可拓展为功能模块)。

5)中英文字节长度控制在2~4个字,符合域名注册规范。

建议优先考虑与目标用户群体的契合度:技术型用户适合PromptForge/PromptChain类硬核命名,创作者社群倾向PrompterVerse/PromptPod类富有想象力的名称。可结合品牌色系与LOGO设计进行最终选择。

对比DeepSeek前后两次的回复,我们会发现以下区别:

❑创意性: 基础模式起的名称比较直白,显得很“俗套”,基本是以“提示词××”作为名称;而深度思考模式起的名称就显得多样化,名称简短且具有创意,比如智汇舱PromptPod、语擎Lingine等。

❑记忆性: 深度思考模式起的名称简洁有力,而且易于发音和记忆。

❑内涵性: 深度思考模式起的名称亲切、流畅,且具有深意。比如,言矩,“语言矩阵”概念,突出结构化管理系统;启钥,“启发灵感之钥”,组合Prompt+Repository体现词库属性。

所以,综合来看,基础模式下DeepSeek的回复显得简单、直白,缺乏深度思考之后的创意性。那么,假设我们需要在使用基础模式的前提下提升它的回复质量,要怎么做呢?

现在,我们对原提示词做一个修改,对DeepSeek提出更细致的要求:

我做了一个AI提示词(Prompt)分享和管理网站,请你帮我给这个网站起名,包含中文名及适配的英文名。请帮我策划至少10组名称。

名称要求如下:

既专业又有创意,且易于发音和记忆。

中文名需要简洁有力,英文名需要简短且容易拼写。

网站面向普通用户,使用亲切的名字。

名称关键词组合有意义且流畅。

在新的提示词中,我们要求DeepSeek起的名称既专业又有创意、简洁有力且易于发音和记忆,亲切且有内涵、同时面向的群体是普通用户。DeepSeek在基础模式下接收到上面的提示词之后,回复如下:

以下是10组符合你要求的中英文网站名称,结合了专业性、创意性、亲切感和易记性:

1.提示库(PromptBase)

中文名: 提示库

英文名: PromptBase

说明: 简洁直接,突出“提示词”的核心功能,英文名易记且专业。

2.灵感池(PromptPool)

中文名: 灵感池

英文名: PromptPool

说明: 将提示词比作灵感的源泉,亲切且富有创意。

3.智汇盒(PromptBox)

中文名: 智汇盒

英文名: PromptBox

说明: 将提示词比作智慧的盒子,寓意丰富且易记。

4.提示星球(PromptPlanet)

中文名: 提示星球

英文名: PromptPlanet

说明: 将提示词比作一个星球,充满探索感和趣味性。

5.灵感桥(PromptBridge)

中文名: 灵感桥

英文名: PromptBridge

说明: 强调提示词连接用户与灵感的桥梁作用,亲切且有意义。

6.提示工坊(PromptWork)

中文名: 提示工坊

英文名: PromptWork

说明: 突出“制作”和“分享”的功能,专业且接地气。

7.智语集(PromptHub)

中文名: 智语集

英文名: PromptHub

说明: 将提示词比作智慧的集合,英文名简洁且专业。

8.灵感魔方(PromptCube)

中文名: 灵感魔方

英文名: PromptCube

说明: 将提示词比作魔方,充满创意和趣味性。

9.提示森林(PromptForest)

中文名: 提示森林

英文名: PromptForest

说明: 将提示词比作森林,寓意丰富且充满探索感。

10.智语坊(PromptLab)

中文名: 智语坊

英文名: PromptLab

说明: 将提示词比作实验室,突出创新和探索的意义。

这些名称既具备专业性,又充满创意和亲切感,适合普通用户使用。你可以根据网站的风格和目标用户选择最合适的名称!

在新提示词的作用下,DeepSeek的回复质量大幅提高,名称既能体现专业性,同时也具备创意性和亲切感,比如智语集(PromptHub)、灵感魔方(PromptCube)、智汇盒(PromptBox)。

通过这个案例,同时对照表1-2,我们用更通俗的语言来总结推理模型和通用模型的差异:

❑提示词风格: 推理模型以目标为导向,提供基础信息即可,提示词简洁;通用模型需要完善细节,更需要过程指导。

❑思维链需求: 推理模型自主生成思维链,而通用模型需要用户自主补充、完善细节需求。

❑灵活性与创造力: 推理模型自主思考,每一次的思考过程可能略有不同,所以输出结果可能有“彩蛋”,更具有创意性;通用模型由用户补充细节,每次按照同样的要求工作,灵活性更低。

适合任务: 推理模型适合推理分析任务,比如编程、数学计算、市场分析、内容创作等;而通用模型也有其独特的优势,速度快、格式固定,适合要求速度和有固定流程的任务,如翻译、数据录入、数据阅读和总结等。 RPaF1RXGBYCc1rzr7IXRfoMiOV1ZdM/OZAXaAO5WTuui4E55RVswfYFbOvqSwuKM

点击中间区域
呼出菜单
上一章
目录
下一章
×