一个帮你搞懂任何陌生领域的提示词,用国内外不同大模型测试效果

一个帮你搞懂任何陌生领域的提示词,用国内外不同大模型测试效果
这段提示词的作者是「数字生命卡兹克」,来源链接:
分享一个我用了2年的深度研究Prompt,半小时帮你搞懂任何陌生领域。
prompt具体内容可以参看上面的链接。至于效果,用作者的原话说就是“不敢说这玩意出来的研究有多透彻,但至少能让我快速建立起一个相当完整的认知框架,然后在这个框架上再去深挖。
我自己拿“提示词工程”和“朱元璋”测试了DeepSeek、豆包、KIMI、GLM、Gemini、Claude、ChatGPT,就从生成时长和字数两个维度,拿“朱元璋”来举例吧(均为约数):
模型
DeepSeek
豆包
KIMI
GLM
Gemini
Claude
ChatGPT
时长
10分钟
15分钟
5分钟
5分钟
30秒
10分钟
50秒
字数
1.7万字
2万字
1.1万字
0.85万字
0.32万字
1.4万字
0.23万字
我看作者用的是Claude,实测Claude效果确实不错,纵向用了九章,横向也分了同时代和历史同类两个层次,特色是对分析任务进行了心理层次的挖掘,横向对比不流于表面,结论也是和豆包、DeepSeek一样功过都会讲到,别看字数不是最多的,但整体质量我感觉是最好的。
但考虑到国内网络环境,使用Claude比较困难,所以还是推荐使用国产模型。
时长和字数一定程度上其实可以反映出报告的质量,当然字数我都是复制到word中统计的,大差不差,但这个时间统计非常不精确,我完全没有计时,都只能算个大概,无论如何,那两个不到1分钟就完成的且字数4千都不到的,自然没眼看,也可能是我打开方式不对吧?
还有一个有意思的地方是,结尾部分DeepSeek有一句“本回答由 AI 生成,内容仅供参考,请仔细甄别。”KIMI注明了3个来源,而Claude的备注最为详细,其余的AI都没有备注。
具体生成的内容都太长,就不展示了,贴个豆包的目录大家感受一下:
豆包我还没有用专家模式,选的思考模式:
内容很细,结构清晰,涵盖的史料其实比Claude更加全面,只是侧重点有所不同,早年分析豆包更细、晚年分析Claude更细,豆包有个问题是出现了一些我不喜欢的"赛道"、"竞品"、"生态位"这类词,影响观看,还有就是结尾给人感觉头重脚轻。如果是专家模式,可能产出更为惊人。
DeepSeek内容也很全,纵向对比为了覆盖面牺牲了许多方便读者阅读的描述,横向对比比其它的AI内容都要多一些,而且有很多制度分析,就是结构稍微有点散,断句过多,还有些车轱辘话,值得一提的是引用了很多大师、学者的评价,方便读者延伸。
KIMI我用的也是思考模式,而没有选择Agent模式,内容中规中矩,基本是符合要求的,就是虽说备注说来源于《明史》之类的但其实大量来源于今日头条和百度百科的内容,对于评价历史人物来说,稍显不严谨,可以想象Agent模式效果应该会更好。
上面这段是前两天写的,就在准备发布的时候,KIMI更新了2.6,于是又测了一次,字数少了2千字左右,但内容感觉比之前更好了,节点包括文风都变了,尤其是纵向分析增加了很多内容,不变的还是备注来源于史料,实则来自网络媒体,这次增加了很多来源于搜狐和微信公众号的,还有必应,看来更新挺大的。
GLM我测试了思考模式和研究模式,效果都不尽理想,思考模式没有符合字数要求,其中一些表述我也看不习惯,什么“朱元璋变成了真正的CEO兼COO兼CFO”、“开创皇帝赛道的多样性”、“官僚不是合伙人而是耗材”之类的;研究模式更奇特,给出的报告结构说合计约2.2万字,右侧还生成了可以下载的任务文件,但实际上只有5千3百多字,而且基本都是标题,我就问它,然后给出了如下答复,又重新生成了一份,怎么说呢?结构、字数倒是没问题,但是质量还是不怎么样。
还有两个国外的AI完全不符合要求,就不评价了,心疼我一直认为chat回复最满意的Gemini,忍不住贴一下它奇怪的表述,真不知道这是几个意思,无力吐槽:
ChatGPT没有思考模式(Plus需要订阅,我用的普通模式),给我2千多字也就算了,Gemini我可是开了思考模式的,但不知道为什么产出居然只有3千多字:
最后给一个小技巧:在小龙虾中复制该提示词,要求其根据该提示词制作一个skill,然后调用该skill进行分析,可以根据分析结果继续优化skill,这样你将会得到一个更好用的,可以帮助你搞懂任何陌生领域的并且可以持续进化的skill。
当然,作者也已经将其制作成了skill供下载,你也可以在使用该skill过程中继续进行优化升级:
https://github.com/KKKKhazix/khazix-skills/tree/main/hv-analysis