手机浏览器扫描二维码访问
第二,kv缓存系统化管理。
之前的缓存就是简单存数据,v4把它变成有生命周期、可复用的存储系统,尤其是磁盘级kv缓存,能复用重复的前缀内容。
就像我们学习,学过的知识不用每次重新学,直接调取记忆,避免重复算力浪费,对应心理学里的“记忆复用规律”
,减少无效重复劳动,效率自然提升。
第三,推理预算分三档:non-thk快速模式、thkhigh分析模式、thkax深度推理。
不同任务用不同算力,简单文案用快速模式,复杂推理用深度模式,不盲目浪费算力。
这就像生活中做事,小事不纠结,大事深思考,对应易经“简易、变易、不易”
——核心需求不变,应对方式随事而变,用最简单的方式解决问题。
小主,这个章节后面还有哦,,后面更精彩!
许黑:我听懂了,就是把每一分算力都用在刀刃上,不做无用功。
那文章里还提到它的训练方式变了,从混合强化学习改成先养领域专家再融合,这又是为什么?和我们人的学习有相似之处吗?和蔼教授:这个问题非常关键,刚好能结合心理学学习理论和整体与部分的哲学原理来讲。
首先,v4的后训练逻辑是:先单独训练数学、代码、ant、指令遵循四个领域专家模型,把每个领域的能力打磨到极致,再通过策略蒸馏,把这些专家能力融合成一个统一模型。
这和人的成长学习逻辑完全一致:心理学上,专项学习比泛化学习效率更高,就像我们上学,先学语文、数学、物理等单科知识,把每科学透,再融会贯通,而不是一开始就笼统地学所有内容,最后样样通、样样松。
从哲学上看,这是“先深耕局部,再整合整体”
,整体的强大,源于每个局部的极致专业。
之前的混合强化学习,是泛化式训练,各个领域能力同步推进,很难做到专精;而先专家后融合,让每个细分领域都有极致突破,再整合到一个模型里,最终整体能力实现质的飞跃。
v4-pro在、c-eval等专业评测中分数大幅提升,就是这种训练方式的成果,也印证了“术业有专攻,融合则更强”
的道理。
而且它用了uon优化器、fp4fp8混合精度,还有hc残差连接,保障深层模型训练的稳定性,避免模型层数变多、参数变大后出现性能崩溃。
这就像盖高楼,先把每一层的地基打牢,再往上搭建,既追求高度,又保证稳固,依旧是易经阴阳平衡、稳中求进的思想。
蒋尘:教授,v4还分了pro和fsh两个版本,参数和能力都不一样,为什么要做双产品线?直接做一个最强的版本不好吗?和蔼教授:这恰恰是deepseek最务实的地方,贴合哲学“因材施教、因地制宜”
和市场需求的底层逻辑,也符合心理学上的“需求分层理论”
。
首先,没有任何一款模型能适配所有场景,不同用户、不同任务,需求天差地别。
就像我们不能要求所有人都穿同一件衣服,大模型应用也需要分层:-deepseekv4pro:16t总参、49b激活,主打专业、复杂、高价值任务,比如长文档分析、代码ant、高难度推理、专业白领工作,适合对能力要求极高的场景,对应“高精尖”
需求;-deepseekv4fsh:284b总参、13b激活,主打低成本、低延迟、高频次任务,比如日常问答、简单文案、批量处理,适合轻量化、普惠化场景。
从易经角度看,这是“一阴一阳”
,pro是阳,主打能力突破;fsh是阴,主打成本普惠,二者互补,覆盖全场景需求。
如果只做最强的pro版本,成本过高,普通用户和中小企业用不起,技术就失去了普及价值;只做fsh,又满足不了专业需求,双产品线就是兼顾高端与普惠,让技术真正落地,而不是停留在实验室里。
而且在实际应用中,企业可以做任务路由,简单任务用fsh,复杂任务用pro,合理分配资源,这也是系统最优解,避免资源浪费,回归技术服务于需求的本质。
周游:我注意到,v4在中文白领任务上对标cude,长文生成更有优势,但复杂指令跟随还是稍弱,还有deant也存在小错误,这是不是说明它还不够完美?该怎么看待这种技术不足?和蔼教授:这个问题,我们要用辩证哲学“金无足赤,人无完人”
和《易经》“阴阳相生、瑕不掩瑜”
沈渺穿成被恶婆婆休弃的下堂妻。原主爹娘早逝,只留下一间烧毁倒闭的面馆。还有两个险些饿死的幼弟幼妹。人人皆道她可怜命苦。前夫一家更是想看她笑话。而上辈子祖孙三代都是厨子的沈渺这不巧了么,专业对口了。摆小摊儿修缮院子经营面馆,从此汴京不仅有樊楼,还有声名鹊起的沈记大酒家!...
韩北卿以为自己只是穿越到古代普通农家而已,不过就是种田经商奔小康辅导秀才爹仕途开花节节高。找个好拿捏的纨绔子弟过上奢靡腐败的好生活。却没想到随便捡了翡翠戒指竟然带了空间系统,游戏大白痴选了个傻叉任务之系统随机掉落恩师。So韩北卿从此每日都要仰天咆哮怎么我的恩师们掉落的如此草率?为什么神医只教推拿正骨,我又不是盲人为什么从天而降一本治水宝典,我又不做大禹这位宫斗冠军满级大佬为什么要对我笑?我不想参与世家门阀的混战!救命啊,顾阎王!!!...
新海空,一名普通社畜,在又一次熬夜之后不幸猝死,却被系统送到了名侦探柯南的世界,成为酒厂的一瓶真酒,玩起了一个名叫欺诈游戏的游戏。在游戏中他需要扮演一个白切黑的真酒,用各种英雄行为误导读者,把自己包装成红方。经过充分的思考,他决定以警察的身份卧底到警视厅,但是万万没想到,他升职的速度真的太快了。他演的太过卖力屡破大案,加之过于有欺骗性的外表,他成为媒体的宠儿,东京警视厅的代表,日本警界冉冉升起的新星。曾有媒体预言,他很有可能成为日本警察界升职最快的人。所以,如果黑衣组织再不破灭的话!高次元系统在某异世界发布了一款游戏,名为欺诈游戏。你是一瓶真酒,是彻彻底底的黑方,你必须按照你的人设行事,完成系统发布的主线任务。但同时,你又要让读者认为你是红方,是正义的化身。在主线剧情开启后,你将实时收到读者的反馈,可以借此调整你的游戏方式。在游戏接近大结局时,系统会自动统计异世界读者的心理,认可你为红方的人超过百分之八十,即为游戏胜利反之,游戏失败。你必须坏事做尽却又不染尘埃,城府深沉却又天真正义,你要让所有被你伤害的人反过来以为你是救赎,是黑暗中永不熄灭的光亮。1私设巨多,还请包容2主角是真真真酒(暴躁老哥脸),演技帝(有提升的过程)。3全文时间线闭环,所有违和都是伏笔。剧情中涉及大量时间线问题,采取的是同一时空内部穿梭的模式,可以参考电影前目的地。4无cp是因为蠢作者可能不太会写感情线,亲情友情向团宠。5亲妈必HE6不建议跳章阅读,因为作者是埋伏笔狂魔,大部分案件相互关联。补充综漫,有文豪竞技类少年漫内容,但篇幅较少。文野内容27章有MAFIA,32章有一个设定,仅此而已。有异能的人不会干涉主线。只有脑子好使的太宰出没,哒宰反派预警。不会有什么柯学人物被文野碾压之类奇怪的设想,看了之后再评价世界观。...
上一世,天地元气枯竭,绝代剑道天骄逆天而行,剑道通天,却仍身陨于帝道大劫!今朝一梦三千载,重回武道盛世。此世吾必横推三千世界,以手中之剑,覆天裂地败尽苍生!横贯古今!成就剑道不朽!...
太子有点冷是唐朝的板栗精心创作的灵异,旧时光文学实时更新太子有点冷最新章节并且提供无弹窗阅读,书友所发表的太子有点冷评论,并不代表旧时光文学赞同或者支持太子有点冷读者的观点。...