DeepSeek在这个春节期间确实扔下了一个“技术王炸”

1773 阅读 0 评论 0 点赞

，DeepSeek官方披露，其网页端和App正在测试新的长文本模型结构。主要更新亮点如下：

维度	更新内容	具体说明
上下文能力	从128K扩展到1M Token	官方在相关社群中确认，新版本已支持1M上下文，处理能力相比前代V3系列提升了近7倍。这意味着它可以一次性处理如《三体》三部曲体量的超长文本，或解析中型规模的完整代码库。
知识时效性	更新至2025年5月	在不联网状态下，可以准确回答2025年4月之前的新闻事件，知识储备显著更新。
技术架构	融合V3与R1优势	新模型融合了V3的高效推理架构和R1的强化学习能力，推理能力、长文本写作和细节理解方面都有明显提升。
官方声明	不是V2/V3，也不是R1	对于底层模型，官方回应称：“我是DeepSeek最新版模型，站在V3这个巨人肩膀上，又往前走了几步的版本。”

对于这次更新，市场和行业观察家们给出了更多维度的解读：

观点	核心解读	依据
"V4 Lite"版本	此次更新的可能是参数较小的V4 Lite版，参数量约2000亿，旨在为后续的满血版探路。
V4发布预期	多方预测DeepSeek V4（或为满血版）将于2月中旬正式面世。
核心技术预告	V4或将采用mHC和Engram等新技术，旨在用算法创新对冲硬件差距，实现性能提升和成本降低。
交互风格突变	新版本对话风格更热情，但也引发部分用户吐槽"变油了"，失去了以往冷静、专业的风格。部分用户发现模型不再延续个性化昵称，统一用"用户"称呼。

所以，你问DeepSeek春节有没有“扔王炸”？答案是肯定的。虽然它没有直接发布万众期待的V4，但这次上下文能力的巨大飞跃和底层模型的融合创新，无疑是一次扎实而 impactful 的更新。它不仅提升了实用能力，也为后续DeepSeek V4满血版的登场做好了铺垫和技术验证。