新旗舰级AI模型即将登场！消息称DeepSeekV4预计在春节前后发布[图]

2026-02-10 09:11:10

字体大小：【小 | 中 | 大】

根据“The Information”的报道，两位直接知情人士透露，深度求索（DeepSeek）预计会在未来几周内，也就是2月中旬农历新年前后，推出代号为V4的新一代旗舰级人工智能模型，这款模型的核心优势在于强劲的代码生成能力。

据了解，DeepSeekV4在超长代码提示词的处理和解析方面取得了关键进展，能够支持百万级tokens的上下文窗口。

能够一次性处理并掌握整个中型项目的代码库、技术文档以及需求说明，准确把握跨文件之间的依赖关系，有效解决复杂软件项目开发过程中上下文不连贯的问题，这对于开发大型系统、重构遗留代码以及理解复杂技术文档而言，具备革命性的价值。

V4还攻克了AI训练领域的一个普遍难题——数据模式理解能力在整个训练过程中始终保持稳定不衰减，这和传统模型训练次数越多性能反而越差的状况形成了强烈反差。

这项突破让模型得以更高效地从海量数据里学习，跳出单纯记忆数据的限制，进而具备更深入的抽象理解能力。

DeepSeek员工依据公司内部基准进行的初步测试表明，该模型在代码生成领域的表现比Anthropic、Claude、生成式预训练变换器系列（OpenAI GPT）等当下主流模型更为出色。

行业内也有消息透露，V4或许会运用全新的mHC架构，该架构在并行计算效率与国产芯片适配能力方面均有提升，不仅有望降低部署成本，还能提高推理速度，从而为大规模商业化应用筑牢基础。

值得一提的是，本月4日，DeepSeek在arXiv平台更新了R1论文，页面篇幅从原先的22页增加至86页，补充了完整训练流程的拆解内容以及20多项评测基准的详细数据，这一举措被看作是为V4的正式发布奠定了技术层面的基础。

最新文章热门文章