DeepSeek-OCR2革新登场：首推「因果流」视觉编码，性能超越Gemini-3C数码-发现者网

DeepSeek团队近日宣布推出全新升级的DeepSeek-OCR2模型，该模型通过引入创新的DeepEncoder V2视觉编码器架构，实现了视觉处理范式的重大突破。与传统模型机械式的图像扫描方式不同，新架构模拟人类视觉认知的因果逻辑流，能够根据内容语义动态调整信息处理顺序。

核心技术创新在于视觉编码器的重构。研究团队采用轻量化Qwen2-0.5B语言模型替代传统CLIP编码器，构建了包含视觉分词器和因果查询机制的双模块架构。视觉分词器沿用SAM-base架构配合卷积层，将图像转换为视觉标记；而独特的因果流查询机制通过可学习的查询标记，配合双向与因果混合的注意力掩码设计，实现了视觉信息的语义重排。

实验数据显示，新模型在保持极高压缩率的同时显著提升处理精度。在OmniDocBench v1.5基准测试中，使用256-1120个视觉标记的DeepSeek-OCR2取得91.09%的综合得分，较前代提升3.73%。特别值得注意的是，阅读顺序编辑距离指标从0.085优化至0.057，证明模型在复杂版面处理中展现出更强的逻辑性。

与闭源强模型Gemini-3 Pro的对比测试中，DeepSeek-OCR2在约1120个视觉标记的条件下，文档解析编辑距离达到0.100，优于对手的0.115。生产环境测试显示，该模型使在线用户日志图像的OCR结果重复率从6.25%降至4.17%，PDF数据处理重复率从3.69%降至2.88%，显著提升了数据清洗效率。

研究团队强调，这项突破验证了"语言模型作为视觉编码器"的技术路径可行性。通过配备不同模态的查询嵌入，同一编码器架构未来有望同时处理文本、图像、音频等多模态数据，为构建原生多模态系统奠定基础。目前模型代码、论文及预训练权重已在GitHub和HuggingFace平台开源发布。

英伟达20亿美元注资CoreWeave 携手加速AI工厂建设共推全球AI应用普及

这项投资体现了英伟达对CoreWeave 的业务、团队以及作为基于 NVIDIA 基础设施构建的云平台的增长战略的信心。利用 NVIDIA领先的加速计算平台技术，构建由 CoreWeave开发和运营…

2026-01-27

2026年远程办公成主流，域智盾7大功能助力企业高效安全上网管理

真正高效的上网管理，必须依赖一套专业、智能、可落地的终端管控系统。可设置上班时间不可访问娱乐网站，中午开放一小时；可按部门限网（如设计部允许用素材站，行政部不行）。 7. 时间画像：用数据看效率，而非猜疑…

2026-01-27

HX-A型水质采样器：远程操控与实时监控引领水质采样智能化新潮流

HX-A型便携式水质自动采样器所具备的远程操作与实时监控能力，正是这一智能化趋势的集中体现，它正在重新定义现场采样的工作模式。HX-A采样器当前实现的远程操作与实时监控，正是迈向这一未来图景的坚实一步，它标志…

2026-01-27

网络配线架：综合布线“中枢”，智能化高密度引领未来网络管理

在企业办公中，配线架能管理工位网线与机房设备的连接，支持日常办公网络需求；在数据中心，配线架连接服务器、存储设备与核心交换机，实现高密度、高可靠性的布线。智能配线架配备电子标签、端口状态指示灯等，能实时显示端…

2026-01-27

太平财险注册资本增至76.7亿，尹兆君卸任李可东接棒董事长

2026-01-27

AI浪潮下仕佳光子业绩飘红 2025年净利大增第四季度却未达预期

2026-01-27

涨停股透视：电子机械领涨，湖南黄金等4股封单资金超4亿

2026-01-27

64岁“车灯女王”周晓萍控股42% 星宇股份冲刺“A+H”双资本平台

2026-01-27