据HuggingFace官网最新数据,截至2月22日,Boss直聘南北阁实验室开源的Nanbeige4.1-3B模型已跻身全球模型总趋势榜前三、文本模型趋势榜榜首。该模型仅30亿参数,却在通用问答、复杂推理、代码生成、深度搜索等核心任务中展现出卓越的跨任务泛化能力与综合性能。其核心突破在于将强推理能力、人类偏好对齐能力与深度搜索Agent能力系统性整合于3B参数中,通过精细训练配方设计,在多项评测中超越参数量大10倍的Qwen3-32B等模型。技术亮点包括:通用能力方面通过SFT数据构建与RL训练全链路优化,实现指令配方升级、上下文长度扩展至256K及回复质量提升;偏好对齐能力通过Point-wise RL与Pair-wise RL两阶段训练显著抑制错误回复;深度搜索能力通过构建大规模复杂数据集与轮次级判断机制,实现长上下文多跳推理;代码能力通过多阶段训练策略确保生成代码的正确性与低时间复杂度。