配这种CPU, GPU单卡就能跑满血DeepSeek-R1,…
苹果发现模型蒸馏Scaling Law!教师模型并非越强越好…
DeepSeek缝合Claude,比单用R1/o1效果都好!…
学而思今天正式发布接入DeepSeek的全新“随时问”APP…
Claude 4被曝发布在即!被DeepSeek逼得都把大招…
DeepSeek R1遇难题142次”I give up”,…
百度决定背叛闭源大模型,李彦宏重新拥抱开源 十三 2025-…
达摩院开源VideoLLaMA3:仅7B大小,视频理解拿下S…
昆仑万维发布Matrix-Zero世界模型,开启空间智能新时…