AI 大模型仍在持续更新。
(1)阿里巴巴:4 月 29 日,阿里巴巴发布 Qwen3 系列模型,包含两款 30B、235B 的MoE 模型,以及 0.6B、1.7B、4B、8B、14B、32B 等六款密集模型。旗舰型号Qwen3-235B-A22B 参数量仅为 DeepSeek-R1 的三分之一,做到了在成本大幅下降,性能全面超越 R1、OpenAI-o1 等全球顶尖模型,成为全球最强开源模型。据悉,仅需 4张 H20 即可部署 Qwen3 满血版,显存占用仅为性能相近模型的三分之一。Qwen3 是国内首个“混合推理模型”,即将“快思考”与“慢思考”集成进同一个模型,对简单需求可低算力“秒回”答案,对复杂问题可多步骤“深度思考”,这样能大大节省算力消耗。
(1)阿里巴巴:4 月 29 日,阿里巴巴发布 Qwen3 系列模型,包含两款 30B、235B 的MoE 模型,以及 0.6B、1.7B、4B、8B、14B、32B 等六款密集模型。旗舰型号Qwen3-235B-A22B 参数量仅为 DeepSeek-R1 的三分之一,做到了在成本大幅下降,性能全面超越 R1、OpenAI-o1 等全球顶尖模型,成为全球最强开源模型。据悉,仅需 4张 H20 即可部署 Qwen3 满血版,显存占用仅为性能相近模型的三分之一。Qwen3 是国内首个“混合推理模型”,即将“快思考”与“慢思考”集成进同一个模型,对简单需求可低算力“秒回”答案,对复杂问题可多步骤“深度思考”,这样能大大节省算力消耗。