-
-
0一、模型介绍 DeepSeek(深度求索)是百度提出的超大规模知识增强大语言模型,旨在通过知识融合与持续学习实现更精准、可控的通用人工智能。其核心架构基于Transformer演进,参数规模达千亿级,支持多模态输入(文本、图像、语音等),并通过大规模知识图谱注入实现推理增强。 核心特性: 知识驱动:内置动态更新的结构化知识库,覆盖百科、专业领域及实时热点。 上下文长程依赖:支持4096 Token以上长文本处理,适合复杂任务拆解。 多模态统
-
01. 行业概述1.1 定义与分类 大模型:基于深度学习技术,参数规模超千亿的预训练模型(如NLP、多模态、科学计算模型等)。 行业大模型:针对垂直领域(金融、医疗、制造等)优化的大模型,具备领域知识理解与任务适配能力。 1.2 发展背景 政策支持:《新一代人工智能发展规划》《“十四五”数字经济发展规划》等推动AI与产业融合。 技术突破:算力提升(国产AI芯片)、算法创新(Transformer架构)、数据积累(行业数据库开放)。 市场需求:企
-
0
-
0亲爱的各位吧友:欢迎来到大模型学习交流群