ℹ️ 产品概述
深度求索(DeepSeek),成立于2023年,专注于研究世界领先的通用人工智能底层模型与技术,挑战人工智能前沿性难题。基于自研训练框架、自建智算集群和万卡算力等资源,深度求索团队仅用半年时间便已发布并开源多个百亿级参数大模型,如DeepSeek-LLM通用大语言模型、DeepSeek-Coder代码大模型,并在2024年1月率先开源国内首个MoE大模型(DeepSeek-MoE),各大模型在公开评测榜单及真实样本外的泛化效果均有超越同级别模型的出色表现。和 DeepSeek AI 对话,轻松接入 API。
📋 主要功能
- 开源百亿参数大模型,提供高性能AI推理能力
- 专精代码生成与优化,DeepSeek-Coder提升开发效率
- 国内首个开源MoE架构模型,实现更高效参数利用
- 基于自研训练框架,确保模型稳定性和泛化能力
- 支持API轻松接入,快速集成至各类应用场景
- 在多项公开评测中超越同级别模型表现
- 提供通用语言理解与生成,覆盖多领域任务
- 依托万卡算力集群,持续迭代前沿AI技术
📰 相关新闻
DeepSeekMath - 卓然666 - 博客园
DeepSeekMath 一、基础信息 1. 标题 英文:DeepSeekMath: Pushing the Limits of Mathematical Reasoning in Open Language Models 中文:DeepSeekMath:突破开放语言模型数学推理的极限 2. 作者
实用指南:DeepSeek R1 简易指南:架构、本地部署和硬件要求 - yangykaifa - 博客园
DeepSeek 团队近期发布的DeepSeek-R1技术论文展示了其在增强大语言模型推理能力方面的创新实践。该研究突破性地采用强化学习(Reinforcement Learning)作为核心训练范式,在不依赖大规模监督微调的前提下显著提升了模型的复杂问题求解能力。技术架构深度解析模型体系:Deep
消息称DeepSeek正招兵买马,布局AI搜索与智能体领域- DoNews
DoNews1月29日消息,据彭博社报道,DeepSeek 正通过招聘多语言 AI 搜索引擎开发人才、加大对智能体技术的投入,进一步拓展其 AI 产品矩阵,与 OpenAI 及 Alphabet 展开更激烈的竞争。 据深度求索本月发布的多则招聘信息显示,DeepSeek 正在招募专业人才,以打造一个能够支持多种语言的人工智能搜索引擎。该搜索功能将具备多模态特性,能够同时处理文本、图像及音频等多种形...
DeepSeek发布新模型,基于千问的新架构_腾讯新闻
36氪获悉,1月27日,DeepSeek团队发布《DeepSeek-OCR 2: Visual Causal Flow》论文,并开源DeepSeek-OCR 2模型,采用创新的DeepEncoder V2方法,让AI能够根据图像的含义动态重排图像的各个部分,更接近人类的视觉编码逻辑。在具体实现上,DeepSeek 团队在论文中称采用了Qwen2-0.5B来实例化这一架构。
DeepSeek发布新模型_腾讯新闻
DeepSeek团队发布《DeepSeek-OCR 2: Visual Causal Flow》论文,并开源DeepSeek-OCR 2模型,采用创新的DeepEncoder V2方法,让AI能够根据图像的含义动态重排图像的各个部分,更接近人类的视觉编码逻辑。