DeepSeek是一家中国的人工智能初创企业,成立于2023年,专注于研究

冰彦有趣的说生活 2025-02-01 02:00:03

DeepSeek 是一家中国的人工智能初创企业,成立于 2023 年,专注于研究世界领先的通用人工智能底层模型与技术,挑战人工智能前沿性难题。 该团队基于自研训练框架、自建智算集群和万卡算力等资源,仅用半年时间便已发布并开源多个百亿级参数大模型,如 DeepSeek-LLM 通用大语言模型、DeepSeek-Coder 代码大模型,并在 2024 年 1 月率先开源国内首个 MoE 大模型(DeepSeek-MoE)。其各大模型在公开评测榜单及真实样本外的泛化效果均有超越同级别模型的出色表现。DeepSeek-V3 在推理速度上相较历史模型有了大幅提升,在目前大模型主流榜单中,DeepSeek-V3 在开源模型中位列榜首,与世界上最先进的闭源模型不分伯仲。 不过,近期 DeepSeek 引起了广泛关注和讨论。路透社 1 月 30 日报道,一直频繁操弄反华议题、渲染“中国威胁”的美国众议院“美中战略竞争特别委员会”(即“中国委员会”)29 日致信特朗普政府,呼吁再收紧英伟达 AI 芯片出口,以阻止中国所谓的“AI 野心”,理由是 DeepSeek 最新发布的大模型“广泛使用”了当前不在美国出口管制范围内的英伟达对华“特供版”AI 芯片 H20。 此外,春节期间 OpenAI 突然指控 DeepSeek 违规使用 GPT-4 技术开发开源模型 R1,涉嫌违反服务条款。但这些指控是否属实,还需进一步的调查和证实。 人工智能技术的发展迅速,相关公司和产品也处于不断变化和发展之中。如果你想了解更多关于 DeepSeek 的最新信息,建议关注相关的科技媒体和报道。

0 阅读:29