腾讯混元推出四款轻量级开源大语言模型(0.5B、1.8B、4B、7B),专为低功

爱生活爱珂珂 2025-08-05 07:41:26

腾讯混元推出四款轻量级开源大语言模型(0.5B、1.8B、4B、7B),专为低功耗场景设计,覆盖消费级GPU、智能车载、智能家居、手机及PC,支持经济高效的垂直领域微调,助力开发者与企业多样化应用创新。

核心优势:

• 全系模型均开源于GitHub及Hugging Face,支持直接下载使用。

• 支持“快思考”与“慢思考”两种推理模式,灵活应对简洁输出与深度推理需求。

• 多项公开测试集成绩领先,涵盖语言理解、数学、逻辑推理等领域。

• 优化Agent能力,实现任务规划、工具调用、复杂决策;原生支持256K超长上下文窗口。

• 四款模型均单卡即可部署,支持SGLang、vLLM、TensorRT-LLM等主流推理框架,轻松集成于PC、手机、平板等设备。

立即体验👉 hunyuan.tencent.com/modelSquare/home/list

GitHub下载:

Hunyuan-0.5B:github.com/Tencent-Hunyuan/Hunyuan-0.5B

Hunyuan-1.8B:github.com/Tencent-Hunyuan/Hunyuan-1.8B

Hunyuan-4B:github.com/Tencent-Hunyuan/Hunyuan-4B

Hunyuan-7B:github.com/Tencent-Hunyuan/Hunyuan-7B

Hugging Face下载:

Hunyuan-0.5B:huggingface.co/tencent/Hunyuan-0.5B-Instruct

Hunyuan-1.8B:huggingface.co/tencent/Hunyuan-1.8B-Instruct

Hunyuan-4B:huggingface.co/tencent/Hunyuan-4B-Instruct

Hunyuan-7B:huggingface.co/tencent/Hunyuan-7B-Instruct

腾讯混元系列通过先进的量化技术(FP8、INT4)和高效的Grouped Query Attention(GQA),实现资源友好且性能卓越的推理体验。灵活的训练与部署方案,支持快速启动与多节点扩展,满足边缘计算到高并发生产的多样需求。

腾讯混元 开源LLM 低功耗AI 多模态推理 大语言模型 边缘计算

0 阅读:0
爱生活爱珂珂

爱生活爱珂珂

感谢大家的关注