DeepSeek大模型出来后,中国和国际主流舆论都非常开心。但是殖人一片阴阳怪气

钟校说趣事 2025-02-08 21:59:43

DeepSeek大模型出来后,中国和国际主流舆论都非常开心。但是殖人一片阴阳怪气,乃至如丧考妣。

殖人把美国斯坦福团队的李飞飞等人捧上了天,说他们只用50美元就训练出了和DeepSeek性能差不多的大模型,可真相竟然是抄袭了中国公司阿里巴巴的模型。之前还一直吹嘘这个人的的能力多强,现在看来,原来只会抄袭!

记者调查后发现,s1模型的训练并非从零开始,其基座模型为阿里通义千问(Qwen)模型。s1用50美元训练出新的具有推理能力的模型,实际上只是用从谷歌模型中提炼出来的1000个样本,然后对千问模型进行微调而成。

DeepSeek算法的突破比美国这些大模型堆积算力来的都实际,因为运营成本低廉。而且DeepSeek是通用模型算法的突破,不管是美国哪个厂家都无法匹敌,不然会掀起这么大的波澜。

0 阅读:97
钟校说趣事

钟校说趣事

感谢大家的关注