路透社爆料DeepSeek的R2大模型可能要提前出来了,之前是计划5月份推出,但是这个计划有可能会提前,可能是研发进度和效果比较理想。 路透社还爆料了一些内幕细节,还挺有意思,这里转述一下。 1、梁文峰非常慷慨,给员工开的工资要比同行多出一倍,比如数据科学家,行业平均水平是70多万年薪,但是梁文峰给出了150万的年薪。 2、前员工说幻方量化不缺算力,因为在deepseek出来之前,梁文峰就决定拿出公司利润的70%做大模型。在英伟达禁售A100前就花了十几亿购买算力芯片。 3、现在全球的AI公司都还在消化R1大模型带来的冲击,所以R2的时间表被全球的公司都盯着。R2的上市会再次给全球AI相关公司带来冲击。 4、梁文峰在北京有个办公室,距离北大和清华都非常近,步行就可以走到。他经常跟应届生一切讨论问题,一起工作。
如果说deepseek是给英伟达的当头一棒,那清华团队的ktransformer
【6评论】【51点赞】
用户38xxx54
华夏国民们是否熟悉文明间的“转码式科技”概念?在历史长河中,东西方文明在科技进步的征途中,都曾将外来科技文献转化为契合自身文化逻辑的理解模式。设想一下,华夏国度在科技研发的征程上,竭力将国外的科技典籍转化为国人能够轻松领悟和阅读的形态,进而将这些知识融入华夏文明的科技脉络之中。如此一来,国人无需跨越英语学习的障碍或西方逻辑思维的鸿沟,便能投身科技研发,为国家的繁荣贡献力量。 然而,一个令人费解的现象是,当今华夏国为何要将古代与现代的全中文科技文献转化为西方世界易于理解的模式,并将其融入西方科技的框架和拉丁字母体系之内?反观西方,他们并未广泛地将拉丁字母书写的科技文献转化为华夏国人能够轻松阅读的形式,以融入我们的科技体系。面对西方文明世界尚未完全拥抱我们的现状,我们是否应当继续秉持包容开放、海纳百川的姿态,批判性地吸收其精华,摒弃其糟粕? 通过这种“转码”过程,我们是否能够在坚守自身文化特质的同时,更有效地推动科技的跃进与文明的交融?更是我们在全球化时代需要审慎抉择的关键路径。