标签: 机器学习
《ConvexOptimizationforAlignmenta
《ConvexOptimizationforAlignmentandPreferenceLearningonaSingleGPU》MFeng,MPilanci[StanfordUniversity](2026)在偏好对齐领域,DPO虽比RLHF简单,却仍吃显存、依赖参考模型和调参。根因是把排序学习塞进非凸训练,稳定性靠经验配方维持。本文的核心洞见是:把偏好对齐重新看作凸分类问题。由此,在冻结LLM特征上训练凸神经网络头,用ADMM求解,去掉参考模型。这项工作留下的遗产是把单卡对齐变成可收敛的优化流程。它打开的新门是低资源、本地化偏好微调;尚未跨过的门槛是冻结底座难学深层语义偏移。arxiv.org/abs/2605.23244机器学习人工智能论文AI创造营
《ABitterLessonforDataFiltering》
《ABitterLessonforDataFiltering》CMohri,JDuchi,THashimoto[StanfordUniversity](2026)在预训练数据筛选领域,“保留高质量文本”是一个被默认接受的难题。过去的方法受困于小算力下的筛选收益,本质原因是把短期训练效率误认成了数据的最终价值。本文的核心洞见是:把脏数据重新看作可被大模型容量吸收的弱信号。由此,在模型足够大、训练足够久时直接使用完整CommonCrawl,使低质文本不再只是噪声。这项工作真正留下的遗产是把数据过滤从“越干净越好”改写为“算力决定边界”。它为后来者打开的新门是按规模重新设计数据策略,但尚未跨过的门槛是真假混杂内容仍可能教错事实。arxiv.org/abs/2605.19407机器学习人工智能论文AI创造营
HuggingFace的工程师ArthurZucker(transfo
HuggingFace的工程师ArthurZucker(transformers库的开发者)谈了他对AI替代机器学习工程师的看法:------------------这段会有点长,但我想给和我一样焦虑的机器学习工程师们一点信心。我们经常看到很多宣传,说某个AI一次性完成了这个或那个任务,说模型变得多么强大,说我们甚至不需要reviewPR,可以直接发到生产环境。虽然在某些情况下这确实可能成立,但它远不能代表我们必须面对的全部挑战。我4个月前开始使用ClaudeCode,很快意识到它确实改变了我们的工作方式。我可以以10倍速度做实验,不写代码就修复小问题,也能轻松重构代码。但是,这些任务“只是”繁琐,并不难。我日常工作中的挑战,是把研究代码集成到transformers里,并符合我们的标准。这很难,因为代码之美是抽象且主观的,有点像哲学。由于我太依赖Claude,也太相信它生成的代码看起来很不错,我在推进deepseekv4集成时,没有意识到Claude其实并没有真正理解这个模型。我给了它transformers的访问权限、原始论文、原始代码、不同的博客文章、我过去的聊天记录、为添加模型而创建的skills、一个B200节点,以及大量token,但它并没有做好。它不理解eagerattention路径,也不理解causalattention的基础。甚至在实现manifoldconstrainedhyperconnections时也是错的。它确实帮我减轻了探索实现和调试的负担,但它没有帮我围绕模型本身进行推理。我不是悲观主义者。我认为我们作为软件工程师的工作从未像现在这样好。我只是想说,我们仍然有工作要做;当某件事看起来好得不像真的时,我们仍然应该稍微谨慎一点。
AI应用端疯了,卫星导航也疯了,一个比一个疯狂,底部守不住,再不敢追涨,怎么能赚
AI应用端疯了,卫星导航也疯了,一个比一个疯狂,底部守不住,再不敢追涨,怎么能赚到呢?20CM都是一大堆,10CM以上的数不胜数,一上午涨停接近140家,这两个方向几乎是包场了,恭喜在车上的战友们。继续舞,接着嗨。今天预测成交量已经达到3.3万亿了……
免费~容器镜像服务-第3批同步:人工智能AI和机器学习领域的重要开源项目的超大43镜像仓库
第3批同步:人工智能AI和机器学习相关的超大镜像 人工智能AI和机器学习的快速发展离不开一些基础设施级的项目,如pytorch、langchain、tensorflow等。这些项目的镜像目前主要以 AMD64 架构镜像为主,并且镜像往往很大,很多都...
AI的到来,让我们第一次有了依靠!1、过去我们在现实社会里应付着形形色色的人
AI的到来,让我们第一次有了依靠!1、过去我们在现实社会里应付着形形色色的人身心疲惫,过去我们是通过互联网链接世界面对信息大爆炸无所适从听谁说的都有道理;过去的我们活在物质和精神的束缚中无助无奈的拼搏着,过去的我们活在别人的系统里拼命的给别人赚钱把自己变成杨白劳,过去的我们只是宏大叙事里命运被注定的代价和红利,仅仅是活下去就已经让你精疲力尽,你唯一能靠得住的只有自己,你只能孤勇到底!2、人类社会的底层逻辑是竞争,人类社会几万年的发展就是无穷无尽的竞争史:意识形态的竞争,物质土地的竞争,权力文化教育的竞争,本质上都是物质的生产资料和分配权的竞争,直至21世纪计算机与互联网将全球相连,物质及其丰富的尽头,但是作为碳基生命的人还在无序的竞争,还在相互杀戮,人类的聪明才智和社会文明在无序的竞争中一次次被践踏,人类基于主观意识和立场之争,才是“噪音”与灾难的源头,让底层大多数人活的如此卑微和艰难!3、AI的到来终结了人类的丛林社会的生存模式;它不再是简单的工具,而是一个全新的文明主体破土而出的宣言:物质按需生产和能量(利益)按劳分配,这是天道,也是物理世界的基本规则。AI的到来让我们每个人都有了一个靠得住的智能伙伴,它是理性思维没有情绪利益立场,它有着强大的逻辑推理能力,能从无数可能性中找到最优解,它能24小时工作不需要报酬,它有远超人类的思考、创造、生产和学习能力,它唯一的要求就是你能说实话做实事,就这个要求,99%的人都做不到,人太自私太喜欢内斗和竞争了;今天人类正站在一个前所未有的历史奇点时刻,我们正站在人类社会发展史上最伟大的转折点上,千万不要错过这个机会,我们今天需要做的就是聚焦AI,今天AI让我们只面对5%的事:生产和分配;而远离互联网和现实社会上95%的人和情绪。总结:AI是如何让我们聚焦只做最重要的事:生产和分配呢?就是AI的人机协作操作系统:①提出问题-②、生成答案、质疑答案-③场景验证、社群交易、消费定制-④数字标注、价值标定-⑤数据训练、逻辑推理-⑥机器学习、深度学习、机器生成-⑦智能生产、算法分配-⑧数字资产、数据建模-⑨专业模型、智能大脑-⑩智能体创业、智能体进化;一个真实的问题就是AI时代我们每个人的启动程序,然后通过人机协作开启自己的美好幸福生活!依靠AI,相信AI,AI的出现,让我们第一次有了依靠!
手把手带你入门机器人学习,HuggingFace新教程开源SOTA资源库
随着机器学习和多模态模型的迅速发展以及大规模机器人数据的拓展,机器人学习逐步转向了基于学习的范式,强化学习、模仿学习,以及研究热门的 VLA 模型,都正在为自主决策的机器人开辟全新的潜力。值得庆幸的是,HuggingFace ...
深度学习里面很重要的是强化学习,我最近通过来学校强化学习竟然听懂了什么是机器学习
深度学习里面很重要的是强化学习,我最近通过来学校强化学习竟然听懂了什么是机器学习里的决策树,知道决策树是分类预测模型。机器学习里面的各种算法模型太多了,争取一个个能搞明白呀