【[21星]TTT-TK:为测试时训练(Test-Time Training)提供高效加速的CUDA核工具包。亮点:1. 针对非因果TTT-MLP内核优化,支持64维头;2. 使用混合精度计算,显著提升性能;3. 支持输入流水线和分片,有效隐藏全局读取延迟】
'TTT is a repository for test-time training kernels.'
GitHub: github.com/test-time-training/ttt-tk
测试时训练 CUDA内核 混合精度计算 AI创造营